読者です 読者をやめる 読者になる 読者になる

Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

DIGA番組名一括変更支援ツールの文字コードをUTF-8に統一

DIGA番組名一括変更 スクレイピング

概要

DIGAに対する文字コード問題の解決方法が分かったので、全ファイルの文字コードUTF-8に統一。

詳細(HISTORY.txt)から抜粋

DIGAにデータを送信するformで「accept-charset="shift_jis"」を指定することで解決。このformを含むファイル自体は、utf-8でも問題ない。
主な変更ファイルは下記。
 - diga-rename-leftF.html

補足

HTML5、CSS3の全体を把握するために、図書館で本(HTML5&CSS3辞典 第2版(株式会社アンク) | 翔泳社の本)を借りてきて読んでいたら、「accept-charset」のことが書かれていたので、さっそく試したところうまくいった。

これで、すべてのファイルをUTF-8に統一できたので、atomでファイルを開いた時も、文字化けせずに済む(これまでは、ファイルを開いた後で、文字コードを再認識させていた)。また、GitHubで差分を見る時も、文字化けしなくなった。

これまで、いくつかの本を少しかじりながらコードを書いていたが、やはり、一度は体系的に勉強することが重要と感じました。