2016-03-05 DIGA番組名一括変更支援ツールの文字コードをUTF-8に統一 DIGA番組名一括変更 スクレイピング 概要 DIGAに対する文字コード問題の解決方法が分かったので、全ファイルの文字コードをUTF-8に統一。 詳細(HISTORY.txt)から抜粋 DIGAにデータを送信するformで「accept-charset="shift_jis"」を指定することで解決。このformを含むファイル自体は、utf-8でも問題ない。 主な変更ファイルは下記。 - diga-rename-leftF.html 補足 HTML5、CSS3の全体を把握するために、図書館で本(HTML5&CSS3辞典 第2版(株式会社アンク) | 翔泳社の本)を借りてきて読んでいたら、「accept-charset」のことが書かれていたので、さっそく試したところうまくいった。これで、すべてのファイルをUTF-8に統一できたので、atomでファイルを開いた時も、文字化けせずに済む(これまでは、ファイルを開いた後で、文字コードを再認識させていた)。また、GitHubで差分を見る時も、文字化けしなくなった。これまで、いくつかの本を少しかじりながらコードを書いていたが、やはり、一度は体系的に勉強することが重要と感じました。