文字化け対策
参考:
Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定/CP932 指定推奨 – Qiita
Nokogiri のパースでエンコーディングを nil に設定したとき – Qiita
Nokogiri が文字化けするのの対策 | hitode909 の日記
Nokogiri の parse 時の文字コード | Just Do Live
Nokogiri で EUC-JP のサイトをパースするときにエラーになっちゃう対策 | rails がんばる子
Nokogiri::HTML#to_html のエンコーディング処理で失敗する – スタック・オーバーフロー
Nokogiri 利用時の charset=nil について – teratail
OpenURI
参考:
open-uri での open は、URL をバイナリモードで開く – Qiita
iso-8859-1 (通称 Latin-1)
文字コードが取得できない場合に、デフォルトで指定される文字コード
参考:
文字コード「iso-8859-1」を UTF8 にうまく変換できないときの対応方法 | 演劇とかの感想文ブログ
CP932
Windows で用いられる、日本語 Shift_JIS の亜種
参考:
Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita
CP51932
Windows で用いられる、日本語 EUC の亜種
参考: