文字化け対策

参考:

Nokogiri で文字化けを防ぐ – Qiita

Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定/CP932 指定推奨 – Qiita

Nokogiri のパースでエンコーディングを nil に設定したとき – Qiita

Nokogiri が文字化けするのの対策 | hitode909 の日記

Nokogiri の parse 時の文字コード | Just Do Live

Nokogiri で EUC-JP のサイトをパースするときにエラーになっちゃう対策 | rails がんばる子

Nokogiri::HTML#to_html のエンコーディング処理で失敗する – スタック・オーバーフロー

Nokogiri 利用時の charset=nil について – teratail

OpenURI

参考:

open-uri での open は、URL をバイナリモードで開く – Qiita

iso-8859-1 (通称 Latin-1)

文字コードが取得できない場合に、デフォルトで指定される文字コード

参考:

文字コード「iso-8859-1」を UTF8 にうまく変換できないときの対応方法 | 演劇とかの感想文ブログ

CP932

Windows で用いられる、日本語 Shift_JIS の亜種

参考:

Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita

nokogiri と文字 – teratail

文字コードについて – teratail

CP51932

Windows で用いられる、日本語 EUC の亜種

参考:

Nokogiri で文字化けを防ぐ – Qiita

記事をシェアする:
タグ:

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Protected by reCAPTCHA