Nokogiri における文字コードの指定 (charset)

参考:

Nokogiri で文字化けを防ぐ – Qiita

Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita

Nokogiri が文字化けするのの対策 | hitode909 の日記

Nokogiri の parse 時の文字コード | Just Do Live

Nokogiri で EUC-JP のサイトをパースするときにエラーになっちゃう対策 | rails がんばる子

Nokogiri::HTML#to_html のエンコーディング処理で失敗する – スタック・オーバーフロー

iso-8859-1 (通称 Latin-1)

文字コードが取得できない場合に、デフォルトで指定される文字コード

参考:

文字コード「iso-8859-1」を UTF8 にうまく変換できないときの対応方法 | 演劇とかの感想文ブログ

CP932

Windows で用いられる、日本語 Shift_JIS の亜種

参考:

Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita

nokogiri と文字 | teratail

文字コードについて | teratail

CP51932

Windows で用いられる、日本語 EUC の亜種

参考:

Nokogiri で文字化けを防ぐ – Qiita

タグ:

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です