Nokogiri における文字コードの指定 (charset)
参考:
Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita
Nokogiri が文字化けするのの対策 | hitode909 の日記
Nokogiri の parse 時の文字コード | Just Do Live
Nokogiri で EUC-JP のサイトをパースするときにエラーになっちゃう対策 | rails がんばる子
Nokogiri::HTML#to_html のエンコーディング処理で失敗する – スタック・オーバーフロー
iso-8859-1 (通称 Latin-1)
文字コードが取得できない場合に、デフォルトで指定される文字コード
参考:
文字コード「iso-8859-1」を UTF8 にうまく変換できないときの対応方法 | 演劇とかの感想文ブログ
CP932
Windows で用いられる、日本語 Shift_JIS の亜種
参考:
Shift_JIS サイトを Nokogiri でパースするときにはエンコード指定 (CP932 指定推奨) – Qiita
CP51932
Windows で用いられる、日本語 EUC の亜種
参考: