文字化け – Site-Builder.wiki

2022-12-20
2024-03-12

文字化けパターン

主な文字化けパターンは次の通りである。

糸偏の漢字が多い → UTF-8 を Shift-JIS で表示した。
半角カタカナが多い → EUC-JP を Shift-JIS で表示した。
ハテナ文字 � になる → UTF-8 以外を UTF-8 で表示した。(※それ以外のケースもある。)
発音記号付きのアルファベットになる → UTF-8 を Latin-1 (ISO 8859-1) で表示した。

参考：

文字化け解説／文字化けパターンサンプル | instant tools

文字化け判別表 | まじかんと

海外の技術者が日本語の文字化けを本気で解説／日本人顔負けの日本通っぷりが披露される | GIGAZINE

Mojibake UTF-8 to ISO-8859 (PNG) – Wikipedia

文字化けを解読／変換する

こちらのページを参照

ツール：

もじばけらった – 文字化け解読ツール

文字化けテスター | instant tools

コピーライト記号

現象：

コピーライト記号「©」 (C丸) が、半角カタカナの「ｩ」 (小さなウ) になってしまう。

原因：

Latin-1 (ISO 8859-1) で保存されたテキストを Shift JIS (CP932) として認識している。実際の文字コードは 0xA9 である。

対処法：

解釈する文字コードとして Latin-1 (ISO 8859-1) を指定する。

参考：

英語テキストファイルに「ゥ」が含まれる – 人力検索はてな

記事をシェアする：

コメントを残すコメントをキャンセル

Protected by reCAPTCHA

Privacy - Terms