中国語が文字化けする

参考:

This zip file can not been unzip (GB2312 encoding) · Issue #315 · ZipArchive/ZipArchive – GitHub

This zip file cannot be unzip (GB2312 encoding) · Issue #154 · zlib-ng/minizip-ng – GitHub

ZipExtractor

公式サイト:

ZipExtractor – ファイル名が文字化けしないZIPファイル解凍ソフト

unzip-mbcs

マルチバイト文字に対応した解凍プログラム

文字コード
  • 日本語 sjis (shift_jis), cp932, euc-jp
  • 中国語 gbk, gb18030, gb2312, cp936, hkscs, big5, cp950
  • 韓国語 cp949, euc-kr
インストール

pip コマンドで unzipmbcs パッケージをインストールする。

$ python -m pip install unzipmbcs

中国語でエンコードされた ZIP ファイルを解凍する。

$ python -m unzipmbcs -e gb2312 l archive.zip

リポジトリ:

sanori/unzip-mbcs: UnZip for non-UTF8 encoding such as cp949, sjis, gbk, euc-kr, euc-jp, and gb2312 – GitHub

入手:

unzipmbcs | PyPI

minizip-ng

リポジトリ:

zlib-ng/minizip-ng: Fork of the popular zip manipulation library found in the zlib distribution – GitHub

ZipArchive

リポジトリ:

ZipArchive/ZipArchive: ZipArchive is a simple utility class for zipping and unzipping files on iOS, macOS and tvOS – GitHub

記事をシェアする:

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Protected by reCAPTCHA