中国語が文字化けする
参考:
This zip file can not been unzip (GB2312 encoding) · Issue #315 · ZipArchive/ZipArchive – GitHub
This zip file cannot be unzip (GB2312 encoding) · Issue #154 · zlib-ng/minizip-ng – GitHub
ZipExtractor
公式サイト:
ZipExtractor – ファイル名が文字化けしないZIPファイル解凍ソフト
unzip-mbcs
マルチバイト文字に対応した解凍プログラム
文字コード
- 日本語: sjis (shift_jis), cp932, euc-jp
- 中国語: gbk, gb18030, gb2312, cp936, hkscs, big5, cp950
- 韓国語: cp949, euc-kr
インストール
pip
コマンドで unzipmbcs
パッケージをインストールする。
$ python -m pip install unzipmbcs
中国語でエンコードされた ZIP ファイルを解凍する。
$ python -m unzipmbcs -e gb2312 l archive.zip
リポジトリ:
入手:
minizip-ng
リポジトリ:
ZipArchive
リポジトリ: