encguess - 猜测文件字符编码
$Id: encguess,v 0.3 2020/12/02 01:28:17 dankogai Exp $
encguess [switches] filename...
猜测名为 test.txt
的文件的编码,仅使用默认可疑类型。
encguess test.txt
猜测名为 test.txt
的文件的编码类型,使用可疑类型 euc-jp,shiftjis,7bit-jis
。
encguess -s euc-jp,shiftjis,7bit-jis test.txt
encguess -s euc-jp:shiftjis:7bit-jis test.txt
猜测多个文件的编码类型,不显示未识别文件的测试结果。
encguess -us euc-jp,shiftjis,7bit-jis test*.txt
编码识别通过一次检查一种编码类型来完成,直到除了正确的类型之外的所有类型都被排除。要尝试的编码类型集由 -s 参数定义,默认为 ascii、utf8 和带有 BOM 的 UTF-16/32。可以通过 -s 参数传递一种或多种编码类型来覆盖此设置。如果你需要传入多个可疑编码类型,请使用带引号的字符串,每个值之间用空格分隔。
版权所有 2015 Michael LaGrasta 和 Dan Kogai。
本程序是免费软件;您可以在 Artistic License (2.0) 的条款下重新发布和/或修改它。您可以在以下位置获取完整许可证副本