Encode::CN - 中国大陆地区字符编码
use Encode qw/encode decode/;
$euc_cn = encode("euc-cn", $utf8); # loads Encode::CN implicitly
$utf8 = decode("euc-cn", $euc_cn); # ditto
此模块实现中国大陆地区字符集编码。支持的编码如下。
Canonical Alias Description
--------------------------------------------------------------------
euc-cn /\beuc.*cn$/i EUC (Extended Unix Character)
/\bcn.*euc$/i
/\bGB[-_ ]?2312(?:\D.*$|$)/i (see below)
gb2312-raw The raw (low-bit) GB2312 character map
gb12345-raw Traditional chinese counterpart to
GB2312 (raw)
iso-ir-165 GB2312 + GB6345 + GB8565 + additions
MacChineseSimp GB2312 + Apple Additions
cp936 Code Page 936, also known as GBK
(Extended GuoBiao)
hz 7-bit escaped GB2312 encoding
--------------------------------------------------------------------
要详细了解如何在模块中使用此模块,请参见 Encode.
由于大小限制,GB 18030
(GBK
的扩展)在 CPAN 上以 Encode::HanExtra 的名称单独分发。该模块还包含额外的台湾地区编码。
当您在邮件和网页上看到 charset=gb2312
时,它们实际上是指 euc-cn
编码。为了解决这个问题,gb2312
被别名为 euc-cn
。当您真正想要使用 gb2312
时,请使用 gb2312-raw
。
ASCII 区域 (0x00-0x7f) 对所有编码都保留,即使这与 Unicode 联盟的映射冲突。