内容

名称

Encode::CN - 中国大陆地区字符编码

概要

use Encode qw/encode decode/; 
$euc_cn = encode("euc-cn", $utf8);   # loads Encode::CN implicitly
$utf8   = decode("euc-cn", $euc_cn); # ditto

描述

此模块实现中国大陆地区字符集编码。支持的编码如下。

Canonical   Alias		Description
--------------------------------------------------------------------
euc-cn      /\beuc.*cn$/i	EUC (Extended Unix Character)
        /\bcn.*euc$/i
            /\bGB[-_ ]?2312(?:\D.*$|$)/i (see below)
gb2312-raw			The raw (low-bit) GB2312 character map
gb12345-raw			Traditional chinese counterpart to 
              GB2312 (raw)
iso-ir-165			GB2312 + GB6345 + GB8565 + additions
MacChineseSimp                GB2312 + Apple Additions
cp936				Code Page 936, also known as GBK 
              (Extended GuoBiao)
hz				7-bit escaped GB2312 encoding
--------------------------------------------------------------------

要详细了解如何在模块中使用此模块,请参见 Encode.

备注

由于大小限制,GB 18030GBK 的扩展)在 CPAN 上以 Encode::HanExtra 的名称单独分发。该模块还包含额外的台湾地区编码。

错误

当您在邮件和网页上看到 charset=gb2312 时,它们实际上是指 euc-cn 编码。为了解决这个问题,gb2312 被别名为 euc-cn。当您真正想要使用 gb2312 时,请使用 gb2312-raw

ASCII 区域 (0x00-0x7f) 对所有编码都保留,即使这与 Unicode 联盟的映射冲突。

参见

Encode