内容

名称
概要
描述
注意
错误
参见

#名称

Encode::TW - 台湾地区中文编码

#概要

use Encode qw/encode decode/; 
$big5 = encode("big5", $utf8); # loads Encode::TW implicitly
$utf8 = decode("big5", $big5); # ditto

#描述

该模块实现了台湾和香港使用的传统中文字符集编码。支持的编码如下。

Canonical   Alias		Description
--------------------------------------------------------------------
big5-eten   /\bbig-?5$/i	Big5 encoding (with ETen extensions)
        /\bbig5-?et(en)?$/i
        /\btca-?big5$/i
big5-hkscs  /\bbig5-?hk(scs)?$/i
            /\bhk(scs)?-?big5$/i
                              Big5 + Cantonese characters in Hong Kong
MacChineseTrad		Big5 + Apple Vendor Mappings
cp950		                Code Page 950 
                              = Big5 + Microsoft vendor mappings
--------------------------------------------------------------------

要详细了解如何在代码中使用该模块，请参见 Encode。

#注意

出于大小方面的考虑，EUC-TW (扩展 Unix 字符集)、CCCII (中文信息交换码)、BIG5PLUS (CMEX 的 Big5+) 和 BIG5EXT (CMEX 的 Big5e) 在 CPAN 上以 Encode::HanExtra 的名称单独发布。该模块还包含额外的中国地区编码。

#错误

由于原始的 big5 编码 (1984) 在任何地方都不受支持（glibc 和基于 DOS 的系统使用 big5 代表 big5-eten；微软使用 big5 代表 cp950），因此我们有意将 big5 设为 big5-eten 的别名，后者是原始 big5 的事实上的超集。

CNS11643 编码文件不完整。对于常见的 CNS11643 操作，请在 Encode::HanExtra 中使用 EUC-TW，它包含平面 1-7。

ASCII 区域 (0x00-0x7f) 在所有编码中都保留，即使这与 Unicode 联盟的映射冲突。

#参见

编码