内容

名称

Encode::KR - 韩语编码

概要

use Encode qw/encode decode/; 
$euc_kr = encode("euc-kr", $utf8);   # loads Encode::KR implicitly
$utf8   = decode("euc-kr", $euc_kr); # ditto

描述

此模块实现韩语字符集编码。支持的编码如下。

Canonical   Alias		Description
--------------------------------------------------------------------
euc-kr      /\beuc.*kr$/i	EUC (Extended Unix Character)
        /\bkr.*euc$/i
ksc5601-raw			Korean standard code set (as is)
cp949	      /(?:x-)?uhc$/i
            /(?:x-)?windows-949$/i
            /\bks_c_5601-1987$/i
                              Code Page 949 (EUC-KR + 8,822 
                              (additional Hangul syllables)
MacKorean			EUC-KR + Apple Vendor Mappings
johab       JOHAB             A supplementary encoding defined in 
                                           Annex 3 of KS X 1001:1998
iso-2022-kr                   iso-2022-kr                  [RFC1557]
--------------------------------------------------------------------

要详细了解如何在模块中使用此模块,请参阅 Encode

错误

当您在邮件和网页上看到 charset=ks_c_5601-1987 时,它们实际上是指 "cp949" 编码。为了解决这个问题,设置了以下别名;

qr/(?:x-)?uhc$/i         => '"cp949"'
qr/(?:x-)?windows-949$/i => '"cp949"'
qr/ks_c_5601-1987$/i     => '"cp949"'

ASCII 区域 (0x00-0x7f) 在所有编码中都保留,即使这与 Unicode 联盟的映射冲突。

参见

Encode