<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>枫芸志 &#187; 字符编码</title>
	<atom:link href="http://witmax.cn/tag/encoding/feed" rel="self" type="application/rss+xml" />
	<link>http://witmax.cn</link>
	<description>记录成长路途上的点滴总结</description>
	<lastBuildDate>Sat, 12 May 2012 04:45:25 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>【NetBeans】设置打开文件时的默认文件编码</title>
		<link>http://witmax.cn/netbeans-default-encoding.html</link>
		<comments>http://witmax.cn/netbeans-default-encoding.html#comments</comments>
		<pubDate>Sat, 08 Oct 2011 08:58:54 +0000</pubDate>
		<dc:creator>晴枫</dc:creator>
				<category><![CDATA[软件技巧]]></category>
		<category><![CDATA[字符编码]]></category>

		<guid isPermaLink="false">http://witmax.cn/?p=1786</guid>
		<description><![CDATA[用netbeans打开utf-8编码的文件，其中的中文全部显示成了乱码，英文显示正常，说明是文件打开时的编码不对。 设置步骤如下： 找到你的Netbeans安装目录下的etc文件夹,如C:\Program Files\NetBeans 7.0.1\etc 用记事本打开netbeans.conf 找到netbeans_default_options这一句(没带#号的,带#号的是注释) 在最后面加上一个空格,再加入-J-Dfile.encoding=UTF-8 如: netbeans_default_options=”-J-client -J-Xss2m -J-Xms32m -J-XX:PermSize=32m -J-Dapple.laf.useScreenMenuBar=true -J-Dapple.awt.graphics.UseQuartz=true -J-Dsun.java2d.noddraw=true -J-Dfile.encoding=UTF-8&#8243; 参考：http://hi.baidu.com/hnjiakai/blog/item/9e2834fac007169f58ee9063.html<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></description>
			<content:encoded><![CDATA[<p>用netbeans打开utf-8编码的文件，其中的中文全部显示成了乱码，英文显示正常，说明是文件打开时的编码不对。</p>
<p>设置步骤如下：</p>
<ol>
<li>找到你的Netbeans安装目录下的etc文件夹,如C:\Program Files\NetBeans 7.0.1\etc</li>
<li>用记事本打开netbeans.conf</li>
<li>找到netbeans_default_options这一句(没带#号的,带#号的是注释)</li>
<li>在最后面加上一个空格,再加入-J-Dfile.encoding=UTF-8<br />
如: netbeans_default_options=”-J-client -J-Xss2m -J-Xms32m -J-XX:PermSize=32m -J-Dapple.laf.useScreenMenuBar=true -J-Dapple.awt.graphics.UseQuartz=true -J-Dsun.java2d.noddraw=true -J-Dfile.encoding=UTF-8&#8243;</li>
</ol>
<p>参考：<a href="http://hi.baidu.com/hnjiakai/blog/item/9e2834fac007169f58ee9063.html">http://hi.baidu.com/hnjiakai/blog/item/9e2834fac007169f58ee9063.html</a></p>
<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></content:encoded>
			<wfw:commentRss>http://witmax.cn/netbeans-default-encoding.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</title>
		<link>http://witmax.cn/character-encoding-notes.html</link>
		<comments>http://witmax.cn/character-encoding-notes.html#comments</comments>
		<pubDate>Wed, 24 Nov 2010 08:46:28 +0000</pubDate>
		<dc:creator>晴枫</dc:creator>
				<category><![CDATA[程序开发]]></category>
		<category><![CDATA[字符编码]]></category>

		<guid isPermaLink="false">http://witmax.cn/?p=1213</guid>
		<description><![CDATA[字符编码笔记：ASCII，Unicode和UTF-8 作者： 阮一峰  版权声明：自由转载-非商用-非衍生-保持署名 &#124; Creative Commons BY-NC-ND 3.0  最后修改时间：2007年10月29日 09:46  今天中午，我突然想搞清楚Unicode和UTF-8之间的关系，于是就开始在网上查资料。  结果，这个问题比我想象的复杂，从午饭后一直看到晚上9点，才算初步搞清楚。  下面就是我的笔记，主要用来整理自己的思路。但是，我尽量试图写得通俗易懂，希望能对其他朋友有用。毕竟，字符编码是计算机技术的基石，想要熟练使用计算机，就必须懂得一点字符编码的知识。  1. ASCII码  我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从0000000到11111111。  上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，一直沿用至今。  ASCII码一共规定了128个字符的编码，比如空格“SPACE”是32（二进制00100000），大写的字母A是65（二进制01000001）。这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的1位统一规定为0。  2、非ASCII编码  英语用128个符号编码就够了，但是用来表示其他语言，128个符号是不够的。比如，在法语中，字母上方有注音符号，它就无法用ASCII码表示。于是，一些欧洲国家就决定，利用字节中闲置的最高位编入新的符号。比如，法语中的é的编码为130（二进制10000010）。这样一来，这些欧洲国家使用的编码体系，可以表示最多256个符号。  但是，这里又出现了新的问题。不同的国家有不同的字母，因此，哪怕它们都使用256个符号的编码方式，代表的字母却不一样。比如，130在法语编码中代表了é，在希伯来语编码中却代表了字母Gimel (ג)，在俄语编码中又会代表另一个符号。但是不管怎样，所有这些编码方式中，0—127表示的符号是一样的，不一样的只是128—255的这一段。  至于亚洲国家的文字，使用的符号就更多了，汉字就多达10万左右。一个字节只能表示256种符号，肯定是不够的，就必须使用多个字节表达一个符号。比如，简体中文常见的编码方式是GB2312，使用两个字节表示一个汉字，所以理论上最多可以表示256&#215;256=65536个符号。  中文编码的问题需要专文讨论，这篇笔记不涉及。这里只指出，虽然都是用多个字节表示一个符号，但是GB类的汉字编码与后文的Unicode和UTF-8是毫无关系的。  3.Unicode  正如上一节所说，世界上存在着多种编码方式，同一个二进制数字可以被解释成不同的符号。因此，要想打开一个文本文件，就必须知道它的编码方式，否则用错误的编码方式解读，就会出现乱码。为什么电子邮件常常出现乱码？就是因为发信人和收信人使用的编码方式不一样。  可以想象，如果有一种编码，将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码，那么乱码问题就会消失。这就是Unicode，就像它的名字都表示的，这是一种所有符号的编码。  Unicode当然是一个很大的集合，现在的规模可以容纳100多万个符号。每个符号的编码都不一样，比如，U+0639表示阿拉伯字母Ain，U+0041表示英语的大写字母A，U+4E25表示汉字“严”。具体的符号对应表，可以查询unicode.org，或者专门的汉字对应表。  4. Unicode的问题  需要注意的是，Unicode只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。  比如，汉字“严”的unicode是十六进制数4E25，转换成二进制数足足有15位（100111000100101），也就是说这个符号的表示至少需要2个字节。表示其他更大的符号，可能需要3个字节或者4个字节，甚至更多。  这里就有两个严重的问题，第一个问题是，如何才能区别unicode和ascii？计算机怎么知道三个字节表示一个符号，而不是分别表示三个符号呢？第二个问题是，我们已经知道，英文字母只用一个字节表示就够了，如果unicode统一规定，每个符号用三个或四个字节表示，那么每个英文字母前都必然有二到三个字节是0，这对于存储来说是极大的浪费，文本文件的大小会因此大出二三倍，这是无法接受的。  它们造成的结果是：1）出现了unicode的多种存储方式，也就是说有许多种不同的二进制格式，可以用来表示unicode。2）unicode在很长一段时间内无法推广，直到互联网的出现。  5.UTF-8  互联网的普及，强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode的实现方式。其他实现方式还包括UTF-16和UTF-32，不过在互联网上基本不用。重复一遍，这里的关系是，UTF-8是Unicode的实现方式之一。  UTF-8最大的一个特点，就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。  UTF-8的编码规则很简单，只有二条：  1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。  2）对于n字节的符号（n&#62;1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。  下表总结了编码规则，字母x表示可用编码的位。  Unicode符号范围 &#124; UTF-8编码方式 (十六进制) &#124; （二进制） &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;+&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 0000 0000-0000 007F &#124; 0xxxxxxx 0000 [...]<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></description>
			<content:encoded><![CDATA[<h5>字符编码笔记：ASCII，Unicode和UTF-8</h5>
<p>作者： 阮一峰 </p>
<p>版权声明：自由转载-非商用-非衍生-保持署名 | <a href="http://creativecommons.org/licenses/by-nc-nd/3.0/deed.zh">Creative Commons BY-NC-ND 3.0</a> </p>
<p>最后修改时间：2007年10月29日 09:46 </p>
<p>今天中午，我突然想搞清楚Unicode和UTF-8之间的关系，于是就开始在网上查资料。 </p>
<p>结果，这个问题比我想象的复杂，从午饭后一直看到晚上9点，才算初步搞清楚。 </p>
<p>下面就是我的笔记，主要用来整理自己的思路。但是，我尽量试图写得通俗易懂，希望能对其他朋友有用。毕竟，字符编码是计算机技术的基石，想要熟练使用计算机，就必须懂得一点字符编码的知识。 </p>
<p><span id="more-1213"></span></p>
<p><strong>1. ASCII码</strong> </p>
<p>我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从0000000到11111111。 </p>
<p>上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，一直沿用至今。 </p>
<p>ASCII码一共规定了128个字符的编码，比如空格“SPACE”是32（二进制00100000），大写的字母A是65（二进制01000001）。这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的1位统一规定为0。 </p>
<p><strong>2、非ASCII编码</strong> </p>
<p>英语用128个符号编码就够了，但是用来表示其他语言，128个符号是不够的。比如，在法语中，字母上方有注音符号，它就无法用ASCII码表示。于是，一些欧洲国家就决定，利用字节中闲置的最高位编入新的符号。比如，法语中的é的编码为130（二进制10000010）。这样一来，这些欧洲国家使用的编码体系，可以表示最多256个符号。 </p>
<p>但是，这里又出现了新的问题。不同的国家有不同的字母，因此，哪怕它们都使用256个符号的编码方式，代表的字母却不一样。比如，130在法语编码中代表了é，在希伯来语编码中却代表了字母Gimel (ג)，在俄语编码中又会代表另一个符号。但是不管怎样，所有这些编码方式中，0—127表示的符号是一样的，不一样的只是128—255的这一段。 </p>
<p>至于亚洲国家的文字，使用的符号就更多了，汉字就多达10万左右。一个字节只能表示256种符号，肯定是不够的，就必须使用多个字节表达一个符号。比如，简体中文常见的编码方式是GB2312，使用两个字节表示一个汉字，所以理论上最多可以表示256&#215;256=65536个符号。 </p>
<p>中文编码的问题需要专文讨论，这篇笔记不涉及。这里只指出，虽然都是用多个字节表示一个符号，但是GB类的汉字编码与后文的Unicode和UTF-8是毫无关系的。 </p>
<p><strong>3.Unicode</strong> </p>
<p>正如上一节所说，世界上存在着多种编码方式，同一个二进制数字可以被解释成不同的符号。因此，要想打开一个文本文件，就必须知道它的编码方式，否则用错误的编码方式解读，就会出现乱码。为什么电子邮件常常出现乱码？就是因为发信人和收信人使用的编码方式不一样。 </p>
<p>可以想象，如果有一种编码，将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码，那么乱码问题就会消失。这就是Unicode，就像它的名字都表示的，这是一种所有符号的编码。 </p>
<p>Unicode当然是一个很大的集合，现在的规模可以容纳100多万个符号。每个符号的编码都不一样，比如，U+0639表示阿拉伯字母Ain，U+0041表示英语的大写字母A，U+4E25表示汉字“严”。具体的符号对应表，可以查询<a href="http://www.unicode.org/" target="_blank">unicode.org</a>，或者专门的<a href="http://www.chi2ko.com/tool/CJK.htm" target="_blank">汉字对应表</a>。 </p>
<p><strong>4. Unicode的问题</strong> </p>
<p>需要注意的是，Unicode只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。 </p>
<p>比如，汉字“严”的unicode是十六进制数4E25，转换成二进制数足足有15位（100111000100101），也就是说这个符号的表示至少需要2个字节。表示其他更大的符号，可能需要3个字节或者4个字节，甚至更多。 </p>
<p>这里就有两个严重的问题，第一个问题是，如何才能区别unicode和ascii？计算机怎么知道三个字节表示一个符号，而不是分别表示三个符号呢？第二个问题是，我们已经知道，英文字母只用一个字节表示就够了，如果unicode统一规定，每个符号用三个或四个字节表示，那么每个英文字母前都必然有二到三个字节是0，这对于存储来说是极大的浪费，文本文件的大小会因此大出二三倍，这是无法接受的。 </p>
<p>它们造成的结果是：1）出现了unicode的多种存储方式，也就是说有许多种不同的二进制格式，可以用来表示unicode。2）unicode在很长一段时间内无法推广，直到互联网的出现。 </p>
<p><strong>5.UTF-8</strong> </p>
<p>互联网的普及，强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode的实现方式。其他实现方式还包括UTF-16和UTF-32，不过在互联网上基本不用。<strong>重复一遍，这里的关系是，UTF-8是Unicode的实现方式之一。</strong> </p>
<p>UTF-8最大的一个特点，就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。 </p>
<p>UTF-8的编码规则很简单，只有二条： </p>
<p>1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。 </p>
<p>2）对于n字节的符号（n&gt;1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。 </p>
<p>下表总结了编码规则，字母x表示可用编码的位。 </p>
<blockquote><p>Unicode符号范围 | UTF-8编码方式<br />
(十六进制) | （二进制）<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;+&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
0000 0000-0000 007F | 0xxxxxxx<br />
0000 0080-0000 07FF | 110xxxxx 10xxxxxx<br />
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx<br />
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx </p></blockquote>
<p>下面，还是以汉字“严”为例，演示如何实现UTF-8编码。 </p>
<p>已知“严”的unicode是4E25（100111000100101），根据上表，可以发现4E25处在第三行的范围内（0000 0800-0000 FFFF），因此“严”的UTF-8编码需要三个字节，即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后，从“严”的最后一个二进制位开始，依次从后向前填入格式中的x，多出的位补0。这样就得到了，“严”的UTF-8编码是“11100100 10111000 10100101”，转换成十六进制就是E4B8A5。 </p>
<p><strong>6. Unicode与UTF-8之间的转换</strong> </p>
<p>通过上一节的例子，可以看到“严”的Unicode码是4E25，UTF-8编码是E4B8A5，两者是不一样的。它们之间的转换可以通过程序实现。 </p>
<p>在Windows平台下，有一个最简单的转化方法，就是使用内置的记事本小程序Notepad.exe。打开文件后，点击“文件”菜单中的“另存为”命令，会跳出一个对话框，在最底部有一个“编码”的下拉条。 </p>
<p><a href="http://www.ruanyifeng.com/blog/2007/10/bg2007102801.jpg" target="_blank" rel="lightbox[1213]" title="字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian"><img src="http://www.ruanyifeng.com/blog/2007/10/bg2007102801-thumb.jpg" alt="bg2007102801.jpg" width="500" height="227" /></a> </p>
<p>里面有四个选项：ANSI，Unicode，Unicode big endian 和 UTF-8。 </p>
<p>1）ANSI是默认的编码方式。对于英文文件是ASCII编码，对于简体中文文件是GB2312编码（只针对Windows简体中文版，如果是繁体中文版会采用Big5码）。 </p>
<p>2）Unicode编码指的是UCS-2编码方式，即直接用两个字节存入字符的Unicode码。这个选项用的little endian格式。 </p>
<p>3）Unicode big endian编码与上一个选项相对应。我在下一节会解释little endian和big endian的涵义。 </p>
<p>4）UTF-8编码，也就是上一节谈到的编码方法。 </p>
<p>选择完”编码方式“后，点击”保存“按钮，文件的编码方式就立刻转换好了。 </p>
<p><strong>7. Little endian和Big endian</strong> </p>
<p>上一节已经提到，Unicode码可以采用UCS-2格式直接存储。以汉字”严“为例，Unicode码是4E25，需要用两个字节存储，一个字节是4E，另一个字节是25。存储的时候，4E在前，25在后，就是Big endian方式；25在前，4E在后，就是Little endian方式。 </p>
<p>这两个古怪的名称来自英国作家斯威夫特的《格列佛游记》。在该书中，小人国里爆发了内战，战争起因是人们争论，吃鸡蛋时究竟是从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开。为了这件事情，前后爆发了六次战争，一个皇帝送了命，另一个皇帝丢了王位。 </p>
<p>因此，第一个字节在前，就是”大头方式“（Big endian），第二个字节在前就是”小头方式“（Little endian）。 </p>
<p>那么很自然的，就会出现一个问题：计算机怎么知道某一个文件到底采用哪一种方式编码？ </p>
<p>Unicode规范中定义，每一个文件的最前面分别加入一个表示编码顺序的字符，这个字符的名字叫做”零宽度非换行空格“（ZERO WIDTH NO-BREAK SPACE），用FEFF表示。这正好是两个字节，而且FF比FE大1。 </p>
<p>如果一个文本文件的头两个字节是FE FF，就表示该文件采用大头方式；如果头两个字节是FF FE，就表示该文件采用小头方式。 </p>
<p><strong>8. 实例</strong> </p>
<p>下面，举一个实例。 </p>
<p>打开”记事本“程序Notepad.exe，新建一个文本文件，内容就是一个”严“字，依次采用ANSI，Unicode，Unicode big endian 和 UTF-8编码方式保存。 </p>
<p>然后，用文本编辑软件UltraEdit中的”十六进制功能“，观察该文件的内部编码方式。 </p>
<p>1）ANSI：文件的编码就是两个字节“D1 CF”，这正是“严”的GB2312编码，这也暗示GB2312是采用大头方式存储的。 </p>
<p>2）Unicode：编码是四个字节“FF FE 25 4E”，其中“FF FE”表明是小头方式存储，真正的编码是4E25。 </p>
<p>3）Unicode big endian：编码是四个字节“FE FF 4E 25”，其中“FE FF”表明是大头方式存储。 </p>
<p>4）UTF-8：编码是六个字节“EF BB BF E4 B8 A5”，前三个字节“EF BB BF”表示这是UTF-8编码，后三个“E4B8A5”就是“严”的具体编码，它的存储顺序与编码顺序是一致的。 </p>
<p><strong>9. 延伸阅读</strong> </p>
<p>* <a href="http://www.joelonsoftware.com/articles/Unicode.html" target="_blank">The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets</a>（关于字符集的最基本知识） </p>
<p>* <a href="http://www.pconline.com.cn/pcedu/empolder/gj/other/0505/616631.html" target="_blank">谈谈Unicode编码</a> </p>
<p>* <a href="http://www.ietf.org/rfc/rfc3629.txt" target="_blank">RFC3629：UTF-8, a transformation format of ISO 10646</a>（如果实现UTF-8的规定） </p>
<p>来源：<a href="http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html">http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html</a> </p>
<hr /> </p>
<h5>字符编码：Unicode/UTF-8/UTF-16/UCS/Endian/BMP/BOM</h5>
<p>Unicode(Universal Multiple-Octet Coded Character Set):目前最流行和最有前途的字符编码规范,因为它解决了不同语言编码的冲突。 </p>
<p><strong>Uicode由来:</strong> </p>
<p>最初的字符编码ascii(8bit,最高位为0)只能表示128个字符,表示英文、数字和一些符号是没问题。但是世界不止一种语言,即使用上了最高为1的扩展ascii码,也只有256个字符。 </p>
<p>对中日韩文、阿拉伯文之类复杂的文字,就无法使用了。 </p>
<p>于是,各国都制定了自己的兼容ascii编码规范,就是各种ANSI码,比如我国的gb2312，用两个扩展ascii字符来表示一个中文。但是这些ansi码无法同时存在,因为它们的定义互相重叠,要自由使用不同语言就必须有一个新编码,为各种文字统一分配编码。 </p>
<p>ISO(国际标准化组织)和Uicode协会(一个软件制造商的协会）分别开始了这个工作。即ISO的ISO 10646项目和Unicode协会的Unicode项目。后来它们开始合并了双方的工作成果，采用相同的字库和字码。但目前两个项目都存在并独立地公布自己的标准。 </p>
<p><strong>UCS(Unicode Character Set):</strong> </p>
<p>这是Uicode在ISO的名称,目有两套编码方法,UCS-2(Unicode)用2个字节表示一个字符,UCS-4(Unicode-32)用4个字节表示一个字符。UCS-4是由USC-2扩展来的,增加了2字节的高位。即使是老UCS-2,它也可以表示2^16=65535个字符,基本上可以容纳所有常用各国字符,所以目前基本都使用UCS-2。 </p>
<p><strong>UTF(UCS Transformation Format):</strong> </p>
<p>Unicode使用2个字节表示一个字符,ascii使用1个字节,所以在很多方面产生了冲突，以前处理ascii的方法都必须重写。而且C语言用\0作为字符串结束标志,但Unicode中很多字符都含\0,C语言的字符串函数也无法正常处理Unicode。为了把unicode投入实用,出现了UTF,最常见的是UTF-8和UTF-16。 </p>
<p>其中UTF-16和Unicode本身的编码是一致的,UTF-32和UCS-4也是相同的。最重要的是UTF-8,可以完全兼容ascii编码 。UTF是一种变长的编码,它的字节数是不固定的,使用第一个字节确定字节数。第一个字节首为0即一个字节,110即2字节,1110即3字节,字符后续字节都用10开始,这样不会混淆且单字节英文字符可仍用ASCII编码。理论上UTF-8最大可以用6字节表示一个字符,但Unicode目前没有用大于0xffff的字符,实际UTF-8最多使用了3个字节。 </p>
<p><strong>unicode转化为UTF-8的方法</strong> </p>
<p>Unicode码范围 UTF-8编码(把Unicode码转为二进制填充x处)<br />
0000-007F 0xxxxxxx<br />
0080-07FF 110xxxxx 10xxxxxx<br />
0800-FFFF 1110xxxx 10xxxxxx 10xxxxxx </p>
<p>汉字的Unicode编码范围是0080-07FF,因此是2字节编码。 </p>
<p><strong>Big Endian(大字节序)和Little Endian(小字节序):</strong> </p>
<p>Unicode存储时有个字节序问题,就是一个多字节数字,是从大到小排列还是反之。这和CPU处理有关,一般x86处理时都是倒置的,即大数在前。就像“莫”字的Unicode码0x83ab,按Big Endian就变成了0xab83。 </p>
<p><strong>BOM(Byte Order Mark):</strong> </p>
<p>因为Unicode存储时字节序的问题,在Unicode文本前插入一个不存在的字符(ZERO WIDTH NO-BREAK SPACE)作为标志来分辨两种字节序。标志0xfeff说明按Big Endian字节序,而0xfffe说明Little-Endian。 </p>
<p>UTF-8不需要BOM来说明字节序，但可以用BOM标志编码方式。遇到带0xefbbbf开头的文本,计算机就可以不需要分辨直接按UTF-8编码处理。 </p>
<p><strong>BMP(Basic Multilingual Plane):</strong> </p>
<p>这是Unicode实际和字符对应的划分方式中的概念。 </p>
<p>按UCS-4为例子 </p>
<p>首字节首位恒为0,剩下7位可以划分2^7=128个group(组)。 </p>
<p>第二个字节,每个group下面可以有2^8=256个plane(平面)。 </p>
<p>第三个字节,可以给每个palne带来256个row(行)。 </p>
<p>第四个字节,这里的8位又可以每row可以划分256个cell(格子)。 </p>
<p>group 0中的plane 0就是BMP,即前两个字节为0&#215;0000的UCS-4码。去掉0&#215;0000的BMP上的UCS-4就变成了UCS-2编码。或者说UCS-2是USC-4的子集,BMP就是UCS-2在USC-4中的位置。我们从这里还可以得到USC-2转为UCS-4的方法,再UCS-2前面插入2个字节0&#215;0000。 </p>
<p>来源：<a href="http://blog.csdn.net/zzcv_/archive/2007/06/03/1636085.aspx">http://blog.csdn.net/zzcv_/archive/2007/06/03/1636085.aspx</a> </p>
<hr />
<h5>谈谈Unicode编码</h5>
<p>这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念，增进知识，类似于打RPG游戏的升级。整理这篇文章的动机是两个问题： </p>
<p>问题一： </p>
<p>使用Windows记事本的“另存为”，可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件，Windows是怎样识别编码方式的呢？ </p>
<p>我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节，分别是FF、FE（Unicode）,FE、FF（Unicode big endian）,EF、BB、BF（UTF-8）。但这些标记是基于什么标准呢？ </p>
<p>问题二： </p>
<p>最近在网上看到一个ConvertUTF.c，实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF-8这些编码方式，我原来就了解。但这个程序让我有些糊涂，想不起来UTF-16和UCS2有什么关系。 </p>
<p>查了查相关资料，总算将这些问题弄清楚了，顺带也了解了一些Unicode的细节。写成一篇文章，送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂，但要求读者知道什么是字节，什么是十六进制。 </p>
<p><strong>0、big endian和little endian</strong> </p>
<p>Big endian和Little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。还是将49写在前面，就是little endian。 </p>
<p>“endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开，由此曾发生过六次叛乱，其中一个皇帝送了命，另一个丢了王位。 </p>
<p>我们一般将endian翻译成“字节序”，将big endian和little endian称作“大尾”和“小尾”。 </p>
<p><strong>1、字符编码、内码，顺带介绍汉字编码</strong> </p>
<p>字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码，为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。 </p>
<p>GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。 </p>
<p>GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030，对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。 </p>
<p>从ASCII、GB2312、GBK到GB18030，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。 </p>
<p>有的中文Windows的缺省内码还是GBK，可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符，普通人是很难用到的，通常我们还是用GBK指代中文Windows内码。 </p>
<p>这里还有一些细节： </p>
<p>GB2312的原文还是区位码，从区位码到内码，需要在高字节和低字节上分别加上A0。 </p>
<p>在DBCS中，GB内码的存储格式始终是big endian，即高位在前。 </p>
<p>GB2312的两个字节的最高位都是1。但符合这个条件的码位只有128*128=16384个。所以GBK和GB18030的低字节最高位都可能不是1。不过这不影响DBCS字符流的解析：在读取DBCS字符流时，只要遇到高位为1的字节，就可以将下两个字节作为一个双字节编码，而不用管低字节的高位是什么。 </p>
<p><strong>2、Unicode、UCS和UTF</strong> </p>
<p>前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容（更准确地说，是与ISO-8859-1兼容），与GB码不兼容。例如“汉”字的Unicode编码是6C49，而GB码是BABA。 </p>
<p>Unicode也是一种字符编码方法，不过它是由国际组织设计，可以容纳全世界所有语言文字的编码方案。Unicode的学名是”Universal Multiple-Octet Coded Character Set”，简称为UCS。UCS可以看作是”Unicode Character Set”的缩写。 </p>
<p>根据维基百科的记载：历史上存在两个试图独立设计Unicode的组织，即国际标准化组织（ISO）和一个软件制造商的协会（unicode.org）。ISO开发了ISO 10646项目，Unicode协会开发了Unicode项目。 </p>
<p>在1991年前后，双方都认识到世界不需要两个不兼容的字符集。于是它们开始合并双方的工作成果，并为创立一个单一编码表而协同工作。从Unicode2.0开始，Unicode项目采用了与ISO 10646-1相同的字库和字码。 </p>
<p>目前两个项目仍都存在，并独立地公布各自的标准。Unicode协会现在的最新版本是2005年的Unicode 4.1.0。ISO的最新标准是10646-3:2003。 </p>
<p>UCS规定了怎么用多个字节表示各种文字。怎样传输这些编码，是由UTF(UCS Transformation Format)规范规定的，常见的UTF规范包括UTF-8、UTF-7、UTF-16。 </p>
<p>IETF的RFC2781和RFC3629以RFC的一贯风格，清晰、明快又不失严谨地描述了UTF-16和UTF-8的编码方法。我总是记不得IETF是Internet Engineering Task Force的缩写。但IETF负责维护的RFC是Internet上一切规范的基础。 </p>
<p><strong>3、UCS-2、UCS-4、BMP</strong> </p>
<p>UCS有两种格式：UCS-2和UCS-4。顾名思义，UCS-2就是用两个字节编码，UCS-4就是用4个字节（实际上只用了31位，最高位必须为0）编码。下面让我们做一些简单的数学游戏： </p>
<p>UCS-2有2^16=65536个码位，UCS-4有2^31=2147483648个码位。 </p>
<p>UCS-4根据最高位为0的最高字节分成2^7=128个group。每个group再根据次高字节分为256个plane。每个plane根据第3个字节分为256行 (rows)，每行包含256个cells。当然同一行的cells只是最后一个字节不同，其余都相同。 </p>
<p>group 0的plane 0被称作Basic Multilingual Plane, 即BMP。或者说UCS-4中，高两个字节为0的码位被称作BMP。 </p>
<p>将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。在UCS-2的两个字节前加上两个零字节，就得到了UCS-4的BMP。而目前的UCS-4规范中还没有任何字符被分配在BMP之外。 </p>
<p><strong>4、UTF编码</strong> </p>
<p>UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下： </p>
<p>╔══════════════╦═════════════════════╗<br />
║UCS-2编码(16进制)    ║UTF-8 字节流(二进制)                   ║<br />
║&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-║&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;║<br />
║0000 &#8211; 007F               ║0xxxxxxx                                         ║<br />
║0080 &#8211; 07FF               ║110xxxxx 10xxxxxx                    ║<br />
║0800 &#8211; FFFF                ║1110xxxx 10xxxxxx 10xxxxxx ║<br />
╚══════════════╩═════════════════════╝ </p>
<p>例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间，所以肯定要用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是：0110 110001 001001， 用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。 </p>
<p>读者可以用记事本测试一下我们的编码是否正确。 </p>
<p>UTF-16以16位为单元对UCS进行编码。对于小于0&#215;10000的UCS码，UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于0&#215;10000的UCS码，定义了一个算法。不过由于实际使用的UCS2，或者UCS4的BMP必然小于0&#215;10000，所以就目前而言，可以认为UTF-16和UCS-2基本相同。但UCS-2只是一个编码方案，UTF-16却要用于实际的传输，所以就不得不考虑字节序的问题。 </p>
<p><strong>5、UTF的字节序和BOM</strong> </p>
<p>UTF-8以字节为编码单元，没有字节序的问题。UTF-16以两个字节为编码单元，在解释一个UTF-16文本前，首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E，“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”，那么这是“奎”还是“乙”？ </p>
<p>Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bill Of Material”的BOM表，而是Byte Order Mark。BOM是一个有点小聪明的想法： </p>
<p>在UCS编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符”ZERO WIDTH NO-BREAK SPACE”。 </p>
<p>这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。 </p>
<p>UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8编码是EF BB BF（读者可以用我们前面介绍的编码方法验证一下）。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。 </p>
<p>Windows就是使用BOM来标记文本文件的编码方式的。 </p>
<p><strong>6、进一步的参考资料</strong> </p>
<p>本文主要参考的资料是 “Short overview of ISO-IEC 10646 and Unicode” (<a href="http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html">http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html</a>)。 </p>
<p>我还找了两篇看上去不错的资料，不过因为我开始的疑问都找到了答案，所以就没有看： </p>
<p>“Understanding Unicode A general introduction to the Unicode Standard” (<a href="http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter04a">http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter04a</a>) </p>
<p>“Character set encoding basics Understanding character set encodings and legacy encodings” (<a href="http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter03">http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter03</a>) </p>
<p>注：原文链接已无法打开 </p>
<hr />Unicode Table：<a href="http://www.ansell-uebersetzungen.com/gbuni.html">http://www.ansell-uebersetzungen.com/gbuni.html</a></p>
<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></content:encoded>
			<wfw:commentRss>http://witmax.cn/character-encoding-notes.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>【PHP】统计中英文单词数（GB2312/UTF-8编码)</title>
		<link>http://witmax.cn/php-chinese-word-count.html</link>
		<comments>http://witmax.cn/php-chinese-word-count.html#comments</comments>
		<pubDate>Wed, 24 Nov 2010 05:50:58 +0000</pubDate>
		<dc:creator>晴枫</dc:creator>
				<category><![CDATA[程序开发]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[字符编码]]></category>

		<guid isPermaLink="false">http://witmax.cn/?p=1210</guid>
		<description><![CDATA[英文单词的统计可以直接用php原生的函数str_word_count来进行统计。但这个函数对于中文汉字显得无能为力，无法准确统计到汉字个数。 解决办法是根据汉字的编码规则，自己来实现中文汉字数统计和中英文单词数统计。汉字编码参考Unicode编码表和GB2312区位码、编码表与编码规则。 对于GB2312编码的字符采用以下函数： 对于UTF-8编码的字符采用以下函数： 以上两种代码功能相同，只是根据不同的字符编码做了不同的实现，实际使用视页面编码对应选择。都有两个函数，一个只统计中文汉字数，另一个统计中英文单词数（中文汉字数+英文单词数），中英文符号都不计入数字统计。 特别说明：如不先去除中文标点会导致统计出错，如GB2312编码下”：‘”两个中文标点的字节表示为a3baa1ae，中间部分baa1正好对应GB2312编码地”骸”字，会被统计为一个中文汉字，导致计数错误。 函数使用可参考以下测试页面：<table class="wumii-related-items" cellspacing="0" cellpadding="3" border="0"  style="clear: both;">
    
    <tr>
        <td colspan="4"><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
        <tr>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important;">
                    <a target="_blank" title="字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/site_images/2011/09/06/28631125.jpg" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="【PHP】过滤不完整的UTF-8字符的函数" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-filter-partial-utf8-char.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/site_images/2011/08/08/21642838.png" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">【PHP】过滤不完整的UTF-8字符的函数</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="【NetBeans】设置打开文件时的默认文件编码" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/images/blogWidget/wordpress_default.gif" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="GB2312区位码、编码表与编码规则" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/images/blogWidget/wordpress_default.gif" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
        </tr>
    
    <tr>
        <td colspan="4" align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></description>
			<content:encoded><![CDATA[<p>英文单词的统计可以直接用php原生的函数str_word_count来进行统计。但这个函数对于中文汉字显得无能为力，无法准确统计到汉字个数。</p>
<p>解决办法是根据汉字的编码规则，自己来实现中文汉字数统计和中英文单词数统计。汉字编码参考<a href="http://witmax.cn/unicode-list.html" target="_blank">Unicode编码表</a>和<a href="http://witmax.cn/gb2312.html" target="_blank">GB2312区位码、编码表与编码规则</a>。</p>
<p>对于<strong>GB2312编码</strong>的字符采用以下函数：</p>
<p><span id="more-1210"></span></p>
<pre class="brush: php; title: ; notranslate">&lt;?php
define( &quot;GB2312_CHINESE_PATTERN&quot;, &quot;/[\xb0-\xfe][\xa0-\xfe]/&quot; );
define( &quot;GB2312_SYMBOL_PATTERN&quot;, &quot;/[\xa1-\xa3][\xa0-\xfe]/&quot; );
// count only chinese words
function str_gb2312_chinese_word_count($str = &quot;&quot;){
    $str = preg_replace(GB2312_SYMBOL_PATTERN, &quot;&quot;, $str);
    return preg_match_all(GB2312_CHINESE_PATTERN, $str, $arr);
}
// count both chinese and english
function str_gb2312_mix_word_count($str = &quot;&quot;){
    $str = preg_replace(GB2312_SYMBOL_PATTERN, &quot;&quot;, $str);
    return str_gb2312_chinese_word_count($str) + str_word_count(preg_replace(GB2312_CHINESE_PATTERN, &quot;&quot;, $str));
}
?&gt;</pre>
<p>对于<strong>UTF-8编码</strong>的字符采用以下函数：</p>
<pre class="brush: php; title: ; notranslate">&lt;?php
define( &quot;UTF8_CHINESE_PATTERN&quot;, &quot;/[\x{4e00}-\x{9fff}\x{f900}-\x{faff}]/u&quot; );
define( &quot;UTF8_SYMBOL_PATTERN&quot;, &quot;/[\x{ff00}-\x{ffef}\x{2000}-\x{206F}]/u&quot; );
// count only chinese words
function str_utf8_chinese_word_count($str = &quot;&quot;){
    $str = preg_replace(UTF8_SYMBOL_PATTERN, &quot;&quot;, $str);
    return preg_match_all(UTF8_CHINESE_PATTERN, $str, $arr);
}
// count both chinese and english
function str_utf8_mix_word_count($str = &quot;&quot;){
    $str = preg_replace(UTF8_SYMBOL_PATTERN, &quot;&quot;, $str);
    return str_utf8_chinese_word_count($str) + str_word_count(preg_replace(UTF8_CHINESE_PATTERN, &quot;&quot;, $str));
}?&gt;</pre>
<p>以上两种代码功能相同，只是根据不同的字符编码做了不同的实现，实际使用视页面编码对应选择。都有两个函数，一个只统计中文汉字数，另一个统计中英文单词数（中文汉字数+英文单词数），中英文符号都不计入数字统计。</p>
<p><strong>特别说明</strong>：如不先去除中文标点会导致统计出错，如GB2312编码下”：‘”两个中文标点的字节表示为a3baa1ae，中间部分baa1正好对应GB2312编码地”骸”字，会被统计为一个中文汉字，导致计数错误。</p>
<p>函数使用可参考以下测试页面：</p>
<pre class="brush: php; title: ; notranslate">

&lt;?php

define( &quot;GB2312_CHINESE_PATTERN&quot;, &quot;/[\xb0-\xfe][\xa0-\xfe]/&quot; );
define( &quot;GB2312_SYMBOL_PATTERN&quot;, &quot;/[\xa1-\xa3][\xa0-\xfe]/&quot; );
// count only chinese words
function str_gb2312_chinese_word_count($str = &quot;&quot;){
    $str = preg_replace(GB2312_SYMBOL_PATTERN, &quot;&quot;, $str);
    return preg_match_all(GB2312_CHINESE_PATTERN, $str, $textrr);
}
// count both chinese and english
function str_gb2312_mix_word_count($str = &quot;&quot;){
    $str = preg_replace(GB2312_SYMBOL_PATTERN, &quot;&quot;, $str);
    return str_gb2312_chinese_word_count($str) + str_word_count(preg_replace(GB2312_CHINESE_PATTERN, &quot;&quot;, $str));
}

define( &quot;UTF8_CHINESE_PATTERN&quot;, &quot;/[\x{4e00}-\x{9fff}\x{f900}-\x{faff}]/u&quot; );
define( &quot;UTF8_SYMBOL_PATTERN&quot;, &quot;/[\x{ff00}-\x{ffef}\x{2000}-\x{206F}]/u&quot; );
// count only chinese words
function str_utf8_chinese_word_count($str = &quot;&quot;){
    $str = preg_replace(UTF8_SYMBOL_PATTERN, &quot;&quot;, $str);
    return preg_match_all(UTF8_CHINESE_PATTERN, $str, $textrr);
}
// count both chinese and english
function str_utf8_mix_word_count($str = &quot;&quot;){
    $str = preg_replace(UTF8_SYMBOL_PATTERN, &quot;&quot;, $str);
    return str_utf8_chinese_word_count($str) + str_word_count(preg_replace(UTF8_CHINESE_PATTERN, &quot;&quot;, $str));
}

// convert a string to hex-coding form
function binhex($str) {
    $hex = &quot;&quot;;
    $i = 0;
    do {
        $hex .= sprintf(&quot;%02x&quot;, ord($str{$i}));
        $i++;
    } while ($i &lt; strlen($str));
    return $hex;
}

$text = $_REQUEST[&quot;text&quot;] ? $_REQUEST[&quot;text&quot;] : &quot;&quot;;
echo &quot;Text: &quot; . $text . &quot;&lt;br /&gt;&quot;;
echo &quot;Hex : &quot; . ($text ? binhex($text) : &quot;&quot;) . &quot;&lt;br /&gt;&quot;;
// use one of the following two lines according to the page encoding
echo &quot;Word count: &quot; . str_gb2312_mix_word_count($text);
// echo &quot;Word count: &quot; . str_utf8_mix_word_count($text);
?&gt;

&lt;form action=&quot;test.php&quot;&gt;
&lt;input type=&quot;text&quot; name=&quot;text&quot; id=&quot;text&quot; value=&quot;&lt;?=$text?&gt;&quot;/&gt;
&lt;input type=&quot;submit&quot; /&gt;
&lt;/form&gt;
</pre>
<table class="wumii-related-items" cellspacing="0" cellpadding="3" border="0"  style="clear: both;">
    
    <tr>
        <td colspan="4"><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
        <tr>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important;">
                    <a target="_blank" title="字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/site_images/2011/09/06/28631125.jpg" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="【PHP】过滤不完整的UTF-8字符的函数" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-filter-partial-utf8-char.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/site_images/2011/08/08/21642838.png" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">【PHP】过滤不完整的UTF-8字符的函数</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="【NetBeans】设置打开文件时的默认文件编码" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/images/blogWidget/wordpress_default.gif" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
                <td width="102" valign="top" style="padding: 5px !important; margin: 0 !important; border-left: 1px solid #DDDDDD !important;">
                    <a target="_blank" title="GB2312区位码、编码表与编码规则" style="text-decoration: none !important; cursor: pointer !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html">
                        <img style="margin: 0 !important; padding: 2px !important; border: 1px solid #DDDDDD !important; width: 96px !important; height: 96px !important;" src="http://static.wumii.com/images/blogWidget/wordpress_default.gif" width="96px" height="96px" /><br />
                        <font size="-1" color="#333333" style="display: block !important; line-height: 15px !important; width: 102px !important; font: 12px/15px arial !important; height: 60px !important; margin: 3px 0 0 0 !important; padding: 0 !important; overflow: hidden !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
        </tr>
    
    <tr>
        <td colspan="4" align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></content:encoded>
			<wfw:commentRss>http://witmax.cn/php-chinese-word-count.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>GB2312区位码、编码表与编码规则</title>
		<link>http://witmax.cn/gb2312.html</link>
		<comments>http://witmax.cn/gb2312.html#comments</comments>
		<pubDate>Wed, 24 Nov 2010 03:08:25 +0000</pubDate>
		<dc:creator>晴枫</dc:creator>
				<category><![CDATA[程序开发]]></category>
		<category><![CDATA[字符编码]]></category>

		<guid isPermaLink="false">http://witmax.cn/?p=1203</guid>
		<description><![CDATA[GB2312共收录6763个汉字，其中一级汉字3755个，二级汉字3008个；同时收录包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。        GB2312区位码 GB2312对所收汉字进行了“分区”处理，每区含有94个汉字/符号。这种表示方式也称为区位码。 01-09区为特殊符号。           16-55区为一级汉字，按拼音排序。            56-87区为二级汉字，按部首/笔画排序。           10-15区及88-94区则未有编码。         举例来说，“啊”字是GB2312之中的第一个汉字，它的区位码就是1601。字节编码，通常采用EUC储存方法，以便兼容于ASCII。每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”，第二个字节称为“低位字节”。 “高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0)，“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多数程序中，会以0xB0A1储存（与区位码对比：0xB0=0xA0+16,0xA1=0xA0+1）。         所以GB2312编码中汉字区码的十进制是从176到247，位码是从161到255.之所以存储了6763小于82*94=6768，是因为在区码为215，位码为250-254之间共五个编码没有汉字编码，所以6768-5=6763个。 GB2312编码规则 2字节编码，高位为0xA1-0xF7，低位为0xA1-0xFE 汉字区域，高位为0xB0-0xF7，低位为0xA1-0xFE 特殊符号，高位为0xA1-0xA9，低位为0xA1-0xFE GB2312编码表 GB2312编码表下载点击 参考资料： 1. GB2312编码规则<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></description>
			<content:encoded><![CDATA[<p>GB2312共收录6763个汉字，其中一级汉字3755个，二级汉字3008个；同时收录包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。       </p>
<p><strong>GB2312区位码</strong></p>
<p>GB2312对所收汉字进行了“分区”处理，每区含有94个汉字/符号。这种表示方式也称为区位码。</p>
<ul>
<li>01-09区为特殊符号。          </li>
<li>16-55区为一级汉字，按拼音排序。           </li>
<li>56-87区为二级汉字，按部首/笔画排序。          </li>
<li>10-15区及88-94区则未有编码。        </li>
</ul>
<p><span id="more-1203"></span></p>
<p>举例来说，“啊”字是GB2312之中的第一个汉字，它的区位码就是1601。字节编码，通常采用EUC储存方法，以便兼容于ASCII。<strong>每个汉字及符号以两个字节来表示</strong>。第一个字节称为“高位字节”，第二个字节称为“低位字节”。 “高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0)，“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多数程序中，会以0xB0A1储存（与区位码对比：0xB0=0xA0+16,0xA1=0xA0+1）。        </p>
<p>所以GB2312编码中汉字区码的十进制是从176到247，位码是从161到255.之所以存储了6763小于82*94=6768，是因为在区码为215，位码为250-254之间共五个编码没有汉字编码，所以6768-5=6763个。</p>
<p><strong>GB2312编码规则</strong></p>
<ol>
<li>2字节编码，高位为0xA1-0xF7，低位为0xA1-0xFE</li>
<li>汉字区域，高位为0xB0-0xF7，低位为0xA1-0xFE</li>
<li>特殊符号，高位为0xA1-0xA9，低位为0xA1-0xFE</li>
</ol>
<p><strong>GB2312编码表</strong></p>
<pre class="brush: plain; title: ; notranslate">

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0     　 、 。 · ˉ ˇ ¨ 〃 々 — ～ ‖ … ‘ ’
A1B0  “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】
A1C0  ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠
A1D0  ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵
A1E0  ∴ ♂ ♀ ° ′ ″ ℃ ＄ ¤ ￠ ￡ ‰ § № ☆ ★
A1F0  ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A2A0     ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ     
A2B0   ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖
A2C0  ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾
A2D0  ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦
A2E0  ⑧ ⑨ ⑩   ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩ 
A2F0   Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ    

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0     ！ ＂ ＃ ￥ ％ ＆ ＇ （ ） ＊ ＋ ， － ． ／
A3B0  ０ １ ２ ３ ４ ５ ６ ７ ８ ９ ： ； ＜ ＝ ＞ ？
A3C0  ＠ Ａ Ｂ Ｃ Ｄ Ｅ Ｆ Ｇ Ｈ Ｉ Ｊ Ｋ Ｌ Ｍ Ｎ Ｏ
A3D0  Ｐ Ｑ Ｒ Ｓ Ｔ Ｕ Ｖ Ｗ Ｘ Ｙ Ｚ ［ ＼ ］ ＾ ＿
A3E0  ｀ ａ ｂ ｃ ｄ ｅ ｆ ｇ ｈ ｉ ｊ ｋ ｌ ｍ ｎ ｏ
A3F0  ｐ ｑ ｒ ｓ ｔ ｕ ｖ ｗ ｘ ｙ ｚ ｛ ｜ ｝ ￣  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A4A0     ぁ あ ぃ い ぅ う ぇ え ぉ お か が き ぎ く
A4B0  ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た
A4C0  だ ち ぢ っ つ づ て で と ど な に ぬ ね の は
A4D0  ば ぱ ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み
A4E0  む め も ゃ や ゅ ゆ ょ よ ら り る れ ろ ゎ わ
A4F0  ゐ ゑ を ん             

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A5A0     ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク
A5B0  グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ
A5C0  ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ
A5D0  バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ
A5E0  ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ
A5F0  ヰ ヱ ヲ ン ヴ ヵ ヶ          

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A6A0     Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
A6B0  Π Ρ Σ Τ Υ Φ Χ Ψ Ω       
A6C0   α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
A6D0  π ρ σ τ υ φ χ ψ ω       
A6E0  ︵ ︶ ︹ ︺ ︿ ﹀ ︽ ︾ ﹁ ﹂ ﹃ ﹄   ︻ ︼
A6F0  ︷ ︸ ︱  ︳ ︴           

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A7A0     А Б В Г Д Е Ё Ж З И Й К Л М Н
A7B0  О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
A7C0  Ю Я              
A7D0   а б в г д е ё ж з и й к л м н
A7E0  о п р с т у ф х ц ч ш щ ъ ы ь э
A7F0  ю я               

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A8A0     ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ
A8B0  ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ  ń ň 
A8C0  ɡ     ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ
A8D0  ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ ㄜ ㄝ ㄞ ㄟ
A8E0  ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ      
A8F0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A9A0        ─ ━ │ ┃ ┄ ┅ ┆ ┇ ┈ ┉ ┊ ┋
A9B0  ┌ ┍ ┎ ┏ ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛
A9C0  ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣ ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫
A9D0  ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷ ┸ ┹ ┺ ┻
A9E0  ┼ ┽ ┾ ┿ ╀ ╁ ╂ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋
A9F0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AAA0                   
AAB0                 
AAC0                 
AAD0                 
AAE0                 
AAF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ABA0                   
ABB0                 
ABC0                 
ABD0                 
ABE0                 
ABF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ACA0                   
ACB0                 
ACC0                 
ACD0                 
ACE0                 
ACF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ADA0                   
ADB0                 
ADC0                 
ADD0                 
ADE0                 
ADF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AEA0                   
AEB0                 
AEC0                 
AED0                 
AEE0                 
AEF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
AFA0                   
AFB0                 
AFC0                 
AFD0                 
AFE0                 
AFF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B0A0     啊 阿 埃 挨 哎 唉 哀 皑 癌 蔼 矮 艾 碍 爱 隘
B0B0  鞍 氨 安 俺 按 暗 岸 胺 案 肮 昂 盎 凹 敖 熬 翱
B0C0  袄 傲 奥 懊 澳 芭 捌 扒 叭 吧 笆 八 疤 巴 拔 跋
B0D0  靶 把 耙 坝 霸 罢 爸 白 柏 百 摆 佰 败 拜 稗 斑
B0E0  班 搬 扳 般 颁 板 版 扮 拌 伴 瓣 半 办 绊 邦 帮
B0F0  梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 苞 胞 包 褒 剥  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B1A0     薄 雹 保 堡 饱 宝 抱 报 暴 豹 鲍 爆 杯 碑 悲
B1B0  卑 北 辈 背 贝 钡 倍 狈 备 惫 焙 被 奔 苯 本 笨
B1C0  崩 绷 甭 泵 蹦 迸 逼 鼻 比 鄙 笔 彼 碧 蓖 蔽 毕
B1D0  毙 毖 币 庇 痹 闭 敝 弊 必 辟 壁 臂 避 陛 鞭 边
B1E0  编 贬 扁 便 变 卞 辨 辩 辫 遍 标 彪 膘 表 鳖 憋
B1F0  别 瘪 彬 斌 濒 滨 宾 摈 兵 冰 柄 丙 秉 饼 炳  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B2A0     病 并 玻 菠 播 拨 钵 波 博 勃 搏 铂 箔 伯 帛
B2B0  舶 脖 膊 渤 泊 驳 捕 卜 哺 补 埠 不 布 步 簿 部
B2C0  怖 擦 猜 裁 材 才 财 睬 踩 采 彩 菜 蔡 餐 参 蚕
B2D0  残 惭 惨 灿 苍 舱 仓 沧 藏 操 糙 槽 曹 草 厕 策
B2E0  侧 册 测 层 蹭 插 叉 茬 茶 查 碴 搽 察 岔 差 诧
B2F0  拆 柴 豺 搀 掺 蝉 馋 谗 缠 铲 产 阐 颤 昌 猖  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B3A0     场 尝 常 长 偿 肠 厂 敞 畅 唱 倡 超 抄 钞 朝
B3B0  嘲 潮 巢 吵 炒 车 扯 撤 掣 彻 澈 郴 臣 辰 尘 晨
B3C0  忱 沉 陈 趁 衬 撑 称 城 橙 成 呈 乘 程 惩 澄 诚
B3D0  承 逞 骋 秤 吃 痴 持 匙 池 迟 弛 驰 耻 齿 侈 尺
B3E0  赤 翅 斥 炽 充 冲 虫 崇 宠 抽 酬 畴 踌 稠 愁 筹
B3F0  仇 绸 瞅 丑 臭 初 出 橱 厨 躇 锄 雏 滁 除 楚  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B4A0     础 储 矗 搐 触 处 揣 川 穿 椽 传 船 喘 串 疮
B4B0  窗 幢 床 闯 创 吹 炊 捶 锤 垂 春 椿 醇 唇 淳 纯
B4C0  蠢 戳 绰 疵 茨 磁 雌 辞 慈 瓷 词 此 刺 赐 次 聪
B4D0  葱 囱 匆 从 丛 凑 粗 醋 簇 促 蹿 篡 窜 摧 崔 催
B4E0  脆 瘁 粹 淬 翠 村 存 寸 磋 撮 搓 措 挫 错 搭 达
B4F0  答 瘩 打 大 呆 歹 傣 戴 带 殆 代 贷 袋 待 逮  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B5A0     怠 耽 担 丹 单 郸 掸 胆 旦 氮 但 惮 淡 诞 弹
B5B0  蛋 当 挡 党 荡 档 刀 捣 蹈 倒 岛 祷 导 到 稻 悼
B5C0  道 盗 德 得 的 蹬 灯 登 等 瞪 凳 邓 堤 低 滴 迪
B5D0  敌 笛 狄 涤 翟 嫡 抵 底 地 蒂 第 帝 弟 递 缔 颠
B5E0  掂 滇 碘 点 典 靛 垫 电 佃 甸 店 惦 奠 淀 殿 碉
B5F0  叼 雕 凋 刁 掉 吊 钓 调 跌 爹 碟 蝶 迭 谍 叠  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B6A0     丁 盯 叮 钉 顶 鼎 锭 定 订 丢 东 冬 董 懂 动
B6B0  栋 侗 恫 冻 洞 兜 抖 斗 陡 豆 逗 痘 都 督 毒 犊
B6C0  独 读 堵 睹 赌 杜 镀 肚 度 渡 妒 端 短 锻 段 断
B6D0  缎 堆 兑 队 对 墩 吨 蹲 敦 顿 囤 钝 盾 遁 掇 哆
B6E0  多 夺 垛 躲 朵 跺 舵 剁 惰 堕 蛾 峨 鹅 俄 额 讹
B6F0  娥 恶 厄 扼 遏 鄂 饿 恩 而 儿 耳 尔 饵 洱 二  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B7A0     贰 发 罚 筏 伐 乏 阀 法 珐 藩 帆 番 翻 樊 矾
B7B0  钒 繁 凡 烦 反 返 范 贩 犯 饭 泛 坊 芳 方 肪 房
B7C0  防 妨 仿 访 纺 放 菲 非 啡 飞 肥 匪 诽 吠 肺 废
B7D0  沸 费 芬 酚 吩 氛 分 纷 坟 焚 汾 粉 奋 份 忿 愤
B7E0  粪 丰 封 枫 蜂 峰 锋 风 疯 烽 逢 冯 缝 讽 奉 凤
B7F0  佛 否 夫 敷 肤 孵 扶 拂 辐 幅 氟 符 伏 俘 服  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B8A0     浮 涪 福 袱 弗 甫 抚 辅 俯 釜 斧 脯 腑 府 腐
B8B0  赴 副 覆 赋 复 傅 付 阜 父 腹 负 富 讣 附 妇 缚
B8C0  咐 噶 嘎 该 改 概 钙 盖 溉 干 甘 杆 柑 竿 肝 赶
B8D0  感 秆 敢 赣 冈 刚 钢 缸 肛 纲 岗 港 杠 篙 皋 高
B8E0  膏 羔 糕 搞 镐 稿 告 哥 歌 搁 戈 鸽 胳 疙 割 革
B8F0  葛 格 蛤 阁 隔 铬 个 各 给 根 跟 耕 更 庚 羹  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
B9A0     埂 耿 梗 工 攻 功 恭 龚 供 躬 公 宫 弓 巩 汞
B9B0  拱 贡 共 钩 勾 沟 苟 狗 垢 构 购 够 辜 菇 咕 箍
B9C0  估 沽 孤 姑 鼓 古 蛊 骨 谷 股 故 顾 固 雇 刮 瓜
B9D0  剐 寡 挂 褂 乖 拐 怪 棺 关 官 冠 观 管 馆 罐 惯
B9E0  灌 贯 光 广 逛 瑰 规 圭 硅 归 龟 闺 轨 鬼 诡 癸
B9F0  桂 柜 跪 贵 刽 辊 滚 棍 锅 郭 国 果 裹 过 哈  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BAA0     骸 孩 海 氦 亥 害 骇 酣 憨 邯 韩 含 涵 寒 函
BAB0  喊 罕 翰 撼 捍 旱 憾 悍 焊 汗 汉 夯 杭 航 壕 嚎
BAC0  豪 毫 郝 好 耗 号 浩 呵 喝 荷 菏 核 禾 和 何 合
BAD0  盒 貉 阂 河 涸 赫 褐 鹤 贺 嘿 黑 痕 很 狠 恨 哼
BAE0  亨 横 衡 恒 轰 哄 烘 虹 鸿 洪 宏 弘 红 喉 侯 猴
BAF0  吼 厚 候 后 呼 乎 忽 瑚 壶 葫 胡 蝴 狐 糊 湖  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BBA0     弧 虎 唬 护 互 沪 户 花 哗 华 猾 滑 画 划 化
BBB0  话 槐 徊 怀 淮 坏 欢 环 桓 还 缓 换 患 唤 痪 豢
BBC0  焕 涣 宦 幻 荒 慌 黄 磺 蝗 簧 皇 凰 惶 煌 晃 幌
BBD0  恍 谎 灰 挥 辉 徽 恢 蛔 回 毁 悔 慧 卉 惠 晦 贿
BBE0  秽 会 烩 汇 讳 诲 绘 荤 昏 婚 魂 浑 混 豁 活 伙
BBF0  火 获 或 惑 霍 货 祸 击 圾 基 机 畸 稽 积 箕  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BCA0     肌 饥 迹 激 讥 鸡 姬 绩 缉 吉 极 棘 辑 籍 集
BCB0  及 急 疾 汲 即 嫉 级 挤 几 脊 己 蓟 技 冀 季 伎
BCC0  祭 剂 悸 济 寄 寂 计 记 既 忌 际 妓 继 纪 嘉 枷
BCD0  夹 佳 家 加 荚 颊 贾 甲 钾 假 稼 价 架 驾 嫁 歼
BCE0  监 坚 尖 笺 间 煎 兼 肩 艰 奸 缄 茧 检 柬 碱 硷
BCF0  拣 捡 简 俭 剪 减 荐 槛 鉴 践 贱 见 键 箭 件  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BDA0     健 舰 剑 饯 渐 溅 涧 建 僵 姜 将 浆 江 疆 蒋
BDB0  桨 奖 讲 匠 酱 降 蕉 椒 礁 焦 胶 交 郊 浇 骄 娇
BDC0  嚼 搅 铰 矫 侥 脚 狡 角 饺 缴 绞 剿 教 酵 轿 较
BDD0  叫 窖 揭 接 皆 秸 街 阶 截 劫 节 桔 杰 捷 睫 竭
BDE0  洁 结 解 姐 戒 藉 芥 界 借 介 疥 诫 届 巾 筋 斤
BDF0  金 今 津 襟 紧 锦 仅 谨 进 靳 晋 禁 近 烬 浸  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BEA0     尽 劲 荆 兢 茎 睛 晶 鲸 京 惊 精 粳 经 井 警
BEB0  景 颈 静 境 敬 镜 径 痉 靖 竟 竞 净 炯 窘 揪 究
BEC0  纠 玖 韭 久 灸 九 酒 厩 救 旧 臼 舅 咎 就 疚 鞠
BED0  拘 狙 疽 居 驹 菊 局 咀 矩 举 沮 聚 拒 据 巨 具
BEE0  距 踞 锯 俱 句 惧 炬 剧 捐 鹃 娟 倦 眷 卷 绢 撅
BEF0  攫 抉 掘 倔 爵 觉 决 诀 绝 均 菌 钧 军 君 峻  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
BFA0     俊 竣 浚 郡 骏 喀 咖 卡 咯 开 揩 楷 凯 慨 刊
BFB0  堪 勘 坎 砍 看 康 慷 糠 扛 抗 亢 炕 考 拷 烤 靠
BFC0  坷 苛 柯 棵 磕 颗 科 壳 咳 可 渴 克 刻 客 课 肯
BFD0  啃 垦 恳 坑 吭 空 恐 孔 控 抠 口 扣 寇 枯 哭 窟
BFE0  苦 酷 库 裤 夸 垮 挎 跨 胯 块 筷 侩 快 宽 款 匡
BFF0  筐 狂 框 矿 眶 旷 况 亏 盔 岿 窥 葵 奎 魁 傀  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C0A0     馈 愧 溃 坤 昆 捆 困 括 扩 廓 阔 垃 拉 喇 蜡
C0B0  腊 辣 啦 莱 来 赖 蓝 婪 栏 拦 篮 阑 兰 澜 谰 揽
C0C0  览 懒 缆 烂 滥 琅 榔 狼 廊 郎 朗 浪 捞 劳 牢 老
C0D0  佬 姥 酪 烙 涝 勒 乐 雷 镭 蕾 磊 累 儡 垒 擂 肋
C0E0  类 泪 棱 楞 冷 厘 梨 犁 黎 篱 狸 离 漓 理 李 里
C0F0  鲤 礼 莉 荔 吏 栗 丽 厉 励 砾 历 利 傈 例 俐  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C1A0     痢 立 粒 沥 隶 力 璃 哩 俩 联 莲 连 镰 廉 怜
C1B0  涟 帘 敛 脸 链 恋 炼 练 粮 凉 梁 粱 良 两 辆 量
C1C0  晾 亮 谅 撩 聊 僚 疗 燎 寥 辽 潦 了 撂 镣 廖 料
C1D0  列 裂 烈 劣 猎 琳 林 磷 霖 临 邻 鳞 淋 凛 赁 吝
C1E0  拎 玲 菱 零 龄 铃 伶 羚 凌 灵 陵 岭 领 另 令 溜
C1F0  琉 榴 硫 馏 留 刘 瘤 流 柳 六 龙 聋 咙 笼 窿  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C2A0     隆 垄 拢 陇 楼 娄 搂 篓 漏 陋 芦 卢 颅 庐 炉
C2B0  掳 卤 虏 鲁 麓 碌 露 路 赂 鹿 潞 禄 录 陆 戮 驴
C2C0  吕 铝 侣 旅 履 屡 缕 虑 氯 律 率 滤 绿 峦 挛 孪
C2D0  滦 卵 乱 掠 略 抡 轮 伦 仑 沦 纶 论 萝 螺 罗 逻
C2E0  锣 箩 骡 裸 落 洛 骆 络 妈 麻 玛 码 蚂 马 骂 嘛
C2F0  吗 埋 买 麦 卖 迈 脉 瞒 馒 蛮 满 蔓 曼 慢 漫  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C3A0     谩 芒 茫 盲 氓 忙 莽 猫 茅 锚 毛 矛 铆 卯 茂
C3B0  冒 帽 貌 贸 么 玫 枚 梅 酶 霉 煤 没 眉 媒 镁 每
C3C0  美 昧 寐 妹 媚 门 闷 们 萌 蒙 檬 盟 锰 猛 梦 孟
C3D0  眯 醚 靡 糜 迷 谜 弥 米 秘 觅 泌 蜜 密 幂 棉 眠
C3E0  绵 冕 免 勉 娩 缅 面 苗 描 瞄 藐 秒 渺 庙 妙 蔑
C3F0  灭 民 抿 皿 敏 悯 闽 明 螟 鸣 铭 名 命 谬 摸  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C4A0     摹 蘑 模 膜 磨 摩 魔 抹 末 莫 墨 默 沫 漠 寞
C4B0  陌 谋 牟 某 拇 牡 亩 姆 母 墓 暮 幕 募 慕 木 目
C4C0  睦 牧 穆 拿 哪 呐 钠 那 娜 纳 氖 乃 奶 耐 奈 南
C4D0  男 难 囊 挠 脑 恼 闹 淖 呢 馁 内 嫩 能 妮 霓 倪
C4E0  泥 尼 拟 你 匿 腻 逆 溺 蔫 拈 年 碾 撵 捻 念 娘
C4F0  酿 鸟 尿 捏 聂 孽 啮 镊 镍 涅 您 柠 狞 凝 宁  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C5A0     拧 泞 牛 扭 钮 纽 脓 浓 农 弄 奴 努 怒 女 暖
C5B0  虐 疟 挪 懦 糯 诺 哦 欧 鸥 殴 藕 呕 偶 沤 啪 趴
C5C0  爬 帕 怕 琶 拍 排 牌 徘 湃 派 攀 潘 盘 磐 盼 畔
C5D0  判 叛 乓 庞 旁 耪 胖 抛 咆 刨 炮 袍 跑 泡 呸 胚
C5E0  培 裴 赔 陪 配 佩 沛 喷 盆 砰 抨 烹 澎 彭 蓬 棚
C5F0  硼 篷 膨 朋 鹏 捧 碰 坯 砒 霹 批 披 劈 琵 毗  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C6A0     啤 脾 疲 皮 匹 痞 僻 屁 譬 篇 偏 片 骗 飘 漂
C6B0  瓢 票 撇 瞥 拼 频 贫 品 聘 乒 坪 苹 萍 平 凭 瓶
C6C0  评 屏 坡 泼 颇 婆 破 魄 迫 粕 剖 扑 铺 仆 莆 葡
C6D0  菩 蒲 埔 朴 圃 普 浦 谱 曝 瀑 期 欺 栖 戚 妻 七
C6E0  凄 漆 柒 沏 其 棋 奇 歧 畦 崎 脐 齐 旗 祈 祁 骑
C6F0  起 岂 乞 企 启 契 砌 器 气 迄 弃 汽 泣 讫 掐  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C7A0     恰 洽 牵 扦 钎 铅 千 迁 签 仟 谦 乾 黔 钱 钳
C7B0  前 潜 遣 浅 谴 堑 嵌 欠 歉 枪 呛 腔 羌 墙 蔷 强
C7C0  抢 橇 锹 敲 悄 桥 瞧 乔 侨 巧 鞘 撬 翘 峭 俏 窍
C7D0  切 茄 且 怯 窃 钦 侵 亲 秦 琴 勤 芹 擒 禽 寝 沁
C7E0  青 轻 氢 倾 卿 清 擎 晴 氰 情 顷 请 庆 琼 穷 秋
C7F0  丘 邱 球 求 囚 酋 泅 趋 区 蛆 曲 躯 屈 驱 渠  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C8A0     取 娶 龋 趣 去 圈 颧 权 醛 泉 全 痊 拳 犬 券
C8B0  劝 缺 炔 瘸 却 鹊 榷 确 雀 裙 群 然 燃 冉 染 瓤
C8C0  壤 攘 嚷 让 饶 扰 绕 惹 热 壬 仁 人 忍 韧 任 认
C8D0  刃 妊 纫 扔 仍 日 戎 茸 蓉 荣 融 熔 溶 容 绒 冗
C8E0  揉 柔 肉 茹 蠕 儒 孺 如 辱 乳 汝 入 褥 软 阮 蕊
C8F0  瑞 锐 闰 润 若 弱 撒 洒 萨 腮 鳃 塞 赛 三 叁  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
C9A0     伞 散 桑 嗓 丧 搔 骚 扫 嫂 瑟 色 涩 森 僧 莎
C9B0  砂 杀 刹 沙 纱 傻 啥 煞 筛 晒 珊 苫 杉 山 删 煽
C9C0  衫 闪 陕 擅 赡 膳 善 汕 扇 缮 墒 伤 商 赏 晌 上
C9D0  尚 裳 梢 捎 稍 烧 芍 勺 韶 少 哨 邵 绍 奢 赊 蛇
C9E0  舌 舍 赦 摄 射 慑 涉 社 设 砷 申 呻 伸 身 深 娠
C9F0  绅 神 沈 审 婶 甚 肾 慎 渗 声 生 甥 牲 升 绳  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CAA0     省 盛 剩 胜 圣 师 失 狮 施 湿 诗 尸 虱 十 石
CAB0  拾 时 什 食 蚀 实 识 史 矢 使 屎 驶 始 式 示 士
CAC0  世 柿 事 拭 誓 逝 势 是 嗜 噬 适 仕 侍 释 饰 氏
CAD0  市 恃 室 视 试 收 手 首 守 寿 授 售 受 瘦 兽 蔬
CAE0  枢 梳 殊 抒 输 叔 舒 淑 疏 书 赎 孰 熟 薯 暑 曙
CAF0  署 蜀 黍 鼠 属 术 述 树 束 戍 竖 墅 庶 数 漱  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CBA0     恕 刷 耍 摔 衰 甩 帅 栓 拴 霜 双 爽 谁 水 睡
CBB0  税 吮 瞬 顺 舜 说 硕 朔 烁 斯 撕 嘶 思 私 司 丝
CBC0  死 肆 寺 嗣 四 伺 似 饲 巳 松 耸 怂 颂 送 宋 讼
CBD0  诵 搜 艘 擞 嗽 苏 酥 俗 素 速 粟 僳 塑 溯 宿 诉
CBE0  肃 酸 蒜 算 虽 隋 随 绥 髓 碎 岁 穗 遂 隧 祟 孙
CBF0  损 笋 蓑 梭 唆 缩 琐 索 锁 所 塌 他 它 她 塔  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CCA0     獭 挞 蹋 踏 胎 苔 抬 台 泰 酞 太 态 汰 坍 摊
CCB0  贪 瘫 滩 坛 檀 痰 潭 谭 谈 坦 毯 袒 碳 探 叹 炭
CCC0  汤 塘 搪 堂 棠 膛 唐 糖 倘 躺 淌 趟 烫 掏 涛 滔
CCD0  绦 萄 桃 逃 淘 陶 讨 套 特 藤 腾 疼 誊 梯 剔 踢
CCE0  锑 提 题 蹄 啼 体 替 嚏 惕 涕 剃 屉 天 添 填 田
CCF0  甜 恬 舔 腆 挑 条 迢 眺 跳 贴 铁 帖 厅 听 烃  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CDA0     汀 廷 停 亭 庭 挺 艇 通 桐 酮 瞳 同 铜 彤 童
CDB0  桶 捅 筒 统 痛 偷 投 头 透 凸 秃 突 图 徒 途 涂
CDC0  屠 土 吐 兔 湍 团 推 颓 腿 蜕 褪 退 吞 屯 臀 拖
CDD0  托 脱 鸵 陀 驮 驼 椭 妥 拓 唾 挖 哇 蛙 洼 娃 瓦
CDE0  袜 歪 外 豌 弯 湾 玩 顽 丸 烷 完 碗 挽 晚 皖 惋
CDF0  宛 婉 万 腕 汪 王 亡 枉 网 往 旺 望 忘 妄 威  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CEA0     巍 微 危 韦 违 桅 围 唯 惟 为 潍 维 苇 萎 委
CEB0  伟 伪 尾 纬 未 蔚 味 畏 胃 喂 魏 位 渭 谓 尉 慰
CEC0  卫 瘟 温 蚊 文 闻 纹 吻 稳 紊 问 嗡 翁 瓮 挝 蜗
CED0  涡 窝 我 斡 卧 握 沃 巫 呜 钨 乌 污 诬 屋 无 芜
CEE0  梧 吾 吴 毋 武 五 捂 午 舞 伍 侮 坞 戊 雾 晤 物
CEF0  勿 务 悟 误 昔 熙 析 西 硒 矽 晰 嘻 吸 锡 牺  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
CFA0     稀 息 希 悉 膝 夕 惜 熄 烯 溪 汐 犀 檄 袭 席
CFB0  习 媳 喜 铣 洗 系 隙 戏 细 瞎 虾 匣 霞 辖 暇 峡
CFC0  侠 狭 下 厦 夏 吓 掀 锨 先 仙 鲜 纤 咸 贤 衔 舷
CFD0  闲 涎 弦 嫌 显 险 现 献 县 腺 馅 羡 宪 陷 限 线
CFE0  相 厢 镶 香 箱 襄 湘 乡 翔 祥 详 想 响 享 项 巷
CFF0  橡 像 向 象 萧 硝 霄 削 哮 嚣 销 消 宵 淆 晓  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D0A0     小 孝 校 肖 啸 笑 效 楔 些 歇 蝎 鞋 协 挟 携
D0B0  邪 斜 胁 谐 写 械 卸 蟹 懈 泄 泻 谢 屑 薪 芯 锌
D0C0  欣 辛 新 忻 心 信 衅 星 腥 猩 惺 兴 刑 型 形 邢
D0D0  行 醒 幸 杏 性 姓 兄 凶 胸 匈 汹 雄 熊 休 修 羞
D0E0  朽 嗅 锈 秀 袖 绣 墟 戌 需 虚 嘘 须 徐 许 蓄 酗
D0F0  叙 旭 序 畜 恤 絮 婿 绪 续 轩 喧 宣 悬 旋 玄  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D1A0     选 癣 眩 绚 靴 薛 学 穴 雪 血 勋 熏 循 旬 询
D1B0  寻 驯 巡 殉 汛 训 讯 逊 迅 压 押 鸦 鸭 呀 丫 芽
D1C0  牙 蚜 崖 衙 涯 雅 哑 亚 讶 焉 咽 阉 烟 淹 盐 严
D1D0  研 蜒 岩 延 言 颜 阎 炎 沿 奄 掩 眼 衍 演 艳 堰
D1E0  燕 厌 砚 雁 唁 彦 焰 宴 谚 验 殃 央 鸯 秧 杨 扬
D1F0  佯 疡 羊 洋 阳 氧 仰 痒 养 样 漾 邀 腰 妖 瑶  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D2A0     摇 尧 遥 窑 谣 姚 咬 舀 药 要 耀 椰 噎 耶 爷
D2B0  野 冶 也 页 掖 业 叶 曳 腋 夜 液 一 壹 医 揖 铱
D2C0  依 伊 衣 颐 夷 遗 移 仪 胰 疑 沂 宜 姨 彝 椅 蚁
D2D0  倚 已 乙 矣 以 艺 抑 易 邑 屹 亿 役 臆 逸 肄 疫
D2E0  亦 裔 意 毅 忆 义 益 溢 诣 议 谊 译 异 翼 翌 绎
D2F0  茵 荫 因 殷 音 阴 姻 吟 银 淫 寅 饮 尹 引 隐  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D3A0     印 英 樱 婴 鹰 应 缨 莹 萤 营 荧 蝇 迎 赢 盈
D3B0  影 颖 硬 映 哟 拥 佣 臃 痈 庸 雍 踊 蛹 咏 泳 涌
D3C0  永 恿 勇 用 幽 优 悠 忧 尤 由 邮 铀 犹 油 游 酉
D3D0  有 友 右 佑 釉 诱 又 幼 迂 淤 于 盂 榆 虞 愚 舆
D3E0  余 俞 逾 鱼 愉 渝 渔 隅 予 娱 雨 与 屿 禹 宇 语
D3F0  羽 玉 域 芋 郁 吁 遇 喻 峪 御 愈 欲 狱 育 誉  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D4A0     浴 寓 裕 预 豫 驭 鸳 渊 冤 元 垣 袁 原 援 辕
D4B0  园 员 圆 猿 源 缘 远 苑 愿 怨 院 曰 约 越 跃 钥
D4C0  岳 粤 月 悦 阅 耘 云 郧 匀 陨 允 运 蕴 酝 晕 韵
D4D0  孕 匝 砸 杂 栽 哉 灾 宰 载 再 在 咱 攒 暂 赞 赃
D4E0  脏 葬 遭 糟 凿 藻 枣 早 澡 蚤 躁 噪 造 皂 灶 燥
D4F0  责 择 则 泽 贼 怎 增 憎 曾 赠 扎 喳 渣 札 轧  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D5A0     铡 闸 眨 栅 榨 咋 乍 炸 诈 摘 斋 宅 窄 债 寨
D5B0  瞻 毡 詹 粘 沾 盏 斩 辗 崭 展 蘸 栈 占 战 站 湛
D5C0  绽 樟 章 彰 漳 张 掌 涨 杖 丈 帐 账 仗 胀 瘴 障
D5D0  招 昭 找 沼 赵 照 罩 兆 肇 召 遮 折 哲 蛰 辙 者
D5E0  锗 蔗 这 浙 珍 斟 真 甄 砧 臻 贞 针 侦 枕 疹 诊
D5F0  震 振 镇 阵 蒸 挣 睁 征 狰 争 怔 整 拯 正 政  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D6A0     帧 症 郑 证 芝 枝 支 吱 蜘 知 肢 脂 汁 之 织
D6B0  职 直 植 殖 执 值 侄 址 指 止 趾 只 旨 纸 志 挚
D6C0  掷 至 致 置 帜 峙 制 智 秩 稚 质 炙 痔 滞 治 窒
D6D0  中 盅 忠 钟 衷 终 种 肿 重 仲 众 舟 周 州 洲 诌
D6E0  粥 轴 肘 帚 咒 皱 宙 昼 骤 珠 株 蛛 朱 猪 诸 诛
D6F0  逐 竹 烛 煮 拄 瞩 嘱 主 著 柱 助 蛀 贮 铸 筑  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D7A0     住 注 祝 驻 抓 爪 拽 专 砖 转 撰 赚 篆 桩 庄
D7B0  装 妆 撞 壮 状 椎 锥 追 赘 坠 缀 谆 准 捉 拙 卓
D7C0  桌 琢 茁 酌 啄 着 灼 浊 兹 咨 资 姿 滋 淄 孜 紫
D7D0  仔 籽 滓 子 自 渍 字 鬃 棕 踪 宗 综 总 纵 邹 走
D7E0  奏 揍 租 足 卒 族 祖 诅 阻 组 钻 纂 嘴 醉 最 罪
D7F0  尊 遵 昨 左 佐 柞 做 作 坐 座       

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D8A0     亍 丌 兀 丐 廿 卅 丕 亘 丞 鬲 孬 噩 丨 禺 丿
D8B0  匕 乇 夭 爻 卮 氐 囟 胤 馗 毓 睾 鼗 丶 亟 鼐 乜
D8C0  乩 亓 芈 孛 啬 嘏 仄 厍 厝 厣 厥 厮 靥 赝 匚 叵
D8D0  匦 匮 匾 赜 卦 卣 刂 刈 刎 刭 刳 刿 剀 剌 剞 剡
D8E0  剜 蒯 剽 劂 劁 劐 劓 冂 罔 亻 仃 仉 仂 仨 仡 仫
D8F0  仞 伛 仳 伢 佤 仵 伥 伧 伉 伫 佞 佧 攸 佚 佝  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
D9A0     佟 佗 伲 伽 佶 佴 侑 侉 侃 侏 佾 佻 侪 佼 侬
D9B0  侔 俦 俨 俪 俅 俚 俣 俜 俑 俟 俸 倩 偌 俳 倬 倏
D9C0  倮 倭 俾 倜 倌 倥 倨 偾 偃 偕 偈 偎 偬 偻 傥 傧
D9D0  傩 傺 僖 儆 僭 僬 僦 僮 儇 儋 仝 氽 佘 佥 俎 龠
D9E0  汆 籴 兮 巽 黉 馘 冁 夔 勹 匍 訇 匐 凫 夙 兕 亠
D9F0  兖 亳 衮 袤 亵 脔 裒 禀 嬴 蠃 羸 冫 冱 冽 冼  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DAA0     凇 冖 冢 冥 讠 讦 讧 讪 讴 讵 讷 诂 诃 诋 诏
DAB0  诎 诒 诓 诔 诖 诘 诙 诜 诟 诠 诤 诨 诩 诮 诰 诳
DAC0  诶 诹 诼 诿 谀 谂 谄 谇 谌 谏 谑 谒 谔 谕 谖 谙
DAD0  谛 谘 谝 谟 谠 谡 谥 谧 谪 谫 谮 谯 谲 谳 谵 谶
DAE0  卩 卺 阝 阢 阡 阱 阪 阽 阼 陂 陉 陔 陟 陧 陬 陲
DAF0  陴 隈 隍 隗 隰 邗 邛 邝 邙 邬 邡 邴 邳 邶 邺  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DBA0     邸 邰 郏 郅 邾 郐 郄 郇 郓 郦 郢 郜 郗 郛 郫
DBB0  郯 郾 鄄 鄢 鄞 鄣 鄱 鄯 鄹 酃 酆 刍 奂 劢 劬 劭
DBC0  劾 哿 勐 勖 勰 叟 燮 矍 廴 凵 凼 鬯 厶 弁 畚 巯
DBD0  坌 垩 垡 塾 墼 壅 壑 圩 圬 圪 圳 圹 圮 圯 坜 圻
DBE0  坂 坩 垅 坫 垆 坼 坻 坨 坭 坶 坳 垭 垤 垌 垲 埏
DBF0  垧 垴 垓 垠 埕 埘 埚 埙 埒 垸 埴 埯 埸 埤 埝  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DCA0     堋 堍 埽 埭 堀 堞 堙 塄 堠 塥 塬 墁 墉 墚 墀
DCB0  馨 鼙 懿 艹 艽 艿 芏 芊 芨 芄 芎 芑 芗 芙 芫 芸
DCC0  芾 芰 苈 苊 苣 芘 芷 芮 苋 苌 苁 芩 芴 芡 芪 芟
DCD0  苄 苎 芤 苡 茉 苷 苤 茏 茇 苜 苴 苒 苘 茌 苻 苓
DCE0  茑 茚 茆 茔 茕 苠 苕 茜 荑 荛 荜 茈 莒 茼 茴 茱
DCF0  莛 荞 茯 荏 荇 荃 荟 荀 茗 荠 茭 茺 茳 荦 荥  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DDA0     荨 茛 荩 荬 荪 荭 荮 莰 荸 莳 莴 莠 莪 莓 莜
DDB0  莅 荼 莶 莩 荽 莸 荻 莘 莞 莨 莺 莼 菁 萁 菥 菘
DDC0  堇 萘 萋 菝 菽 菖 萜 萸 萑 萆 菔 菟 萏 萃 菸 菹
DDD0  菪 菅 菀 萦 菰 菡 葜 葑 葚 葙 葳 蒇 蒈 葺 蒉 葸
DDE0  萼 葆 葩 葶 蒌 蒎 萱 葭 蓁 蓍 蓐 蓦 蒽 蓓 蓊 蒿
DDF0  蒺 蓠 蒡 蒹 蒴 蒗 蓥 蓣 蔌 甍 蔸 蓰 蔹 蔟 蔺  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DEA0     蕖 蔻 蓿 蓼 蕙 蕈 蕨 蕤 蕞 蕺 瞢 蕃 蕲 蕻 薤
DEB0  薨 薇 薏 蕹 薮 薜 薅 薹 薷 薰 藓 藁 藜 藿 蘧 蘅
DEC0  蘩 蘖 蘼 廾 弈 夼 奁 耷 奕 奚 奘 匏 尢 尥 尬 尴
DED0  扌 扪 抟 抻 拊 拚 拗 拮 挢 拶 挹 捋 捃 掭 揶 捱
DEE0  捺 掎 掴 捭 掬 掊 捩 掮 掼 揲 揸 揠 揿 揄 揞 揎
DEF0  摒 揆 掾 摅 摁 搋 搛 搠 搌 搦 搡 摞 撄 摭 撖  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
DFA0     摺 撷 撸 撙 撺 擀 擐 擗 擤 擢 攉 攥 攮 弋 忒
DFB0  甙 弑 卟 叱 叽 叩 叨 叻 吒 吖 吆 呋 呒 呓 呔 呖
DFC0  呃 吡 呗 呙 吣 吲 咂 咔 呷 呱 呤 咚 咛 咄 呶 呦
DFD0  咝 哐 咭 哂 咴 哒 咧 咦 哓 哔 呲 咣 哕 咻 咿 哌
DFE0  哙 哚 哜 咩 咪 咤 哝 哏 哞 唛 哧 唠 哽 唔 哳 唢
DFF0  唣 唏 唑 唧 唪 啧 喏 喵 啉 啭 啁 啕 唿 啐 唼  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E0A0     唷 啖 啵 啶 啷 唳 唰 啜 喋 嗒 喃 喱 喹 喈 喁
E0B0  喟 啾 嗖 喑 啻 嗟 喽 喾 喔 喙 嗪 嗷 嗉 嘟 嗑 嗫
E0C0  嗬 嗔 嗦 嗝 嗄 嗯 嗥 嗲 嗳 嗌 嗍 嗨 嗵 嗤 辔 嘞
E0D0  嘈 嘌 嘁 嘤 嘣 嗾 嘀 嘧 嘭 噘 嘹 噗 嘬 噍 噢 噙
E0E0  噜 噌 噔 嚆 噤 噱 噫 噻 噼 嚅 嚓 嚯 囔 囗 囝 囡
E0F0  囵 囫 囹 囿 圄 圊 圉 圜 帏 帙 帔 帑 帱 帻 帼  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E1A0     帷 幄 幔 幛 幞 幡 岌 屺 岍 岐 岖 岈 岘 岙 岑
E1B0  岚 岜 岵 岢 岽 岬 岫 岱 岣 峁 岷 峄 峒 峤 峋 峥
E1C0  崂 崃 崧 崦 崮 崤 崞 崆 崛 嵘 崾 崴 崽 嵬 嵛 嵯
E1D0  嵝 嵫 嵋 嵊 嵩 嵴 嶂 嶙 嶝 豳 嶷 巅 彳 彷 徂 徇
E1E0  徉 後 徕 徙 徜 徨 徭 徵 徼 衢 彡 犭 犰 犴 犷 犸
E1F0  狃 狁 狎 狍 狒 狨 狯 狩 狲 狴 狷 猁 狳 猃 狺  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E2A0     狻 猗 猓 猡 猊 猞 猝 猕 猢 猹 猥 猬 猸 猱 獐
E2B0  獍 獗 獠 獬 獯 獾 舛 夥 飧 夤 夂 饣 饧 饨 饩 饪
E2C0  饫 饬 饴 饷 饽 馀 馄 馇 馊 馍 馐 馑 馓 馔 馕 庀
E2D0  庑 庋 庖 庥 庠 庹 庵 庾 庳 赓 廒 廑 廛 廨 廪 膺
E2E0  忄 忉 忖 忏 怃 忮 怄 忡 忤 忾 怅 怆 忪 忭 忸 怙
E2F0  怵 怦 怛 怏 怍 怩 怫 怊 怿 怡 恸 恹 恻 恺 恂  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E3A0     恪 恽 悖 悚 悭 悝 悃 悒 悌 悛 惬 悻 悱 惝 惘
E3B0  惆 惚 悴 愠 愦 愕 愣 惴 愀 愎 愫 慊 慵 憬 憔 憧
E3C0  憷 懔 懵 忝 隳 闩 闫 闱 闳 闵 闶 闼 闾 阃 阄 阆
E3D0  阈 阊 阋 阌 阍 阏 阒 阕 阖 阗 阙 阚 丬 爿 戕 氵
E3E0  汔 汜 汊 沣 沅 沐 沔 沌 汨 汩 汴 汶 沆 沩 泐 泔
E3F0  沭 泷 泸 泱 泗 沲 泠 泖 泺 泫 泮 沱 泓 泯 泾  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E4A0     洹 洧 洌 浃 浈 洇 洄 洙 洎 洫 浍 洮 洵 洚 浏
E4B0  浒 浔 洳 涑 浯 涞 涠 浞 涓 涔 浜 浠 浼 浣 渚 淇
E4C0  淅 淞 渎 涿 淠 渑 淦 淝 淙 渖 涫 渌 涮 渫 湮 湎
E4D0  湫 溲 湟 溆 湓 湔 渲 渥 湄 滟 溱 溘 滠 漭 滢 溥
E4E0  溧 溽 溻 溷 滗 溴 滏 溏 滂 溟 潢 潆 潇 漤 漕 滹
E4F0  漯 漶 潋 潴 漪 漉 漩 澉 澍 澌 潸 潲 潼 潺 濑  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E5A0     濉 澧 澹 澶 濂 濡 濮 濞 濠 濯 瀚 瀣 瀛 瀹 瀵
E5B0  灏 灞 宀 宄 宕 宓 宥 宸 甯 骞 搴 寤 寮 褰 寰 蹇
E5C0  謇 辶 迓 迕 迥 迮 迤 迩 迦 迳 迨 逅 逄 逋 逦 逑
E5D0  逍 逖 逡 逵 逶 逭 逯 遄 遑 遒 遐 遨 遘 遢 遛 暹
E5E0  遴 遽 邂 邈 邃 邋 彐 彗 彖 彘 尻 咫 屐 屙 孱 屣
E5F0  屦 羼 弪 弩 弭 艴 弼 鬻 屮 妁 妃 妍 妩 妪 妣  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E6A0     妗 姊 妫 妞 妤 姒 妲 妯 姗 妾 娅 娆 姝 娈 姣
E6B0  姘 姹 娌 娉 娲 娴 娑 娣 娓 婀 婧 婊 婕 娼 婢 婵
E6C0  胬 媪 媛 婷 婺 媾 嫫 媲 嫒 嫔 媸 嫠 嫣 嫱 嫖 嫦
E6D0  嫘 嫜 嬉 嬗 嬖 嬲 嬷 孀 尕 尜 孚 孥 孳 孑 孓 孢
E6E0  驵 驷 驸 驺 驿 驽 骀 骁 骅 骈 骊 骐 骒 骓 骖 骘
E6F0  骛 骜 骝 骟 骠 骢 骣 骥 骧 纟 纡 纣 纥 纨 纩  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E7A0     纭 纰 纾 绀 绁 绂 绉 绋 绌 绐 绔 绗 绛 绠 绡
E7B0  绨 绫 绮 绯 绱 绲 缍 绶 绺 绻 绾 缁 缂 缃 缇 缈
E7C0  缋 缌 缏 缑 缒 缗 缙 缜 缛 缟 缡 缢 缣 缤 缥 缦
E7D0  缧 缪 缫 缬 缭 缯 缰 缱 缲 缳 缵 幺 畿 巛 甾 邕
E7E0  玎 玑 玮 玢 玟 珏 珂 珑 玷 玳 珀 珉 珈 珥 珙 顼
E7F0  琊 珩 珧 珞 玺 珲 琏 琪 瑛 琦 琥 琨 琰 琮 琬  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E8A0     琛 琚 瑁 瑜 瑗 瑕 瑙 瑷 瑭 瑾 璜 璎 璀 璁 璇
E8B0  璋 璞 璨 璩 璐 璧 瓒 璺 韪 韫 韬 杌 杓 杞 杈 杩
E8C0  枥 枇 杪 杳 枘 枧 杵 枨 枞 枭 枋 杷 杼 柰 栉 柘
E8D0  栊 柩 枰 栌 柙 枵 柚 枳 柝 栀 柃 枸 柢 栎 柁 柽
E8E0  栲 栳 桠 桡 桎 桢 桄 桤 梃 栝 桕 桦 桁 桧 桀 栾
E8F0  桊 桉 栩 梵 梏 桴 桷 梓 桫 棂 楮 棼 椟 椠 棹  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
E9A0     椤 棰 椋 椁 楗 棣 椐 楱 椹 楠 楂 楝 榄 楫 榀
E9B0  榘 楸 椴 槌 榇 榈 槎 榉 楦 楣 楹 榛 榧 榻 榫 榭
E9C0  槔 榱 槁 槊 槟 榕 槠 榍 槿 樯 槭 樗 樘 橥 槲 橄
E9D0  樾 檠 橐 橛 樵 檎 橹 樽 樨 橘 橼 檑 檐 檩 檗 檫
E9E0  猷 獒 殁 殂 殇 殄 殒 殓 殍 殚 殛 殡 殪 轫 轭 轱
E9F0  轲 轳 轵 轶 轸 轷 轹 轺 轼 轾 辁 辂 辄 辇 辋  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EAA0     辍 辎 辏 辘 辚 軎 戋 戗 戛 戟 戢 戡 戥 戤 戬
EAB0  臧 瓯 瓴 瓿 甏 甑 甓 攴 旮 旯 旰 昊 昙 杲 昃 昕
EAC0  昀 炅 曷 昝 昴 昱 昶 昵 耆 晟 晔 晁 晏 晖 晡 晗
EAD0  晷 暄 暌 暧 暝 暾 曛 曜 曦 曩 贲 贳 贶 贻 贽 赀
EAE0  赅 赆 赈 赉 赇 赍 赕 赙 觇 觊 觋 觌 觎 觏 觐 觑
EAF0  牮 犟 牝 牦 牯 牾 牿 犄 犋 犍 犏 犒 挈 挲 掰  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EBA0     搿 擘 耄 毪 毳 毽 毵 毹 氅 氇 氆 氍 氕 氘 氙
EBB0  氚 氡 氩 氤 氪 氲 攵 敕 敫 牍 牒 牖 爰 虢 刖 肟
EBC0  肜 肓 肼 朊 肽 肱 肫 肭 肴 肷 胧 胨 胩 胪 胛 胂
EBD0  胄 胙 胍 胗 朐 胝 胫 胱 胴 胭 脍 脎 胲 胼 朕 脒
EBE0  豚 脶 脞 脬 脘 脲 腈 腌 腓 腴 腙 腚 腱 腠 腩 腼
EBF0  腽 腭 腧 塍 媵 膈 膂 膑 滕 膣 膪 臌 朦 臊 膻  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
ECA0     臁 膦 欤 欷 欹 歃 歆 歙 飑 飒 飓 飕 飙 飚 殳
ECB0  彀 毂 觳 斐 齑 斓 於 旆 旄 旃 旌 旎 旒 旖 炀 炜
ECC0  炖 炝 炻 烀 炷 炫 炱 烨 烊 焐 焓 焖 焯 焱 煳 煜
ECD0  煨 煅 煲 煊 煸 煺 熘 熳 熵 熨 熠 燠 燔 燧 燹 爝
ECE0  爨 灬 焘 煦 熹 戾 戽 扃 扈 扉 礻 祀 祆 祉 祛 祜
ECF0  祓 祚 祢 祗 祠 祯 祧 祺 禅 禊 禚 禧 禳 忑 忐  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EDA0     怼 恝 恚 恧 恁 恙 恣 悫 愆 愍 慝 憩 憝 懋 懑
EDB0  戆 肀 聿 沓 泶 淼 矶 矸 砀 砉 砗 砘 砑 斫 砭 砜
EDC0  砝 砹 砺 砻 砟 砼 砥 砬 砣 砩 硎 硭 硖 硗 砦 硐
EDD0  硇 硌 硪 碛 碓 碚 碇 碜 碡 碣 碲 碹 碥 磔 磙 磉
EDE0  磬 磲 礅 磴 礓 礤 礞 礴 龛 黹 黻 黼 盱 眄 眍 盹
EDF0  眇 眈 眚 眢 眙 眭 眦 眵 眸 睐 睑 睇 睃 睚 睨  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EEA0     睢 睥 睿 瞍 睽 瞀 瞌 瞑 瞟 瞠 瞰 瞵 瞽 町 畀
EEB0  畎 畋 畈 畛 畲 畹 疃 罘 罡 罟 詈 罨 罴 罱 罹 羁
EEC0  罾 盍 盥 蠲 钅 钆 钇 钋 钊 钌 钍 钏 钐 钔 钗 钕
EED0  钚 钛 钜 钣 钤 钫 钪 钭 钬 钯 钰 钲 钴 钶 钷 钸
EEE0  钹 钺 钼 钽 钿 铄 铈 铉 铊 铋 铌 铍 铎 铐 铑 铒
EEF0  铕 铖 铗 铙 铘 铛 铞 铟 铠 铢 铤 铥 铧 铨 铪  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
EFA0     铩 铫 铮 铯 铳 铴 铵 铷 铹 铼 铽 铿 锃 锂 锆
EFB0  锇 锉 锊 锍 锎 锏 锒 锓 锔 锕 锖 锘 锛 锝 锞 锟
EFC0  锢 锪 锫 锩 锬 锱 锲 锴 锶 锷 锸 锼 锾 锿 镂 锵
EFD0  镄 镅 镆 镉 镌 镎 镏 镒 镓 镔 镖 镗 镘 镙 镛 镞
EFE0  镟 镝 镡 镢 镤 镥 镦 镧 镨 镩 镪 镫 镬 镯 镱 镲
EFF0  镳 锺 矧 矬 雉 秕 秭 秣 秫 稆 嵇 稃 稂 稞 稔  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F0A0     稹 稷 穑 黏 馥 穰 皈 皎 皓 皙 皤 瓞 瓠 甬 鸠
F0B0  鸢 鸨 鸩 鸪 鸫 鸬 鸲 鸱 鸶 鸸 鸷 鸹 鸺 鸾 鹁 鹂
F0C0  鹄 鹆 鹇 鹈 鹉 鹋 鹌 鹎 鹑 鹕 鹗 鹚 鹛 鹜 鹞 鹣
F0D0  鹦 鹧 鹨 鹩 鹪 鹫 鹬 鹱 鹭 鹳 疒 疔 疖 疠 疝 疬
F0E0  疣 疳 疴 疸 痄 疱 疰 痃 痂 痖 痍 痣 痨 痦 痤 痫
F0F0  痧 瘃 痱 痼 痿 瘐 瘀 瘅 瘌 瘗 瘊 瘥 瘘 瘕 瘙  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F1A0     瘛 瘼 瘢 瘠 癀 瘭 瘰 瘿 瘵 癃 瘾 瘳 癍 癞 癔
F1B0  癜 癖 癫 癯 翊 竦 穸 穹 窀 窆 窈 窕 窦 窠 窬 窨
F1C0  窭 窳 衤 衩 衲 衽 衿 袂 袢 裆 袷 袼 裉 裢 裎 裣
F1D0  裥 裱 褚 裼 裨 裾 裰 褡 褙 褓 褛 褊 褴 褫 褶 襁
F1E0  襦 襻 疋 胥 皲 皴 矜 耒 耔 耖 耜 耠 耢 耥 耦 耧
F1F0  耩 耨 耱 耋 耵 聃 聆 聍 聒 聩 聱 覃 顸 颀 颃  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F2A0     颉 颌 颍 颏 颔 颚 颛 颞 颟 颡 颢 颥 颦 虍 虔
F2B0  虬 虮 虿 虺 虼 虻 蚨 蚍 蚋 蚬 蚝 蚧 蚣 蚪 蚓 蚩
F2C0  蚶 蛄 蚵 蛎 蚰 蚺 蚱 蚯 蛉 蛏 蚴 蛩 蛱 蛲 蛭 蛳
F2D0  蛐 蜓 蛞 蛴 蛟 蛘 蛑 蜃 蜇 蛸 蜈 蜊 蜍 蜉 蜣 蜻
F2E0  蜞 蜥 蜮 蜚 蜾 蝈 蜴 蜱 蜩 蜷 蜿 螂 蜢 蝽 蝾 蝻
F2F0  蝠 蝰 蝌 蝮 螋 蝓 蝣 蝼 蝤 蝙 蝥 螓 螯 螨 蟒  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F3A0     蟆 螈 螅 螭 螗 螃 螫 蟥 螬 螵 螳 蟋 蟓 螽 蟑
F3B0  蟀 蟊 蟛 蟪 蟠 蟮 蠖 蠓 蟾 蠊 蠛 蠡 蠹 蠼 缶 罂
F3C0  罄 罅 舐 竺 竽 笈 笃 笄 笕 笊 笫 笏 筇 笸 笪 笙
F3D0  笮 笱 笠 笥 笤 笳 笾 笞 筘 筚 筅 筵 筌 筝 筠 筮
F3E0  筻 筢 筲 筱 箐 箦 箧 箸 箬 箝 箨 箅 箪 箜 箢 箫
F3F0  箴 篑 篁 篌 篝 篚 篥 篦 篪 簌 篾 篼 簏 簖 簋  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F4A0     簟 簪 簦 簸 籁 籀 臾 舁 舂 舄 臬 衄 舡 舢 舣
F4B0  舭 舯 舨 舫 舸 舻 舳 舴 舾 艄 艉 艋 艏 艚 艟 艨
F4C0  衾 袅 袈 裘 裟 襞 羝 羟 羧 羯 羰 羲 籼 敉 粑 粝
F4D0  粜 粞 粢 粲 粼 粽 糁 糇 糌 糍 糈 糅 糗 糨 艮 暨
F4E0  羿 翎 翕 翥 翡 翦 翩 翮 翳 糸 絷 綦 綮 繇 纛 麸
F4F0  麴 赳 趄 趔 趑 趱 赧 赭 豇 豉 酊 酐 酎 酏 酤  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F5A0     酢 酡 酰 酩 酯 酽 酾 酲 酴 酹 醌 醅 醐 醍 醑
F5B0  醢 醣 醪 醭 醮 醯 醵 醴 醺 豕 鹾 趸 跫 踅 蹙 蹩
F5C0  趵 趿 趼 趺 跄 跖 跗 跚 跞 跎 跏 跛 跆 跬 跷 跸
F5D0  跣 跹 跻 跤 踉 跽 踔 踝 踟 踬 踮 踣 踯 踺 蹀 踹
F5E0  踵 踽 踱 蹉 蹁 蹂 蹑 蹒 蹊 蹰 蹶 蹼 蹯 蹴 躅 躏
F5F0  躔 躐 躜 躞 豸 貂 貊 貅 貘 貔 斛 觖 觞 觚 觜  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F6A0     觥 觫 觯 訾 謦 靓 雩 雳 雯 霆 霁 霈 霏 霎 霪
F6B0  霭 霰 霾 龀 龃 龅 龆 龇 龈 龉 龊 龌 黾 鼋 鼍 隹
F6C0  隼 隽 雎 雒 瞿 雠 銎 銮 鋈 錾 鍪 鏊 鎏 鐾 鑫 鱿
F6D0  鲂 鲅 鲆 鲇 鲈 稣 鲋 鲎 鲐 鲑 鲒 鲔 鲕 鲚 鲛 鲞
F6E0  鲟 鲠 鲡 鲢 鲣 鲥 鲦 鲧 鲨 鲩 鲫 鲭 鲮 鲰 鲱 鲲
F6F0  鲳 鲴 鲵 鲶 鲷 鲺 鲻 鲼 鲽 鳄 鳅 鳆 鳇 鳊 鳋  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F7A0     鳌 鳍 鳎 鳏 鳐 鳓 鳔 鳕 鳗 鳘 鳙 鳜 鳝 鳟 鳢
F7B0  靼 鞅 鞑 鞒 鞔 鞯 鞫 鞣 鞲 鞴 骱 骰 骷 鹘 骶 骺
F7C0  骼 髁 髀 髅 髂 髋 髌 髑 魅 魃 魇 魉 魈 魍 魑 飨
F7D0  餍 餮 饕 饔 髟 髡 髦 髯 髫 髻 髭 髹 鬈 鬏 鬓 鬟
F7E0  鬣 麽 麾 縻 麂 麇 麈 麋 麒 鏖 麝 麟 黛 黜 黝 黠
F7F0  黟 黢 黩 黧 黥 黪 黯 鼢 鼬 鼯 鼹 鼷 鼽 鼾 齄  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F8A0                   
F8B0                 
F8C0                 
F8D0                 
F8E0                 
F8F0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
F9A0                   
F9B0                 
F9C0                 
F9D0                 
F9E0                 
F9F0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FAA0                   
FAB0                 
FAC0                 
FAD0                 
FAE0                 
FAF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FBA0                   
FBB0                 
FBC0                 
FBD0                 
FBE0                 
FBF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FCA0                   
FCB0                 
FCC0                 
FCD0                 
FCE0                 
FCF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FDA0                   
FDB0                 
FDC0                 
FDD0                 
FDE0                 
FDF0                  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
FEA0                   
FEB0                 
FEC0                 
FED0                 
FEE0                 
FEF0                  </pre>
<p>GB2312编码表下载点击 <a class="downloadlink" href="http://witmax.cn/downloads/45" title="版本： 已下载107次" target="_blank">GB2312编码表</a></p>
<p>参考资料：</p>
<p>1. <a href="http://blog.csdn.net/HEROWANG/archive/2008/06/10/2532339.aspx" target="_blank">GB2312编码规则</a></p>
<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Funicode-list.html&from=http%3A%2F%2Fwitmax.cn%2Fgb2312.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">Unicode编码表</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></content:encoded>
			<wfw:commentRss>http://witmax.cn/gb2312.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Unicode编码表</title>
		<link>http://witmax.cn/unicode-list.html</link>
		<comments>http://witmax.cn/unicode-list.html#comments</comments>
		<pubDate>Fri, 12 Feb 2010 08:25:33 +0000</pubDate>
		<dc:creator>晴枫</dc:creator>
				<category><![CDATA[程序开发]]></category>
		<category><![CDATA[Unicode]]></category>
		<category><![CDATA[字符编码]]></category>

		<guid isPermaLink="false">http://witmax.cn/?p=704</guid>
		<description><![CDATA[ 以下为Unicode编码清单，具体字符的编码表请下载 1.  【0020-007F】 Basic Latin 基本拉丁字母 2.  【00A0-00FF】 Latin-1 Supplement 拉丁字母补充-1 3.  【0100-017F】 Latin Extended-A 拉丁字母扩充-A 4.  【0180-023F】 Latin Extended-B 拉丁字母扩充-B 5.  【0250-02AF】 IPA Extensions 国际音标扩充 6.  【02B0-02EF】 Spacing Modifier Letters 进格修饰字符 7.  【0300-036F】 Combining Diacritical Marks 组合音标附加符号 8.  【0370-03FF】 Greek and Coptic 希腊字母 9.  【0400-04FF】 Cyrillic 西里尔字母 10. 【0500-052F】 Cyrillic Supplement 西里尔字母补充 11. 【0530-058F】 [...]<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></description>
			<content:encoded><![CDATA[<p> 以下为Unicode编码清单，具体字符的编码表请下载<a class="downloadlink" href="http://witmax.cn/downloads/23" title="版本： 已下载1136次" target="_blank">Unicode编码表</a></p>
<p>1.  【0020-007F】 Basic Latin 基本拉丁字母</p>
<p>2.  【00A0-00FF】 Latin-1 Supplement 拉丁字母补充-1</p>
<p>3.  【0100-017F】 Latin Extended-A 拉丁字母扩充-A</p>
<p>4.  【0180-023F】 Latin Extended-B 拉丁字母扩充-B</p>
<p>5.  【0250-02AF】 IPA Extensions 国际音标扩充</p>
<p><span id="more-704"></span></p>
<p>6.  【02B0-02EF】 Spacing Modifier Letters 进格修饰字符</p>
<p>7.  【0300-036F】 Combining Diacritical Marks 组合音标附加符号</p>
<p>8.  【0370-03FF】 Greek and Coptic 希腊字母</p>
<p>9.  【0400-04FF】 Cyrillic 西里尔字母</p>
<p>10. 【0500-052F】 Cyrillic Supplement 西里尔字母补充</p>
<p>11. 【0530-058F】 Armenian 亚美尼亚文</p>
<p>12. 【0590-05FF】 Hebrew 希伯来文</p>
<p>13. 【0600-06FF】 Arabic 基本阿拉伯文</p>
<p>14. 【0700-074F】 Syriac 叙利亚文</p>
<p>15. 【0750-077F】 Arabic Supplement 阿拉伯文补充</p>
<p>16. 【0780-07BF】 Thaana 塔纳文</p>
<p>17. 【07C0-07FF】 N&#8217;Ko </p>
<p>18. 【0900-097F】 Devanagari 天城体梵文字母</p>
<p>19. 【0980-09FF】 Bengali 孟加拉国文</p>
<p>20. 【0A00-0A7F】 Gurmukhi 古尔穆基文</p>
<p>21. 【0A80-0AFF】 Gujarati 古吉拉特文</p>
<p>22. 【0B00-0B7F】 Oriya 奥里亚文</p>
<p>23. 【0B80-0BFF】 Tamil 泰米尔文</p>
<p>24. 【0C00-0C7F】 Telugu 泰卢固文</p>
<p>25. 【0C80-0CFF】 Kannada 卡纳达文</p>
<p>26. 【0D00-0D7F】 Malayalam 马拉亚拉姆文</p>
<p>27. 【0D80-0DFF】 Sinhala 僧伽罗文</p>
<p>28. 【0E00-0E7F】 Thai 泰文</p>
<p>29. 【0E80-0EFF】 Lao 老挝文；寮国文</p>
<p>30. 【0F00-0FFF】 Tibetan 藏文</p>
<p>31. 【1000-109F】 Myanmar 缅甸文</p>
<p>32. 【10A0-10FF】 Georgian 格鲁吉亚文</p>
<p>33. 【1100-11FF】 Hangul Jamo 谚文字母</p>
<p>34. 【1200-137F】 Ethiopic 埃塞俄比亚文</p>
<p>35. 【1380-139F】 Ethiopic Supplement 埃塞俄比亚文补充</p>
<p>36. 【13A0-13FF】 Cherokee 切罗基文</p>
<p>37. 【1400-167F】 Unified Canadian Aboriginal Syllabics 加拿大土著统一音节文字</p>
<p>38. 【1680-169F】 Ogham 欧甘文</p>
<p>39. 【16A0-16FF】 Runic 北欧古文</p>
<p>40. 【1700-171F】 Tagalog 他加禄文</p>
<p>41. 【1720-173F】 Hanunoo 哈努诺文</p>
<p>42. 【1740-175F】 Buhid 布什德文</p>
<p>43. 【1760-177F】 Tagbanwa 塔格巴努亚文</p>
<p>44. 【1780-17FF】 Khmer 高棉文</p>
<p>45. 【1800-18AF】 Mongolian 蒙古文</p>
<p>46. 【1900-194F】 Limbu 林布文</p>
<p>47. 【1950-197F】 Tai Le 傣哪文；德宏傣文</p>
<p>48. 【1980-19DF】 New Tai Lue 新傣仂文</p>
<p>49. 【19E0-19FF】 Khmer Symbols 高棉符号</p>
<p>50. 【1A00-1A1F】 Buginese 布吉文</p>
<p>51. 【1B00-1B7F】 Balinese 巴利文</p>
<p>52. 【1D00-1D7F】 Phonetic Extensions 音标扩充</p>
<p>53. 【1D80-1DBF】 Phonetic Extensions Supplement 音标扩充补充</p>
<p>54. 【1DC0-1DFF】 Combining Diacritical Marks Supplement 组合音标附加符号</p>
<p>55. 【1E00-1EFF】 Latin Extended Additional 拉丁字母扩充附加</p>
<p>56. 【1F00-1FFF】 Greek Extended 希腊文扩充</p>
<p>57. 【2000-206F】 General Punctuation 一般标点符号</p>
<p>58. 【2070-209F】 Superscripts and Subscripts 下标及上标</p>
<p>59. 【20A0-20CF】 Currency Symbols 货币符号</p>
<p>60. 【20D0-20FF】 Combining Diacritical Marks for Symbols 符号用组合附加符号</p>
<p>61. 【2100-214F】 Letterlike Symbols 似字母符号</p>
<p>62. 【2150-218F】 Number Forms 数字形式</p>
<p>63. 【2190-21FF】 Arrows 箭头符号</p>
<p>64. 【2200-22FF】 Mathematical Operators 数学运算符号</p>
<p>65. 【2300-23FF】 Miscellaneous Technical 混合专门符号</p>
<p>66. 【2400-243F】 Control Pictures 控制图像</p>
<p>67. 【2440-245F】 Optical Character Recognition 光学字符识别</p>
<p>68. 【2460-24FF】 Enclosed Alphanumerics 括号字母数字</p>
<p>69. 【2500-257F】 Box Drawing 制表符</p>
<p>70. 【2580-259F】 Block Elements 区块组件</p>
<p>71. 【25A0-25FF】 Geometric Shapes 几何形状</p>
<p>72. 【2600-26FF】 Miscellaneous Symbols 混合什锦符号</p>
<p>73. 【2700-27BF】 Dingbats 什锦符号</p>
<p>74. 【27C0-27EF】 Miscellaneous Mathematical Symbols-A 混合数学符号-A</p>
<p>75. 【27F0-27FF】 Supplemental Arrows-A 补充性箭头符号-A</p>
<p>76. 【2800-28FF】 Braille Patterns 盲文；盲人点字</p>
<p>77. 【2900-297F】 Supplemental Arrows-B 补充性箭头符号-B</p>
<p>78. 【2980-29FF】 Miscellaneous Mathematical Symbols-B 混合数学符号-B</p>
<p>79. 【2A00-2AFF】 Supplemental Mathematical Operators 补充性数学运算符号</p>
<p>80. 【2B00-2BFF】 Miscellaneous Symbols and Arrows 混合什锦符号和箭头符号</p>
<p>81. 【2C00-2C5F】 Glagolitic 格拉戈尔字母</p>
<p>82. 【2C60-2C7F】 Latin Extended-C 拉丁字母扩充-C</p>
<p>83. 【2C80-2CFF】 Coptic 科普特文</p>
<p>84. 【2D00-2D2F】 Georgian Supplement 格鲁吉亚文补充</p>
<p>85. 【2D30-2D7F】 Tifinagh 提非纳格字母</p>
<p>86. 【2D80-2DDF】 Ethiopic Extended 埃塞俄比亚文扩充</p>
<p>87. 【2E00-2E7F】 Supplemental Punctuation 补充性标点符号</p>
<p>88. 【2E80-2EFF】 CJK Radicals Supplement 中日韩部首补充</p>
<p>89. 【2F00-2FDF】 Kangxi Radicals 康熙部首</p>
<p>90. 【2FF0-2FFF】 Ideographic Description Characters 汉字结构描述字符</p>
<p>91. 【3000-303F】 CJK Symbols and Punctuation 中日韩符号和标点</p>
<p>92. 【3040-309F】 Hiragana 平假名</p>
<p>93. 【30A0-30FF】 Katakana 片假名</p>
<p>94. 【3100-312F】 Bopomofo 注音符号</p>
<p>95. 【3130-318F】 Hangul Compatibility Jamo 谚文兼容字母</p>
<p>96. 【3190-319F】 Kanbun 汉文标注号</p>
<p>97. 【31A0-31BF】 Bopomofo Extended 注音符号扩充</p>
<p>98. 【31C0-31EF】 CJK Strokes 中日韩笔画部件</p>
<p>99. 【31F0-31FF】 Katakana Phonetic Extensions 片假名音标扩充</p>
<p>100.【3200-32FF】 Enclosed CJK Letters and Months 中日韩括号字母及月份</p>
<p>101.【3300-33FF】 CJK Compatibility 中日韩兼容字符</p>
<p>102.【3400-4DBF】 CJK Unified Ideographs Extension A 中日韩统一表意文字扩充A</p>
<p>103.【4DC0-4DFF】 Yijing Hexagram Symbols 易经六十四卦象</p>
<p>104.【4E00-9FFF】 CJK Unified Ideographs 中日韩统一表意文字</p>
<p>105.【A000-A48F】 Yi Syllables 彝文音节</p>
<p>106.【A490-A4CF】 Yi Radicals 彝文字母</p>
<p>107.【A700-A71F】 Modifier Tone Letters 声调符号</p>
<p>108.【A720-A7FF】 Latin Extended-D 拉丁字母扩充-D</p>
<p>109.【A800-A82F】 Syloti Nagri </p>
<p>110.【A840-A87F】 Phags-pa 八思巴字母</p>
<p>111.【AC00-D7AF】 Hangul Syllables 谚文音节</p>
<p>112.【D800-DB7F】 High Surrogates 高半代用区</p>
<p>113.【DB80-DBFF】 High Private Use Surrogates 高半专用代用区</p>
<p>114.【DC00-DFFF】 Low Surrogates 低半代用区</p>
<p>115.【E000-F8FF】 Private Use Area 专用区</p>
<p>116.【F900-FAFF】 CJK Compatibility Ideographs 中日韩兼容表意文字</p>
<p>117.【FB00-FB4F】 Alphabetic Presentation Forms 字母变体显现形式</p>
<p>118.【FB50-FDFF】 Arabic Presentation Forms-A 阿拉伯文变体显现形式-A</p>
<p>119.【FE00-FE0F】 Variation Selectors 字型变换选取器</p>
<p>120.【FE10-FE1F】 Vertical Forms 竖式标点</p>
<p>121.【FE20-FE2F】 Combining HalF】 Marks 组合半角标示</p>
<p>122.【FE30-FE4F】 CJK Compatibility Forms 中日韩相容形式</p>
<p>123.【FE50-FE6F】 Small Form Variants 小写变体</p>
<p>124.【FE70-FEFF】 Arabic Presentation Forms-B 阿拉伯文变体显现形式-B</p>
<p>125.【FF00-FFEF】 Halfwidth and Fullwidth Forms 半角及全角字符</p>
<p>126.【FFF0-FFFF】 Specials 特殊区域</p>
<p>127.【10000-1007F】 Linear B Syllabary 线形文字B音节文字</p>
<p>128.【10080-100FF】 Linear B Ideograms 线形文字B表意文字</p>
<p>129.【10100-1013F】 Aegean Numbers 爱琴数字</p>
<p>130.【10140-1018F】 Ancient Greek Numbers 古希腊数字</p>
<p>131.【10300-1032F】 Old Italic 古意大利文</p>
<p>132.【10330-1034F】 Gothic 哥特文</p>
<p>133.【10380-1039F】 Ugaritic 乌加里特楔形文字</p>
<p>134.【103A0-103DF】 Old Persian 古波斯文</p>
<p>135.【10400-1044F】 Deseret 犹他大学音标</p>
<p>136.【10450-1047F】 Shavian 肃伯纳字母</p>
<p>137.【10480-104AF】 Osmanya </p>
<p>138.【10800-1083F】 Cypriot Syllabary 塞浦路斯音节文字</p>
<p>139.【10900-1091F】 Phoenician 腓尼基字母</p>
<p>140.【10A00-10A5F】 Kharoshthi 佉卢字母</p>
<p>141.【12000-123FF】 Cuneiform 楔形文字</p>
<p>142.【12400-1247F】 Cuneiform Numbers and Punctuation 楔形文字数字及标点</p>
<p>143.【1D000-1D0FF】 Byzantine Musical Symbols 东正教音乐符号</p>
<p>144.【1D100-1D1FF】 Musical Symbols 音乐符号</p>
<p>145.【1D200-1D24F】 Ancient Greek Musical Notation 古希腊音乐谱记号</p>
<p>146.【1D300-1D35F】 Tai Xuan Jing Symbols 太玄经符号</p>
<p>147.【1D360-1D37F】 Counting Rod Numerals 算筹记数式</p>
<p>148.【1D400-1D7FF】 Mathematical Alphanumeric Symbols 数学用字母数字符号</p>
<p>149.【20000-2A6DF】 CJK Unified Ideographs Extension B 中日韩统一表意文字扩充B</p>
<p>150.【2F800-2FA1F】 CJK Compatibility Ideographs Supplement 中日韩兼容表意文字补充</p>
<p>151.【E0000-E007F】 Tags 语言编码卷标</p>
<p>152.【E0100-E01EF】 Variation Selectors Supplement 字型变换选取器补充</p>
<p>153.【FFF80-FFFFF】 Supplementary Private Use Area-A 补充专用区-A</p>
<p>154.【10FF80-10FFFF】 Supplementary Private Use Area-B 补充专用区-B</p>
<table class="wumii-related-items" cellspacing="0" cellpadding="2" border="0" width="100%" style="clear: both;">
    
    <tr>
        <td ><b><font size="-1"  style="display: block !important; padding: 20px 0 5px !important;">猜您喜欢：</font></b></td>
    </tr>
    
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fcharacter-encoding-notes.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fgb2312.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">GB2312区位码、编码表与编码规则</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fnetbeans-default-encoding.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【NetBeans】设置打开文件时的默认文件编码</font>
                    </a>
                </td>
            </tr>
            <tr>
                <td style="margin: 0 !important; padding: 0 !important; line-height: 20px !important;">
                    <img border="0" src="http://static.wumii.com/images/widget/widget_solidPoint.gif">
                    <a target="_blank" style="text-decoration: none !important;" href="http://app.wumii.com/ext/redirect?url=http%3A%2F%2Fwitmax.cn%2Fphp-chinese-word-count.html&from=http%3A%2F%2Fwitmax.cn%2Funicode-list.html">
                        <font size="-1" color="#333333" style="line-height: 1.65em; font-size: 12px !important;">【PHP】统计中英文单词数（GB2312/UTF-8编码)</font>
                    </a>
                </td>
            </tr>
    
    <tr>
        <td  align="right">
            <a style="text-decoration: none !important;" href="http://www.wumii.com/widget/relatedItems" target="_blank" title="无觅相关文章插件">
                <font size="-1" color="#bbbbbb" style="display: block !important; font-family: arial !important; padding: 5px 0 !important; font-size: 12px !important; color: #bbb !important;">无觅</font>
            </a>
        </td>
    </tr>
</table>]]></content:encoded>
			<wfw:commentRss>http://witmax.cn/unicode-list.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

