字符编码 - 枫芸志

【NetBeans】设置打开文件时的默认文件编码

14年前 (2011-10-08)

(adsbygoogle = window.adsbygoogle || []).push({}); 用netbeans打开utf-8编码的文件，其中的中文全部显示成了乱码，英文显示正常，说明是文件打开时的编码不对。设置步骤如下：找到你的Netbeans安装目录下的etc...

软件技巧 • 11,018次阅读• 2 回复

字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian

15年前 (2010-11-24)

程序开发 • 15,467次阅读• 2 回复

【PHP】统计中英文单词数（GB2312/UTF-8编码)

15年前 (2010-11-24)

英文单词的统计可以直接用php原生的函数str_word_count来进行统计。但这个函数对于中文汉字显得无能为力，无法准确统计到汉字个数。解决办法是根据汉字的编码规则，自己来实现中文汉字数统计和中英文单词数统计。汉字编码参考Unicode编码表和GB2312区位码、编码表与编码规则。对于GB2...

程序开发 • 18,225次阅读• 9 回复

GB2312区位码、编码表与编码规则

15年前 (2010-11-24)

GB2312共收录6763个汉字，其中一级汉字3755个，二级汉字3008个；同时收录包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。 GB2312区位码 GB2312对所收汉字进行了“分区”处理，每区含有94个汉字/符号。这种表示方式也称为区...

程序开发 • 58,200次阅读• 0 回复

Unicode编码表

16年前 (2010-02-12)

以下为Unicode编码清单，具体字符的编码表请下载[download id="23" format="3"] 1. 【0020-007F】 Basic Latin 基本拉丁字母 2. 【00A0-00FF】 Latin-1 Supplement 拉丁字母补充-1 3. 【0100-017F...

程序开发 • 56,156次阅读• 4 回复