使用Word或者是其他之类编辑环境的时候很多我们有这样一个需求,那就是对于编辑区之中的文本汉字进行统计。对于office来说这很简单,在工具菜单之中就是有字数统计,WPS或者是高版本的Office直接在状态栏之中可以看到字数。但是这些字数真的是正确吗?
中文和朝鲜语字符的含义
实际之上在Office和Word之中所统计的字符都是中文和朝鲜语字符个数,并且这必须设置才是可以真正的技术。在这种模式之中其把连续的英文字母也是计算为一个汉字。显然这不符合我们计算纯粹汉字的需求。
如何计算文本之中纯汉字个数
如果我们连接了网络的话,那么可以在网络之上寻找到很多网页版本的汉字个数计算应用,把自己word之中的文本复制到网页之中就是可以完成计算。
虽然说这是一个计算方法,但是必须存在网络环境,并且我们从编辑环境切换到浏览器之间会浪费大量的时间,显然这不是一个最好的方案。
最准确的汉字计算方法
利用正则表达式可以快速的完成汉字统计,但是对于用户来说我们大多数情况之下都是必须通过编程的方式操作正则表达式,这里给出具体表达表达式VB版本的实现代码:
len = Regex.Matches(RichTextBox2.Text, ”[\u4e00-\u9fa5]“).Count。
实际之上在powershell之中也是存在对于正则表达式支持的文本管理巩固,利用这些工具我们也是可以在windows操作系统之中随意统计文本之中的汉字个数。