第三千一百零八章统一码大会-重生之乘风而起-开心书阁

讲代表，却是麦小苗。

用周至的话说，自己搞出来瀚文大字库，只代表着过去，而麦小苗基于瀚文大字库上搞出来的搜索引擎，以及驱动引擎的非线性匹配算法，才真正代表着未来。

麦小苗演讲的题目叫做《汉语在未来信息世界里的重要性》。

“作为最古老的象形文字，汉语有一项对于信息技术来讲最神奇的特性，那就是它的单位信息量。”

“以《联合国宪章》为例，中文版的《联合国宪章》有26650个字符，而英文版则需要55600个字符，在排版统一的情况下，中文文件的厚度一般只有英文等字母形语言的一半。”

“因此作为书面文字，汉字是这个星球上最高效，信息密度最高的文字。”

“究其根本原因，是因为字母形文字是‘一维’的，只代表了声音，而汉字是二维的，不仅仅代表声音，还封装了海量的信息。”

“这种信息还可以自由组合，用极简的方式完成派生词的产生。”

“比如国际化这个词，用英文表述需要二十个字符，用中文只需要三个字符，换成信息技术的表述，英文需要二十比特，而中文只需要六比特。”

“根据香农信息熵的研究，字符的信息熵为4比特，而汉字的信息熵为9.65比特，也就是说，在以计算机技术为主的信息世界里，中文可以比其余文字，以更小容量的信息载体，更快的速度，记录和传播更大的信息量。”

“比如中文的舅舅一词，只有四个比特，而要用英文来准确瞄准，则需要以‘妈妈的哥哥’来表示，中文词汇在这里还包含了血缘，辈分，性别三个维度的信息量，这是声音记录类字符型文字所无法表达的。”

“除了记录的效率，还有读取的效率。”麦小苗在台上侃侃而谈：“中国有个成语叫做‘一目十行’，意思就是中文信息的读取可以是面积式的，图形化的。”

“四叶草实验室做过一个有趣的实验，那就是将固定中文词汇的排列顺序予以打乱，然后制作出文本交给读者阅读，读者们可以惊奇地发现，混乱的词汇语序搭配正确的中文语法，并不会对阅读理解造成任何影响。”

“也就是说，‘实验’和‘验实’在文章里的作用是一样的，错误的排序会被中文使用者在下意识层面完成自动纠正。”

“人类的大脑在阅读时主要涉及两条通路，一条叫背侧通路，主要进行语音识别，一条叫腹侧通路，主要进行视觉处理和语意连接。”

　　本章未完，请点击下一页继续阅读！

看了《重生之乘风而起》的书友还喜欢看

权力巅峰：从省府秘书开始

作者：我叫江流儿

简介：纪委调查，晋升资格被抢，李承从审计局一个被排挤的科长开始，巧妙运用权术，官谋，人情世...

更新时间：2026-01-27 01:19:38

最新章节：第228章受害者

向上登攀

作者：老虎本尊

简介：林超一板砖搅黄领导车震，受到领导报复打压，众叛亲离，在人生最低谷时却被闪电提升，一路...

更新时间：2026-01-27 02:32:36

最新章节：第一卷第787章这丫头，怎么车开的比自己还猛？

妾本丝萝，只图钱帛

作者：锅包又又又

简介：【双洁+HE+强取豪夺+追妻+男主疯批腹黑，介意慎入】顾家抄家后，顾窈做了李聿的妾。...

更新时间：2026-01-26 23:47:44

最新章节：第355章两小只

本座王重一

作者：王道一

简介：本座王重一，又要突破啦！佛家法号：【法海】道家道号：【万寿】人间王号：【一字并肩大明...

更新时间：2026-01-27 00:02:00

最新章节：第9章这道号不错，老夫要了

开局饥荒年：从带全家打猎开始

作者：橙年岁月

简介： “夫君，为了这个家香火着想，妾身又给你安排了一桩婚事，你看可满意？”宁远意外穿越到了...

更新时间：2026-01-27 00:02:00

最新章节：第一卷第209章塔木部落危机来袭

盗墓：谛听开道冥府路

作者：冰泽陌璃

简介：【主角男+无女主+正文无CP（all）+私设+ooc预警+敌对阵营+美强不惨+张家男...

更新时间：2026-01-27 01:25:59

最新章节：第424章我能撤回一只野鸡吗？

第三千一百零八章 统一码大会

看了《重生之乘风而起》的书友还喜欢看

第三千一百零八章统一码大会