海纳百川

登录 | 登录并检查站内短信 | 个人设置 网站首页 |  论坛首页 |  博客 |  搜索 |  收藏夹 |  帮助 |  团队  | 注册  | RSS
主题: 中文与高信息熵表述
回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇
阅读上一个主题 :: 阅读下一个主题  
作者 中文与高信息熵表述   
芦笛
[博客]
[个人文集]

论坛管理员




加入时间: 2004/02/14
文章: 31805

经验值: 519217


文章标题: 中文与高信息熵表述 (659 reads)      时间: 2010-1-14 周四, 上午1:27

作者:芦笛驴鸣镇 发贴, 来自 http://www.hjclub.org

中文与高信息熵表述


所谓信息熵,乃是对信息不确定性的定量评估。熵值越高,则信息不确定性也就越高,接收者也就越发无所适从。据专业人士计算,在联合国五种工作语言中,其他四种(英法俄西)的平均信息熵约等于4,而中文的竟然高达9.65,说明中文作为信息载体的不确定性是其他那四种的两倍以上。

这说的是语言整体评估,并不是在微观水平检视语言的运用。在实践中,由于民族文化传统的影响,国人对模糊表述有执着爱好,从而极大地增大了信息熵。例如民间俗话有云“口毒心不毒”,而樊教授由此作出了“口毒也是毒”的论断。如果审视这个例子,立刻就能发现那信息熵高到使接收者几乎无法破译信息的地步。 “口毒”这个词至少有五种涵义,要把它与“心毒”和“毒”这两个概念的所有涵义组合起来,一共可有31种组合,随机猜中正确涵义的概率也就是1/31。若不使用密码侦破术,逐个排除较小概率事件,就无法判明“口毒心不毒”与“口毒也是毒”的准确涵义。

不懂数理的读者可以从此例看出所谓“高信息熵”是怎么回事。说白了,那其实就是“言简意赅”。在写作信息时,所用语言越精练,使用的字符越少,涵义也就越丰富,写成的信息的不确定性也就越高,读者也就越摸不着头脑,这种语言作为信息传递工具也就越不合格。因此可以说,在艺术语言中,言简意赅可以造成一种“朦胧美”的特殊艺术效果,但作为学术语言,越是言简意赅便越是垃圾(这当然只指叙述性学术语言,不包括数学语言,后者的信息熵为零。例如“100”这个信息的误解概率为零)。

由此可见,在学术问题上,“简练”并不是一种好事,缺乏一定的“冗余”会造成语义多歧,具有一定“冗余”则能防止误解。好莱坞电影上,长官下重大命令时常重复一遍就是这个道理。因此,合理的信息系统的设计应有 “以一定冗余保证确定性”这条,生物信息系统就是最有力的证明。遗传密码的“防错系统”就是靠多余的密码子来保证某些核苷酸的点突变不至于引起氨基酸的点突变。在此,密码子的冗余在一定程度上保证了遗传信息的稳定准确传递。

以此观点比较不同语种,不难看出汉语相对于多音节语言是一种落后交流工具。在同种语言中,作为学术语言,现代中文远远强过古文,而同是使用现代中文,使用清晰概念表达清晰思维的文章又远远强过“伪善亦善,伪恶亦恶,口毒亦毒”之类垃圾。

当然,这不是说使用高信息熵表述就一点好处都没有,艺术创作不必说,它最大的“优越性”还在政治中。第一个“优越性”已经由樊教授在上例中充分演示过了,因为“口毒”无所不包,囊括了各种性质不同的逆耳之言,它便成了个“乾坤一气袋”,把所有的异议者都当成“人格谋杀犯”一股脑儿装进去。而这正是毛泽东的绝活,什么“横扫一切牛鬼蛇神”、“触及灵魂”、“斗私批修”、“破旧立新”、“不破不立,不塞不流,不止不行”、“矫枉必须过正,不过不能矫枉”等等,都是大众熟知的例子。

它的第二个“优点”,就是在模糊口号造成巨大灾难后,提出者可以靠诡辩轻易脱罪。这也是毛泽东的惯伎,其中最有名的例子,便是他在反右后推出的“阳谋”说,以及“右派分子不光是言者还是行者,‘言者无罪’这条用不上”。在网战中,它可以保证高手们在侮辱他人(谋杀人格?)之后轻易逃避言责。例如,樊先生可以辩称他说的“口毒”是专指诽谤造谣,并证明我确实谋杀了他人人格,必须以血偿血,以命抵命。不过就算他真这么诡辩,也仍然无法否认自己把性质完全不同的言行熬在一锅里,不分青红皂白统统判为 “人格谋杀罪”,而这正是毛共文字狱吏的对口专业。

当然,不是所有刻意使用高信息熵表述的人都是为这些目的。使用这种表述的第三个“优点”倒是无害的,那就是它能最经济有效地卖弄“浓缩的深沉智慧”,乃是充哲人的捷径。

这秘诀说穿一钱不值,使用高信息熵表述,能给信息的接收者造成一种离奇境界:对那信息好像什么都懂,又好像什么都不懂。要让读者进入这种理想境界,哲人就务必把握好分寸,确保读者处于幽明两界之间。如果完全不懂,读者就会丧失兴趣;如果明白如话,则读者就会看穿作者的浅薄。因此,一定要将熵值把握得恰到好处,让读者似懂非懂,忍不住要去琢磨,越琢磨便越有味,如同吃橄榄一般。他不知道那乃是因为作者所用概念模糊混乱,语义多歧,随便你怎么加入自己的理解都行,无论往哪个方向想,都能想出道理来,而且越想涵义越多,却以为作者是转世苏格拉底,越想便越佩服无地。

简言之,看这种文字有如观赏雾中山水,那艺术创造其实是由读者和作者共同完成的。这就是《老子》的永恒魅力所在,那不是什么哲学思辩的深邃而是朦胧艺术引起的迷糊沉醉。

就连黑格尔都有这毛病。在西方所有大哲学家中,唯有他以obscurity(模糊不清)和ambiguity(语义多歧)著称,而且他有意不去澄清因自己模棱两可引起争议的观点,尽管许多争论是在他在世时就爆发了的。最有名的就是所谓“合理即存在,存在即合理”。英文是:

What is rational is actual. What is actual is rational.

对这警句到底该怎么理解,在所谓“黑格尔主义者”中引起了激烈辩论。一派认为老黑的意思是说,所有存在的事物,包括当时的普鲁士国家在内,都是合理的。另一派则认为那意思是,只有合理的才能存在。因此,如果不合理,哪怕存在(existing),也不是actual的(很遗憾,我无法用中文转达这意思)。

不难看出,这两种理解截然相反。右派可以用它来为现状辩护──“存在即合理,本政府既然存在,当然合理”,而左派可以用它来反对现状──“合理才能存在,政府不合理,所以它必然不能存在。”黑格尔的门徒由此分为两派,保守派与所谓“青年黑格尔派”(马克思曾是其中一员)的愤青们激辩不休。政治上的两极竟能使用同一语录作为自己的精神指南,堪称文革两大派先驱,说明但凡所谓“辩证思维”搅和进来之处就必然是混沌世界。

正因为咱们来自备受辩证法荼毒的弱智之邦,新时代的哲人们就必然酷爱高信息熵表述,不信请看胡平先生这些名言:

“真正的宽容是很不容易的。当你对某件事热情执着时,你往
往很难宽容;在你轻易表示宽容的地方,往往是由于你对那件
事根本无动于衷。

谁不甘于平庸,谁就不再平庸。平庸不平庸,不仅要看状态,
更要看趋势。

忍者的画像:闭上眼睛,竖起耳朵。

真理必须面向公众。你不能对光说:‘只照你自己。’

没有理解,焉有谅解?没有直道,何来恕道?

你在孔雀开屏时偏偏只去看它的屁股,那不是孔雀有缺陷而是
你自己没品味。

不正经的人可恶,太正经的人可怕。

骄傲就是你觉得有很多人在羡慕地注视着你。

坦率与粗野,只有一线之隔。”

怎么样,您是否觉得作者跟伊索或老聃似的,难以思议地聪明?可您能否写个读后感,说清楚您从中获得了什么教益,还能不和别的胡迷发生激辩?

兴许,为了中国人实现思维现代化,必须废除现代中文里的“高信息熵分子”亦即单音节词语成分,废止文言文教育。当然,我这主张或许缺乏可行性,可行的还是在现有系统中尽可能修修补补。当前最重要的问题,还是教会未来的知识分子们养成使用明确概念进行思维并准确表达的习惯。


(本文摘自旧作 http://www.hjclub.info/bbs/viewtopic.php?p=2646308

作者:芦笛驴鸣镇 发贴, 来自 http://www.hjclub.org
返回顶端
阅读会员资料 芦笛离线  发送站内短信
显示文章:     
回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇 所有的时间均为 北京时间


 
论坛转跳:   
不能在本论坛发表新主题
不能在本论坛回复主题
不能在本论坛编辑自己的文章
不能在本论坛删除自己的文章
不能在本论坛发表投票
不能在这个论坛添加附件
可以在这个论坛下载文件


based on phpbb, All rights reserved.
[ Page generation time: 0.662528 seconds ] :: [ 24 queries excuted ] :: [ GZIP compression enabled ]