海纳百川

登录 | 登录并检查站内短信 | 个人设置 网站首页 |  论坛首页 |  博客 |  搜索 |  收藏夹 |  帮助 |  团队  | 注册  | RSS
主题: 转帖:从闪农的信息熵看中文的信息产业的发展!冬冬你不是学数学的吗?接招吧你!
回复主题   printer-friendly view    海纳百川首页 -> 罕见奇谈
阅读上一个主题 :: 阅读下一个主题  
作者 转帖:从闪农的信息熵看中文的信息产业的发展!冬冬你不是学数学的吗?接招吧你!   
所跟贴 启明:现在有事走开一会,过1小时俺告诉您什么作者是在蒙人 -- Anonymous - (0 Byte) 2005-1-14 周五, 上午9:54 (82 reads)
无业游民
[博客]
[个人文集]

游客









文章标题: 要不是这么多人看着,俺都懒得写这一贴了。算给别人看的科普把。 (116 reads)      时间: 2005-1-14 周五, 上午11:21

作者:Anonymous罕见奇谈 发贴, 来自 http://www.hjclub.org

通常概念的熵是指对混乱程度的测量。而在信息论中,熵被定义为不确定度的测量,看上去两者还是相当一致的。谈到信息,就要谈到对意义的编码。为了确定某个意义所包含的信息量,可以用消除这个意义的不确定性所需要的努力来量化。信息论不去讨论具体意义,仅仅抽象地用数学方式研究信息编码。

举个通俗的例子:假定在某个编码系统全部由答案为是/否的问题组成,我们研究一个意义,比如您家住在那里。我们假定编码系统足够好,问足够多的问题能够确定任何地方。假如问了十个问题,您都回答了是或否,最后就能确定你家的住址,那么在这个编码系统中,“您家的住址”这么个意义其包含的信息量为10个bit。

先别管花里胡哨的公式,如果您愿意,您可以把一个bit可以看成在某个编码系统中为了确定意义的一部分,对于某个问题是或者否的回答。比如越南人问您的问题,答案是:其信息量为1bit。布什不是当选就是落选。您自己搞不懂,却误以为他在胡扯。

您转贴的文章首先对信息熵的概念表达得含混不清,在没有解释清楚的情况下大量使用公式来吓唬人,在很多地方又错误地使用概念。比如二进制和十进制的数字,其实这两者是对同一意义的不同编码方式,对于同一个数字其信息量是一样的。作者很有点想当然的味道。

比较简单的意义比如您家的住址可能容易编码,而确定抽象意义所包含的信息量则非常地复杂和困难。要量化地衡量不同语言的效率,可能要在无穷维空间当中进行,而不能用4.7、3.9这样的一维数据去比较。

不能说那些作者自己还没搞动就拿来唬人的研究完全没有意义,但是用来判断那种语言的优劣或传达意义效率的高低是胡扯

越南人,俺有错误清指出

作者:Anonymous罕见奇谈 发贴, 来自 http://www.hjclub.org
返回顶端
显示文章:     
回复主题   printer-friendly view    海纳百川首页 -> 罕见奇谈 所有的时间均为 北京时间


 
论坛转跳:   
不能在本论坛发表新主题
不能在本论坛回复主题
不能在本论坛编辑自己的文章
不能在本论坛删除自己的文章
不能在本论坛发表投票
不能在这个论坛添加附件
不能在这个论坛下载文件


based on phpbb, All rights reserved.
[ Page generation time: 0.043991 seconds ] :: [ 22 queries excuted ] :: [ GZIP compression enabled ]