海纳百川
登录
|
登录并检查站内短信
|
个人设置
网站首页
|
论坛首页
|
博客
|
搜索
|
收藏夹
|
帮助
|
团队
|
注册
|
RSS
主题:
转帖:从闪农的信息熵看中文的信息产业的发展!冬冬你不是学数学的吗?接招吧你!
海纳百川首页
->
罕见奇谈
阅读上一个主题
::
阅读下一个主题
作者
转帖:从闪农的信息熵看中文的信息产业的发展!冬冬你不是学数学的吗?接招吧你!
所跟贴
启明:现在有事走开一会,过1小时俺告诉您什么作者是在蒙人
--
Anonymous
- (0 Byte) 2005-1-14 周五, 上午9:54
(82 reads)
无业游民
[
博客
]
[
个人文集
]
游客
标题:
要不是这么多人看着,俺都懒得写这一贴了。算给别人看的科普把。
(116 reads)
时间:
2005-1-14 周五, 上午11:21
作者:
Anonymous
在
罕见奇谈
发贴, 来自 http://www.hjclub.org
通常概念的熵是指对混乱程度的测量。而在信息论中,熵被定义为不确定度的测量,看上去两者还是相当一致的。谈到信息,就要谈到对意义的编码。为了确定某个意义所包含的信息量,可以用消除这个意义的不确定性所需要的努力来量化。信息论不去讨论具体意义,仅仅抽象地用数学方式研究信息编码。
举个通俗的例子:假定在某个编码系统全部由答案为是/否的问题组成,我们研究一个意义,比如您家住在那里。我们假定编码系统足够好,问足够多的问题能够确定任何地方。假如问了十个问题,您都回答了是或否,最后就能确定你家的住址,那么在这个编码系统中,“您家的住址”这么个意义其包含的信息量为10个bit。
先别管花里胡哨的公式,如果您愿意,您可以把一个bit可以看成在某个编码系统中为了确定意义的一部分,对于某个问题是或者否的回答。比如越南人问您的问题,答案是:其信息量为1bit。布什不是当选就是落选。您自己搞不懂,却误以为他在胡扯。
您转贴的文章首先对信息熵的概念表达得含混不清,在没有解释清楚的情况下大量使用公式来吓唬人,在很多地方又错误地使用概念。比如二进制和十进制的数字,其实这两者是对同一意义的不同编码方式,对于同一个数字其信息量是一样的。作者很有点想当然的味道。
比较简单的意义比如您家的住址可能容易编码,而确定抽象意义所包含的信息量则非常地复杂和困难。要量化地衡量不同语言的效率,可能要在无穷维空间当中进行,而不能用4.7、3.9这样的一维数据去比较。
不能说那些作者自己还没搞动就拿来唬人的研究完全没有意义,但是用来判断那种语言的优劣或传达意义效率的高低是胡扯
越南人,俺有错误清指出
作者:
Anonymous
在
罕见奇谈
发贴, 来自 http://www.hjclub.org
返回顶端
十个问题用十位BIT?你真敢开牙,还笑我不懂?你给的信息熵定义是你自己的吧?
--
启明
- (14 Byte) 2005-1-14 周五, 下午1:50
(81 reads)
显示文章:
所有文章
1天
7天
2周
1个月
3个月
6个月
1年
时间顺序
时间逆序
海纳百川首页
->
罕见奇谈
所有的时间均为 北京时间
论坛转跳:
您
不能
在本论坛发表新主题
您
不能
在本论坛回复主题
您
不能
在本论坛编辑自己的文章
您
不能
在本论坛删除自己的文章
您
不能
在本论坛发表投票
您
不能
在这个论坛添加附件
您
不能
在这个论坛下载文件
based on phpbb, All rights reserved.
[ Page generation time: 0.043991 seconds ] :: [ 22 queries excuted ] :: [ GZIP compression enabled ]