优捷信达科技团队博客

优捷信达解密舆情监测:真能找网络谣言源头吗?

administrator | 04 九月, 2012 15:46

前不久,优捷信达科技在网络上发现一篇关于舆情监测的文章比较火,说瑞士科学家发明新数学算法,可找网络谣言源头,并可以用于监测谣言发起者和恐怖袭击幕后的智囊。以下为文章全文:

据新华社电,瑞士洛桑联邦工学院10日说,研究人员发明一种新的数学算法,能够找出网络谣言发起人。

佩德罗.平托在一个科研团队里研究算法。他告诉德新社记者:“使用我们的方法,仅通过‘监听’有限数量的成员,就能找到在网络传播的所有事物源头。”例如,调查人员查看15人 至20人的消 息后,可以找出经社交网站传递至500名网络用户的一则谣言最初从谁开始。

经事后分析,平托的团队识别出隐藏在美国“9.11”恐怖袭击幕后的智囊。平托说:“借助公开发表的消息,重新构建 ‘9.11’恐怖网络下交换的信息,系统给出3个潜在嫌疑人的名字。根据官方调查,其中一人确为恐怖袭击策划者。按洛桑联邦工学院说法,这一算法同样可以追踪电脑病毒起源。
 

作为国内领先的舆情监测企业,优捷信达公司研究员阅读并分析瑞士科学论文全文(阅读论文全文:请点击),发现其中的算法诀窍,由于目前客观条件的限制无法解决这几个瓶颈,所以瑞士科学家所发明的算法也无法实现找到源头的效果。

首先,分析这个算法的意义,这个应用不是找出是谁第一个发出的消息(因为发出时间不代表知道的时间),而在消息已经满天飞的时候找出真正这一条消息对应的源头。

其次,其主要问题是其假设网络本身是己知的,比如在微博上,谁是谁的粉丝都知道(原文中“The graph G is assumed to be known, at least approximately”)。而这个假设在实际中显然是行不通的,由于现实微博中粉丝相互关注情况异常复杂,更不要说现实中可能有一些“超级节点”,比如说姚晨,几乎所有人都是其粉丝。这样的话,假设网络本身是已知的这一前提条件无法得到满足。

第三,在这个假设下,瑞士科学教提出新算法所做的工作主要就是把原来“傻算”(论文中(1)式)的复杂度给降低了,而他提出的新算法也还是一个计算机计算的过程。如上所述,目前这个算法还不可能有实际应用。其给出的例子是一个500人的网络,还有一张不算大的地图。在实际应用中,这些图至少要大一千倍以上,而且结构要复杂得多。因此,即便是能满足前提条件,单就算法本身也无法实现现实世界中谣言的海量计算。

以这一理论的提出到实际应用,可能还有很多路要走。目前通过单一算法来实现寻找网络谣言源头还不太现实,只有采用专业的信息处理软件,通过收集大量信息,进行专业化处理,根据综合各方因素,才能评估出信息源头。

 
Copyright © 2009 Eucita Technologies Co.,Ltd. All Rights Reserved   |  Powered by LifeType