数学模型来把关 预测微博流行度-巴别场

巴别场

——分享有趣的数学    


订阅到鲜果 订阅到谷歌 订阅到抓虾 订阅到有道

数学模型来把关 预测微博流行度

转载自  风少泽  作者:佚名  发布时间:2013-7-16


据国外媒体报道,国外来自三所大学的研究人员提出了一个据说能够预测微博流行度的模型。


模型的公式并不在意微博的内容,而把侧重点放在Twitter上人们的行为和转发动作。麻省理工学院斯隆管理学院的助理教授Tauhid Zaman对Mashable说,“我不能告诉你什么样的微博会走红网络,但我可以马上告诉你哪个微博能火”。


Zaman以及来自华盛顿大学的Emily Fox和宾夕法尼亚大学沃顿商学院的Eric Bradlow研究出了一个模型,并在网上进行了演示。该插件叫做“Twouja”,“Twouija”一词本是Twitter和“Ouija board”(通灵板,国外很流行的一种游戏,用来预测未来)的合写。


在研究中,通过分析Twitter和Facebook这种社交网站的社会化数据,Zaman发现在被转发数量上,一个名人,如前篮球运动员林书豪和一个无名博客有明显区别。Zanman说,“但在固定一段时间之后,人们微博被转发的次数就趋于一致了”。


他们发现在微博发出去后的十分钟里,名人的微博和普通人的微博差不多,都能达到这条微博最终被转发总数的相似比例(差不多50%)。这项研究说明Twitter是昙花一现的,转瞬即逝。


Zaman说:“微博发出去后几分钟里的效果就预示了这条微博以后的能产生多大影响”。


比如说,在一条微博发出去10分钟后:名人的微博可以在10分钟内被转发125次,最终总共可能会被转发250词。而一个普通人的微博在10分钟内只被转发了3次,可能最终会被转发6次。


Zaman表示,这个微博流行度的计算模型用数学术语叫做“对数正态分布”,它的使用依据是人们行为的一致性:“它非常了不起,就好像把人气分成了好几个等级——他人对于一条博客的反应,和在发出后一段时间内被转发的次数占总次数的比例一样,都非常稳定”。


这意味着什么


Zaman面对Mashable博客的采访时表示,这个模型可以帮助社交媒体用户更好的把握时间线,得到更加精良的信息。这是因为,如果你关注了很多人,重要的博客可能会被大量的微博冲走,最终错失信息。他说可以通过对新出内容的流行度来进行排序,来生成用户的社交时间轴。“实际上可以建立一个系统,对时间轴上的内容进行排序,序的依据是两种度量方式:最终流行度和发出时间”。


他还说这个模型有可能会催发“微广告”。这种广告可以嵌在个人社交媒体的内容里,因为这个模型会预测出多少人会看到该内容。


“这样就不用再请名人了,你可以请那些可以吸引不少人眼球,但不怎么红的人”,他说。


去年,麻省理工学院的另一批研究人员透露,他们找到了预测Twitter舆论主题走向的办法,还称这种算法要比Twitter自己的计算公式更高效。