Modeling and Simulation
Vol.04 No.01(2015), Article ID:14752,6 pages
10.12677/MOS.2015.41001

Factors Analysis for Improved Information Dissemination Model on Microblog

Liang Li, Man Yu, Ping Sun, Gaoxia Wang*

College of Science, China Three Gorges University, Yichang Hubei

Email: *gaoxiawang@163.com

Received: Dec. 29th, 2014; accepted Jan. 18th, 2015; published Jan. 26th, 2015

Copyright © 2015 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

Microblog is a popular platform for the information dissemination of social networks, which plays an important role for communication and supervision of public voice. Based on the classic SIR model and the process of microblog information dissemination on the state transformation between user nodes, including easy disseminators, disseminators and silencers, the improved microblog dissemination model with certified users and absolute silencers was built. The factors affecting the spread of microblog information were analyzed and simulated. Researches show that the higher the transmission rate of authenticated users and the normal nodes, the lower the stop transmission rate, and the higher the rate of absolute silence, the sooner time to reach steady state of the microblog information dissemination. It has some theoretical basis and practical significance for actually controlling information dissemination of the popular social platform.

Keywords:Social Network, SIR Model, Certified User, Absolute Silence Node

改进的微博传播模型的影响因素分析

李 亮,余 曼,孙 平,王高峡*

三峡大学理学院,湖北 宜昌

Email: *gaoxiawang@163.com

收稿日期:2014年12月29日;录用日期:2015年1月18日;发布日期:2015年1月26日

摘 要

微博作为社会网络信息传播的热门平台,对舆论传播与监督具有重要作用。本文基于经典SIR传播模型,以微博信息在易传播者、传播者和沉默者之间的状态转换为基础,建立了基于认证用户和绝对沉默者的微博网络传播模型,并通过仿真分析了微博传播的影响因素。研究表明认证用户节点和普通节点的传播率越高,停止传播率越低或者绝对沉默率越高,则微博信息传播达到稳定状态越快,对实际控制社交平台的信息传播具有一定的理论分析依据和实践指导意义。

关键词 :社会网络,SIR模型,认证用户,绝对沉默节点

1. 引言

自然界和人类社会中的大量复杂系统都可以抽象为网络结构,反之复杂网络也可视为由若干节点通过一定方式连接而成的复杂系统[1] 。在Strogatz和Watt的小世界网络模型[2] ,Albert和Barabasi的无标度网络模型[3] 的基础上,众多学者致力于现实系统的网络特性实证研究,与此同时各个领域掀起了研究复杂网络的热潮[4] 。复杂网络理论不仅提供了探究现实生活中复杂系统的全新科学视角,而且成为改造客观世界的新方法和有力武器。

社交网络作为以信息交流为核心的服务平台,成为互联网发展的热点领域,包括Facebook、Bebo和Mini等。目前国内影响力最深的新浪微博,其日益攀升的用户规模和迅猛提升的影响力在国内掀起了“微革命”[5] 。基于微博网络平台,用户依据教育背景、兴趣爱好、职业背景等方面的差异,根据各自的喜好,可选择性地对其他用户关注,从而形成虚拟的“关系圈”。在此微博信息传播的“关系圈”中,“关系”用于表示信息传播用户之间某种特定的联系。基于复杂网络基本理论,微博用户可抽象为网络节点,用户关系抽象为网络连边,而连边方向表示信息传播的路径[6] 。微博信息传播网络本质上是社交网络,研究表明其具有无标度和小世界特性[7] 。

社会信息传播网络的研究分别基于不同机制的传播模型 [8] [9] 。Watts和Strogatz研究了SW网络模型,提出SW效应可加快传染病的传播过程。王林等人研究了SIS (Susceptible Infected Susceptible)和SIR (Susceptible Infected Recovered)模型与网络模型的联系[10] 。对于微博信息传播网络,若干学者以SIR模型为基础进行了相关研究[11] 。李可嘉,王义康以SIR模型为基础,研究了基于“热传播节点”的社交网络信息传播模型与仿真分析[12] 。刘丹等模拟了基于SIR模型的微博信息传播过程[13] 。本文根据微博传播的实际情况,在微博传播过程中提出“认证用户”和“绝对沉默节点”,建立了基于SIR的微博信息传播改进模型,通过模型仿真分析了实际微博传播网络参量对信息传播的影响因素。

2. 改进的微博信息传播模型

表示复杂网络的有向图,表示图G的邻接矩阵,其中V表示节点集,表示V中的节点,E表示边集,表示从节点i到节点j的有向边。出边的数量称为出度,表示为,入边的数量称为入度,表示为。在微博信息传播网络中,节点代表微博用户,如果用户i关注了其它用户j,则有出边,如果受到其他用户j的关注,则有入边。关注数对应节点的出度,粉丝数即被关注数,对应节点的入度

SIR模型考虑网络结构对病毒传播行为的影响时,将人群中所有个体分成三类,即易感染者、感染者和免疫者。微博信息传播中,将微博用户也分为三类:易传播者、传播者和沉默者,在微博网络中分别对应易传播节点、传播节点和沉默节点。下面通过三类节点之间的状态转换来建立微博信息传播模型。

假设t时刻微博用户总数不变,记时刻还没有看到并且有可能看到该微博信息的用户所占的比例(易传播者),记为在时刻看到该信息并具有转发能力的用户所占的比例(传播者),记为在t时刻看到该信息但并不具有转发能力的用户所占的比例(沉默者),且有。假设易传播者s接受信息后以传播率向其它用户传递信息,称为s的传播率。为信息传播者i将信息传递给沉默者r的概率(停止传播率)。则基于经典SIR的微博信息传播模型微分方程如下[10] :

(1)

在实际微博网络中,存在普通用户和认证用户之分,认证用户拥有庞大的粉丝数,粉丝数可以直接影响微博信息的传播情况。因此在微博信息传播中,认证用户对信息的传播起着至关重要的作用。另外, 当易传播者始终没有看到传递的信息或者对此类信息不感兴趣而不去理会,则易传播者会直接变为沉默者,我们称这类沉默者用户为绝对沉默节点。本文考虑微博信息传播网络中同时含有认证用户和绝对沉默节点的模型。

假设为认证用户的传播率,为普通用户的传播率,为易传播节点变为沉默节点的概率,即绝对沉默率。表示网络中认证用户节点的初始比例,表示t时刻普通传播节点所占的比例,由两部分组成,其中表示由认证用户节点传播产生的普通传播节点,表示由普通传播节点产生的新的普通传播节点。则由认证用户节点产生的新的普通传播节点数为,由普通传播节点产生的新的普通传播节点数为,由传播节点转化成沉默节点的数为,由传播节点转化为绝对沉默节点的数为。随着信息的传播,会使得易传播节点的数量减少,同时使得沉默节点的数量增加。因此可以得到时刻关于的微分方程:

(2)

(3)

又此模型满足,可得到关于的微分方程:

(4)

分别设初始状态下的沉默节点所占比例和易传播节点所占比例为。则建立含有认证用户节点和绝对沉默节点的微博传播模型如下:

(5)

3. 微博传播影响因素的仿真分析

3.1. 微博传播模型仿真

本文选新浪微博上某博主所发的微博信息进行分析,信息内容是有关该博主和粉丝之间的互动和交流。该条信息发出后,受关注的情况和主要关系如下表1图1所示(一找微分析网站)。

表1中,点赞指通过点击相应图标的方式来表达用户对于该信息的赞同和喜爱,点赞数即点赞的用户数;曝光量指在一段时间内看到该博文的用户数;真实点赞数是指去除水军后的点赞数;参与用户数是指参与评论和转发的用户总数,是除去了重复、水军以及被新浪屏蔽的用户。(在微博上,水军指为他人转发评论造势的批量微博用户,这批用户由机器算法操纵去造势,使用大量虚假用户去共同完成,而这些临时征集来为特定微博服务的用户,即称为水军。)

根据表1的统计显示,作为一个拥有3730万粉丝的微博认证用户发了一条信息后,一天内约有14,000人对该信息进行了转发,约34,000人进行了评论。又由图1看出,转发和评论的高峰基本集中在前十小时以内,经估计该信息的传播率约为0.0016%,则停止传播率为99.9984%。统计得到认证用户传播节点的每小时传播率约为100,普通传播节点的每小时传播率约为5。在注册用户数约为5亿的新浪微博网络中,假定初始传播的认证用户数约为10,即。在信息发布最初,除了认证用户传播节点,其他所有节点应都为易传播节点,即。综合以上有如下模型参数初始值:

因为极小,为计算方便可假设。另外,假设微博网络中模型参数在一定时间内保持稳定,对模型进行求解可得到微博信息传播网络中各类节点所占比例随时间的变化情况如图2

图2是在绝对沉默率时的仿真。由图可得:(1) 该信息传播约10小时后,网络中约50%的用户已经获得信息,约14小时后,约有97%的用户已经获得信息,最终3类节点在网络中所占的比例趋于稳定,信息传播过程基本结束。在信息传播过程中,所有节点所占比例在约14小时达到稳定,即网络处于稳定状态时所需时间约为14小时。(2) 该信息在最初的8小时内各节点所占比例的变化速度较慢,在8-11小时内快速变化,12小时后比例变化又减缓。(3) 传播节点所占比例不断增大,沉默节点所占比例一直比较小,且这两类节点所占比例的增长趋势均为先缓慢增长,后快速增长,最后减缓增长(S型增长),只至稳定状态。

3.2.微博传播影响因素分析

模型中的参数与微博信息的传播密切相关,本节将分别讨论当时,模型的参数对信息传播的影响,以下仿真均以3.1中的模型参数初始值为参照。

时,考虑模型中三个参数对信息传播的影响。

只改变认证用户的每小时传播率,其他参数保持不变,即对以下两组数据进行仿真:

(1);(2),结果如图3

结合图2图3分析发现:当认证用户传播节点的传播率分别为10、100、1000时,微博信息传播的稳定时间约为15、14、12小时。说明认证用户的传播率越高,微博信息传播达到稳定状态的时间越短。

只改变普通用户(普通传播节点)的每小时传播率,其他参数保持不变,即对以下两组数据进行仿真:(1);(2),结果如图4

结合图2图4分析发现:当普通传播节点的传播率分别为4、5、10时,微博信息传播的稳定时间约为17、14、7。说明普通传播节点的传播率越高,微博信息传播达到稳定状态的时间越短。

只改变停止传播率,其他参数保持不变,若信息的转发率分别为0.0001%和1.7500%,则对应的

Table 1. Microblog information statistics

表1. 微博信息统计

Figure 1. Diagram about forwarding number and comments number

图1. 转发数和评论数随时间变化关系图

Figure 2. Proportion of three types of nodes on microblog

图2. 微博中三类节点所占比例变化图

Figure 3. Impact of transmission rates of authenticated users on nodes proportion

图3. 认证用户的传播率对节点比例的影响

停止传播率分别为99.9999% 和98.2500%。即对以下两组数据进行仿真:

(1);(2),结果如图5

结合图2图5分析发现:当停止传播率分别为99.9999%、99.9984% 和98.2500% 时,微博信息传播的稳定时间约为15、14、13。说明停止传播率越小,微博信息传播达到稳定状态的时间越短。

时,随着的变化,网络中三类节点比例也随之发生变化,如图6所示。

结合以上仿真,当绝对沉默率时,微博传播除了具有上面讨论的性质外,又有自己的特点:(1) 随着的增大,传播节点i所占比例逐渐减少,而沉默节点r所占比例逐渐增加,且减少(增加)是依曲线S型减少(增加)的;(2) 在此数据模型中,当n ≈ 9.1(约为认证用户传播节点的9.1%)时,传播节点和沉默节点处于平衡状态;(3) 随着的增大,信息传播的稳定时间逐渐缩短,因此提高绝对沉默率,信息传

Figure 4. Impact of transmission rates of common nodes on nodes proportion

图4. 普通节点的传播率对节点比例的影响

Figure 5. Impact of stop transmission rates on nodes proportion

图5. 停止传播率对节点比例的影响

Figure 6. Impact of absolute silence rates on nodes proportion

图6. 绝对沉默率对节点比例的影响

播达到稳定状态越快;(4) 当网络处于稳定状态时,主要存在的节点为沉默节点,易传播节点和传播节点基本趋于零。

3.3. 结果分析

通过以上分析,在微博信息传播过程中,提高认证用户和普通用户的传播率,降低停止传播率或者提高绝对沉默率,都能够使信息传播达到稳定状态的时间越短。如果考虑认证用户传播节点而忽略绝对沉默节点的影响,网络中主要变化的节点是易传播节点和传播节点,随着时间的推移,易传播节点会减少而传播节点会增加,且均成S型变化;当两者都考虑时,网络中易传播节点所占比例基本不变,且随着绝对沉默节点所占比例的增加,沉默节点总数会逐渐增加,而传播节点逐渐减少;当达到平衡状态时,网络中基本上只剩下沉默节点,这也符合现实中一条微博信息从发出到传播,再到消逝的传播过程。

4. 总结

本文建立了含认证用户和绝对沉默节点的微博信息传播网络模型,并仿真分析了模型的各参数对信息传播的影响,以分析实际微博传播的影响因素,对现实中控制微博信息的传播有一定的指导意义。同时考虑认证用户和绝对沉默节点时,随着信息传播网络中易传播节点和传播节点趋于零,这更符合实际中的信息传播过程。本文的结果是在一定初始条件和参数下得到的,但实际微博网络会受到主客观条件等因素的影响,模型参数可能会发生变化。微博信息的传播存在一定的时效性,以至在通常情况下,信息很难传播到网络中的所有用户,但这并不影响模型仿真结果的变化趋势和规律。

基金项目

湖北省科技厅自然科学面上项目(2013CFB216),三峡大学研究生科研创新基金(2014)。

文章引用

李 亮,余 曼,孙 平,王高峡, (2015) 改进的微博传播模型的影响因素分析
Factors Analysis for Improved Information Dissemination Model on Microblog. 建模与仿真,01,1-7. doi: 10.12677/MOS.2015.41001

参考文献 (References)

  1. 1. 汪小凡, 李翔, 陈关荣 (2006) 复杂网络理论及其应用. 清华大学出版社, 北京.

  2. 2. Watts, D.J. and Strogatz, S.H. (1998) Collective dynamics of “small world” networks. Nature, 393, 440-442.

  3. 3. Barabsi, A.L. and Albert, R. (1999) Emergence of scaling in random networks. Science, 286, 509-512.

  4. 4. Watts, D.J. (2004) The “new” science of networks. Annual Review of Sociology, 30, 243-270.

  5. 5. 殷俊, 何芳 (2011) 微博在我国的传播现状及传播特征分析. 河南大学学报(社会科学版), 3, 124-129.

  6. 6. 平亮, 宗利永 (2010) 基于社会网络中心性分析的微博信息传播研究——以Sina微博为例. 图书情报工作, 6, 92-97.

  7. 7. 何静, 郭进利, 徐雪娟 (2013) 微博关系网络模型研究.计算机工程, 11, 105-108.

  8. 8. Moreno, Y., Pastor-Satorras, R., et al. (2002) Epidemie outbreaks in complex heterogeneous networks. European Phy- sical Journal B, 26, 521-529.

  9. 9. Zhou, J., Liu, Z.H. and Li, B.E. (2007) In-fluence of network structure on rumor propagation. Physics Letters A, 368, 458-463.

  10. 10. 王林, 戴冠中 (2009) 复杂网络的Scale-free性、Scale-free现象及其控制. 科学出版社, 北京, 253-267.

  11. 11. 钱颖, 张楠, 赵来军, 等 (2012) 微博舆情传播规律研究. 情报学报, 12, 1299-1304.

  12. 12. 李可嘉, 王义康 (2013) 改进SIR模型在社交网络信息传播中的应用. 电子科技, 8, 168-171.

  13. 13. 刘丹, 殷亚文, 宋明 (2014) 基于SIR模型的微博信息扩散规律仿真分析. 北京邮电大学报, 3, 28-33.

期刊菜单