论文部分内容阅读
摘要:针对社会信息网络演化和影响力的问题,该文分三步来解决问题:1)对信息传播与新闻判断;2)验证与预测;3)分析社会网络上信息对大众的影响。
关键词:新闻判定;媒介权重模型;染色模型
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)22-0046-03
1 任务目标
我们的任务是分析速度/信息流与信息内在价值的关系,考虑五个阶段:19世纪70年代,报纸由火车散发,故事靠电报传播;20世纪20年代,收音机是更常见的家用品;20世纪70年代,电视出现在大多数家庭;20世纪90年代,家庭连到早期的互联网;在21世纪前10年,我们可以靠手机连接世界。基于这五个时期,我们应该建立和发展一个数学模型来过滤或找到哪些是新闻。 建立模型使其能够预测今天的信息沟通情况,并且用过去的数据与今天的现实作比较。 此外,我们将尽力预测2050年左右的通信网络的关系和能力。使用信息对网络影响的理论和概念,建模研究如何在今天的互联网世界中,让公共利益和观点通过信息网络得到改变。
2 符号定义
3 基础模型
在本节中,我们将基本模型划分为两个部分:信息传播和新闻的判断。 首先,我们分析了在特定时期下六种传播媒介的不同权重。计算六种传播媒介传播信息的加权平均时间,以此表示在一个特定的时期信息传播所需要的时间。 最后,考虑到网络相对信息其他传播途径传播速率数量级大,我们分别从前四个时期和第五个时期两种角度对新闻的判定进行讨论。
3.1 相邻节点染色
Step 1: 分析六种传播媒介在不同时期所占的比重
结合实际,我们只考虑六种信息传播的方式:交谈、电视、电报、报纸、广播和网络。通过分析不同时期的信息传播途径,我们得出:1870-1920期间,信息传播方式是交谈、报纸和电报;1920-1970期间,信息传播方式是电报、报纸、交谈、广播。1970年代以后,随着网络的兴起,人与人之间通过“交谈”传递信息的比重逐渐下降,所以,1970年后不再考虑交谈这种途径。1970-1990期间:信息传播途径为收音机、报纸、电视,1990-2010期间:信息传播方式为电视、报纸、收音机和广播;2010年至今是电视、报纸和网络。
进一步分析,我们用来分别代表电报、报纸、交谈、广播、电视和网络。我们用% 来表示电报在特定时期下所有信息传播途径中所占的比重,依次类推剩余的五种信息传播方式。
Step2: 数据归一化
在这里,我们考虑了人们获取信息的第一获取途径,同时人们还可能以其他的方式再次了解到这一信息。所以我们可以得出,流中信息传播途径在信息传播中所占的比例之和并非是单位1,而是远远大于1的数字,进行归一化处理如下:
Step3: 定义新闻的判定标准
我们先来讨论前四个时期。我们用 代表访问信息所需要的时间,命名为“一个周期”因此我们得到以下的公式:
通过分析在特定时期下六种信息传播媒介所占的权重,我们可以得到一个具体的数值,用来表示信息传播达到饱和所需的时间。 对于新闻的判定,我们认为应从信息的筛选过滤两个方面来分析。当一条信息传递给每一个接收方时,接收方需要估计信息继续传播的方向,这个取决于当前社会对这些信息的接受度。
根据信息传播的过程,我们可以用对数函数来描述这个过程。我们设T表示时间,表示信息饱和所需要的时间。在信息达到饱和之前,我们定义了新闻的判定标准:当接收信息所需的时间小于时间周期T的40%,判定不是新闻;当接收信息所需的时间大于周期T的40%,判定为普通新闻;当接收信息所需的时间大于周期T的70%,判定为重大新闻。
接下来我们来讨论第五个时期。由于网络出现在第五时期,我们把这一时期进行单独分析。网络的传播速度明显快于其他五类传播媒介,与其余五类传播媒介的传播速度根本不在同一数量级上。
这里,我们主要分析社会化网络服务(SNS),这是一个充分反映了人类社会的六度连接性(即两个陌生人之间至多可通过六个人联系起来)的网络模型。在社交网络中,我们发布的信息可能被朋友注意到,进而有可能进行分享,传播。同时,如果他们对于这则信息不感兴趣,将会呈现“免疫”现象,则消息不会传播。我们定义节点来表示SNS的用户,可用节点与节点间的连线表示人与人之前的关系,信息只沿边线进行传播。
根据信息在社交网络的传播规则,网络节点可以分为四类:通信节点、未感染节点、免疫节点和消极节点。通信节点表示它们接受来自相邻节点的信息并具有传播信息的能力;未感染节点还未从相邻节点接受信息,但它具有传播信息的能力,即它们有被感染的可能性;免疫节点表示已经接受了来自相邻节点的信息,但并不进行传播该信息;消极节点表示它们接受来自相邻节点的信息并具有传播反面信息的能力。
为了进一步描述,我们假设“p”代表在收到传播的可能性, “q”表示接收后不传播的可能性,“r”呈现在收到相反传播的可能性。 通过深入分析,我们创建了表2显示详细信息传输的详细过程。 例如,我们考虑这种情况,黑色节点向白色节点传递信息。 因为白色节点表示未感染的,它会有三个处理黑色节点传达的信息的可能性。 其他情况也可以以同样的方式进行分析。 我们可以看到所有的情况如下:
S: 源节点 N:相邻节点
4 回归预测模型
4.1 由过去预测现在
由上可知,根据对基本模型的分析,我们得到了以下公式::
通过查阅每个时期的重大历史传播所需要的时间以及传播方式所占的比例,例如1870年的南北战争、1921年的华盛顿会议、1922年的苏联成立、1970年美国侵略越南战争、1990年曼德拉被释放、2010年的温哥华冬奥会等等,并结合BBC网站上的往年数据,给出每一种信息传播途径在特定时期的传播信息所需要的时间见表3。 根据表格中的数据,我们计算在每个时期信息传输的平均周期,例如:
所以我们可以得到在前四个时期内信息传播的平均速度,用“d”表示一天。1870时期,信息传播所需时间为17.7d;1920时期,信息传播所需时间为9.05d;1970时期,信息传播所需时间为3.5d;1990时期,信息传播所需时间为1.58d;2010时期信息传播所需时间为0.20d。
马丁·路德·金死于1968年4月4日,美国总统宣布全国哀悼在4月7日。 我们可以推测出这则消息用了三天时间传遍了美国。与我们模型中的数据相比较,在1970年代新闻传播的速度是3.5天,可以验证模型是正确的。
4.2 从现在预测2050年
任务要求我们预测2050年左右的通信网络的关系和能力我们根据表6得到的前四个时期的信息传播速度,用SPSS进行回归分析,因为原数据的计算复杂,我们通过这种方式简化数据:把1870年的数据设置为最初值1,每10年增加1.例如,我们把1880年设置为2。通过SPSS进行回归分析,我们为方便计算,对以年份为横坐标的数据做缩小倍数的处理,得到回归分析的方程为
我们预测2050,即令 ,带入回归方程。我们可以求得 ,表明到2050年信息传播的速度较之前依旧有明显的提高,社会的通讯网络尚未饱和。
5 相邻节点染色模型
在互联网时代,人们徜徉在信息的海洋里,互联网在很大程度上可以满足人们日益增长的认知。在与世界密切联系的今天,公众的兴趣和观点可以被信息网络改变。在这一节,我们提供一个模型来分析这一现象。
5.1 数据归一化
我们在上面提到过这样一个模型:有三色节点。黑色代表接收信息后传播此信息,灰色代表接收信息后不传播信息,蓝色代表在接受信息后传播负面信息。我们在这里需要考虑的是网络上信息的影响。因此,我们不会考虑灰色节点。
此时,黑和蓝表示对一种事件的不同的看法,而且看法是相互对立不兼容的.但是和第一个模型不同的是,新闻是一件本身让人信服的消息,所以p的取值较大,趋近于1(上个模型取值0.99)。而社会网络对某件事情会产生影响时,则这件事情的本质和新闻不同,所以在该模型中p的取值应当趋近于0.5,两种看法在人工网络中都应该考虑到。
我们列出数据归一化的方程,如下所示:
5.2 观点改变的过程
在信息传递的过程中,一个人对于信息的最终评价不仅与自己的最初判断有关,还受周围环境的影响。例如,如果我是一个消极的节点,即接收信息后传播负面的信息,周围都是代表接收消息并传播的黑色节点,我可能会改变我的观点从而传播原本的信息。图1显示了以上过程。
这里,我们设定一个参数k(A、B表示两种不同的态度,可能是黑白蓝三色中的任一色):
如果,中心节点可能变为A;
如果,中心节点可能变成B;
本节的模型依然是依据一个由LFR建立的一个虚拟的人工网络,传播的方法类似于第一个的模型,只是传播方向变成了两种,在传播的过程中需要对每一个节点的邻居进行统计,当该节点的邻近节点的一种看法是另一种看法的一定的倍数时,无论该节点是什么看法,该节点会因为邻近的影响,而持有和多数人一样的看法。
6 模型评价
优点: 对于前四个时期,取六大主流信息传播媒介,确定各自在不同的时期中在传播过程中所占的比重,以最简单可行的方式表现出信息传播的大致过程,由传播速度和信息覆盖面积的比重确定了新闻的标准。对于第五个时期,我们考虑到由于网络发展的迅速和信息以网络为载体的传播的快速性,忽略其他传播媒介,将信息传播看成网络传播,用MATLAB仿真模拟出该种传播,以图形的形式表现出传播的特性,形象直观。
缺点: 数据的缺少导致确定传播媒介在传播过程中所占的比重时的误差,是无法避免的,并且只能在一定程度上能够进行新闻的滤除,因此会在筛选出的新闻中掺杂着并不符合新闻特征的信息。仿真模拟与现实中信息在网络上的传播还是有区别的,没有考虑到实际中信息传播过程中的变化,实际信息的传播在人与人之间进行时可能性是无法估定的。
参考文献:
[1] http://news.bbc.co.uk/2/hi/technology/8552410.stm
[2] Chao Wang,Xuying Yang,Ke Xu,Jianfeng Ma.SEIR-Based Model for the information Spreading over SNS[M]. Electronic Journals,2014(11).
[3]http://www.poynter.org/2012/pew-tv-viewing-habit-grays-as-digital-news-consumption-tops-print-radio/189819/
关键词:新闻判定;媒介权重模型;染色模型
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)22-0046-03
1 任务目标
我们的任务是分析速度/信息流与信息内在价值的关系,考虑五个阶段:19世纪70年代,报纸由火车散发,故事靠电报传播;20世纪20年代,收音机是更常见的家用品;20世纪70年代,电视出现在大多数家庭;20世纪90年代,家庭连到早期的互联网;在21世纪前10年,我们可以靠手机连接世界。基于这五个时期,我们应该建立和发展一个数学模型来过滤或找到哪些是新闻。 建立模型使其能够预测今天的信息沟通情况,并且用过去的数据与今天的现实作比较。 此外,我们将尽力预测2050年左右的通信网络的关系和能力。使用信息对网络影响的理论和概念,建模研究如何在今天的互联网世界中,让公共利益和观点通过信息网络得到改变。
2 符号定义
3 基础模型
在本节中,我们将基本模型划分为两个部分:信息传播和新闻的判断。 首先,我们分析了在特定时期下六种传播媒介的不同权重。计算六种传播媒介传播信息的加权平均时间,以此表示在一个特定的时期信息传播所需要的时间。 最后,考虑到网络相对信息其他传播途径传播速率数量级大,我们分别从前四个时期和第五个时期两种角度对新闻的判定进行讨论。
3.1 相邻节点染色
Step 1: 分析六种传播媒介在不同时期所占的比重
结合实际,我们只考虑六种信息传播的方式:交谈、电视、电报、报纸、广播和网络。通过分析不同时期的信息传播途径,我们得出:1870-1920期间,信息传播方式是交谈、报纸和电报;1920-1970期间,信息传播方式是电报、报纸、交谈、广播。1970年代以后,随着网络的兴起,人与人之间通过“交谈”传递信息的比重逐渐下降,所以,1970年后不再考虑交谈这种途径。1970-1990期间:信息传播途径为收音机、报纸、电视,1990-2010期间:信息传播方式为电视、报纸、收音机和广播;2010年至今是电视、报纸和网络。
进一步分析,我们用来分别代表电报、报纸、交谈、广播、电视和网络。我们用% 来表示电报在特定时期下所有信息传播途径中所占的比重,依次类推剩余的五种信息传播方式。
Step2: 数据归一化
在这里,我们考虑了人们获取信息的第一获取途径,同时人们还可能以其他的方式再次了解到这一信息。所以我们可以得出,流中信息传播途径在信息传播中所占的比例之和并非是单位1,而是远远大于1的数字,进行归一化处理如下:
Step3: 定义新闻的判定标准
我们先来讨论前四个时期。我们用 代表访问信息所需要的时间,命名为“一个周期”因此我们得到以下的公式:
通过分析在特定时期下六种信息传播媒介所占的权重,我们可以得到一个具体的数值,用来表示信息传播达到饱和所需的时间。 对于新闻的判定,我们认为应从信息的筛选过滤两个方面来分析。当一条信息传递给每一个接收方时,接收方需要估计信息继续传播的方向,这个取决于当前社会对这些信息的接受度。
根据信息传播的过程,我们可以用对数函数来描述这个过程。我们设T表示时间,表示信息饱和所需要的时间。在信息达到饱和之前,我们定义了新闻的判定标准:当接收信息所需的时间小于时间周期T的40%,判定不是新闻;当接收信息所需的时间大于周期T的40%,判定为普通新闻;当接收信息所需的时间大于周期T的70%,判定为重大新闻。
接下来我们来讨论第五个时期。由于网络出现在第五时期,我们把这一时期进行单独分析。网络的传播速度明显快于其他五类传播媒介,与其余五类传播媒介的传播速度根本不在同一数量级上。
这里,我们主要分析社会化网络服务(SNS),这是一个充分反映了人类社会的六度连接性(即两个陌生人之间至多可通过六个人联系起来)的网络模型。在社交网络中,我们发布的信息可能被朋友注意到,进而有可能进行分享,传播。同时,如果他们对于这则信息不感兴趣,将会呈现“免疫”现象,则消息不会传播。我们定义节点来表示SNS的用户,可用节点与节点间的连线表示人与人之前的关系,信息只沿边线进行传播。
根据信息在社交网络的传播规则,网络节点可以分为四类:通信节点、未感染节点、免疫节点和消极节点。通信节点表示它们接受来自相邻节点的信息并具有传播信息的能力;未感染节点还未从相邻节点接受信息,但它具有传播信息的能力,即它们有被感染的可能性;免疫节点表示已经接受了来自相邻节点的信息,但并不进行传播该信息;消极节点表示它们接受来自相邻节点的信息并具有传播反面信息的能力。
为了进一步描述,我们假设“p”代表在收到传播的可能性, “q”表示接收后不传播的可能性,“r”呈现在收到相反传播的可能性。 通过深入分析,我们创建了表2显示详细信息传输的详细过程。 例如,我们考虑这种情况,黑色节点向白色节点传递信息。 因为白色节点表示未感染的,它会有三个处理黑色节点传达的信息的可能性。 其他情况也可以以同样的方式进行分析。 我们可以看到所有的情况如下:
S: 源节点 N:相邻节点
4 回归预测模型
4.1 由过去预测现在
由上可知,根据对基本模型的分析,我们得到了以下公式::
通过查阅每个时期的重大历史传播所需要的时间以及传播方式所占的比例,例如1870年的南北战争、1921年的华盛顿会议、1922年的苏联成立、1970年美国侵略越南战争、1990年曼德拉被释放、2010年的温哥华冬奥会等等,并结合BBC网站上的往年数据,给出每一种信息传播途径在特定时期的传播信息所需要的时间见表3。 根据表格中的数据,我们计算在每个时期信息传输的平均周期,例如:
所以我们可以得到在前四个时期内信息传播的平均速度,用“d”表示一天。1870时期,信息传播所需时间为17.7d;1920时期,信息传播所需时间为9.05d;1970时期,信息传播所需时间为3.5d;1990时期,信息传播所需时间为1.58d;2010时期信息传播所需时间为0.20d。
马丁·路德·金死于1968年4月4日,美国总统宣布全国哀悼在4月7日。 我们可以推测出这则消息用了三天时间传遍了美国。与我们模型中的数据相比较,在1970年代新闻传播的速度是3.5天,可以验证模型是正确的。
4.2 从现在预测2050年
任务要求我们预测2050年左右的通信网络的关系和能力我们根据表6得到的前四个时期的信息传播速度,用SPSS进行回归分析,因为原数据的计算复杂,我们通过这种方式简化数据:把1870年的数据设置为最初值1,每10年增加1.例如,我们把1880年设置为2。通过SPSS进行回归分析,我们为方便计算,对以年份为横坐标的数据做缩小倍数的处理,得到回归分析的方程为
我们预测2050,即令 ,带入回归方程。我们可以求得 ,表明到2050年信息传播的速度较之前依旧有明显的提高,社会的通讯网络尚未饱和。
5 相邻节点染色模型
在互联网时代,人们徜徉在信息的海洋里,互联网在很大程度上可以满足人们日益增长的认知。在与世界密切联系的今天,公众的兴趣和观点可以被信息网络改变。在这一节,我们提供一个模型来分析这一现象。
5.1 数据归一化
我们在上面提到过这样一个模型:有三色节点。黑色代表接收信息后传播此信息,灰色代表接收信息后不传播信息,蓝色代表在接受信息后传播负面信息。我们在这里需要考虑的是网络上信息的影响。因此,我们不会考虑灰色节点。
此时,黑和蓝表示对一种事件的不同的看法,而且看法是相互对立不兼容的.但是和第一个模型不同的是,新闻是一件本身让人信服的消息,所以p的取值较大,趋近于1(上个模型取值0.99)。而社会网络对某件事情会产生影响时,则这件事情的本质和新闻不同,所以在该模型中p的取值应当趋近于0.5,两种看法在人工网络中都应该考虑到。
我们列出数据归一化的方程,如下所示:
5.2 观点改变的过程
在信息传递的过程中,一个人对于信息的最终评价不仅与自己的最初判断有关,还受周围环境的影响。例如,如果我是一个消极的节点,即接收信息后传播负面的信息,周围都是代表接收消息并传播的黑色节点,我可能会改变我的观点从而传播原本的信息。图1显示了以上过程。
这里,我们设定一个参数k(A、B表示两种不同的态度,可能是黑白蓝三色中的任一色):
如果,中心节点可能变为A;
如果,中心节点可能变成B;
本节的模型依然是依据一个由LFR建立的一个虚拟的人工网络,传播的方法类似于第一个的模型,只是传播方向变成了两种,在传播的过程中需要对每一个节点的邻居进行统计,当该节点的邻近节点的一种看法是另一种看法的一定的倍数时,无论该节点是什么看法,该节点会因为邻近的影响,而持有和多数人一样的看法。
6 模型评价
优点: 对于前四个时期,取六大主流信息传播媒介,确定各自在不同的时期中在传播过程中所占的比重,以最简单可行的方式表现出信息传播的大致过程,由传播速度和信息覆盖面积的比重确定了新闻的标准。对于第五个时期,我们考虑到由于网络发展的迅速和信息以网络为载体的传播的快速性,忽略其他传播媒介,将信息传播看成网络传播,用MATLAB仿真模拟出该种传播,以图形的形式表现出传播的特性,形象直观。
缺点: 数据的缺少导致确定传播媒介在传播过程中所占的比重时的误差,是无法避免的,并且只能在一定程度上能够进行新闻的滤除,因此会在筛选出的新闻中掺杂着并不符合新闻特征的信息。仿真模拟与现实中信息在网络上的传播还是有区别的,没有考虑到实际中信息传播过程中的变化,实际信息的传播在人与人之间进行时可能性是无法估定的。
参考文献:
[1] http://news.bbc.co.uk/2/hi/technology/8552410.stm
[2] Chao Wang,Xuying Yang,Ke Xu,Jianfeng Ma.SEIR-Based Model for the information Spreading over SNS[M]. Electronic Journals,2014(11).
[3]http://www.poynter.org/2012/pew-tv-viewing-habit-grays-as-digital-news-consumption-tops-print-radio/189819/