论文部分内容阅读
随着网络的广泛普及和网民数量的快速增加,网络新闻的宣传影响效果研究逐渐成为关注的热点。相较于其它大众媒体,网络媒体表现出的时效性、权威信、全面性、互动性等特点,使受众人群更广泛,但是问题也随之而来。新闻媒体对于发布新闻的宣传影响效果未知,网络新闻媒介重点发布的新闻阅读量却不尽人意,最后导致未及时改变社会舆论导向,从而影响社会安宁。本论文针对性的从新闻网页中获取相关的信息,通过信息检索领域的文本处理等相关技术建立一种可以反映网络新闻媒体宣传影响效果的模型,进而分析网络新闻媒体的宣传影响效果,探讨其与大众讨论平台上网民所关注的话题之间的关系,为相关部门提出一些可行性建议。首先通过分析影响媒体网站发布新闻的宣传影响效果的影响因素,提取出可以进行定量分析的新闻网页的回复条数、转载条数、发布的信源网站、新闻的发布时间等因素,利用爬虫技术进行数据抓取并建立初期模型。其次量化这些抓取到的影响因素,其中对于回复率利用统计分析得到回复率比值表为此后回复率作为参考,信源影响因子利用网页的日均浏览人数和日均浏览量进行计算,时间影响因素利用新闻衰退时间的定义来获取,转载率通过VSM模型、MD5算法、TFIDF特征加权技术、词共现、HITS算法来获取源网站,并间接表示转载率。最后对于初期模型利用相关性分析和回归分析进行优化,利用优化结果与百度排行数据进行分析,研究网络新闻媒介发布内容的宣传影响效果以及其与大众讨论平台上网民所关注的话题之间的差异性。通过研究新闻宣传影响效果结果与百度风云排行榜的今日热点相比较发现,在内容上网站新闻媒体的事实性新闻占多数,更多偏向于时政、科教、经济、政法等新闻。百度排行榜偏向于评论性事件,涉及社会事件、问题、风貌的报道,容易引起社会进行讨论、评判、争议。从两者顺序上看新闻宣传影响效果排行基本能与百度排行的今日热点排行顺序一致的也都是在社会性、评论性事件方向,在事实性新闻方面的顺序却不尽人意,说明越是事实性新闻,排序上差异性越大,而如果是评论性话题,排名在顺序上差异性就比较小。