基于社交网络特定用户群体发现系统

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ma_mwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的迅猛发展吸引了大批的用户,使得互联网成为了社会舆论的主要聚集地之一,近年来国内外各领域几乎所有的重大事件都在微博上被广泛讨论。因此,社交网络上的舆情分析已经成为一个热门的研究课题。一些关键用户在社交网络舆论的形成和传播过程中扮演着重要的角色,网络舆情的发展方向已经与他们密不可分,他们被称为“意见领袖”。意见领袖通常具有强大的影响力,领导着各自领域热点、焦点问题的舆论走向。在进行网络舆情分析时,若能够发掘出社交网络中的意见领袖,并重点针对这些意见领袖采集和分析相关的数据,就可以有效地节约数据采集、存储、计算的开销,达到事半功倍的效果。为了发掘出社交网络中的意见领袖,本文开发了基于社交网络上特定用户的群体发现系统,该系统以初始的数个意见领袖作为输入,发掘出社交网络中的其他意见领袖群体,并能够针对发掘出的意见领袖名单采集用户的信息和用户发表的消息。为了实现意见领袖名单的发掘功能,本系统实现了影响力分析算法和社区发现算法,并针对本系统的具体情况对社区发现算法进行了改进,使得对于不完整的用户关系图也能够得到较为准确的划分结果。而数据采集部分,本文搭建了分布式的社交网络爬虫作为系统的数据采集模块。该爬虫通过调用社交网站提供的API和模拟浏览器两种方式来协同实现数据的采集,能够采集的数据有用户信息、用户好友关系、用户发表的历史消息以及用户发表的实时消息四个部分。为了提高爬取的效率,数据采集模块采用了分布式技术,让多台主机协同完成数据采集工作,并且每台主机能够定时切换IP和账号,以突破各社交网站对采集速率的限制。最后,本系统还提供了采集数据的展示、修改和共享功能。运行结果表明,本系统各功能均能够有效实现,并且运行效率较高。系统的目标发现模块所采用的社区发现算法在原有算法的基础上,根据系统的特别情况做了相应的优化,使得社区划分结果的准确性有了较大的提升。目前群体发现系统已经正式应用于网络舆情分析的研究中,运行情况良好,能够稳定高效地完成群体发现和数据采集工作。
其他文献
给出了前向安全多重签名的形式化安全性模型,并提出了一个可证安全的前向安全多重签名方案.在该方案中,即使所有参与多重签名成员的当前密钥泄漏,所有以前时间段的签名也是有
2013年8月,新疆环保厅宣布提高全区(包括新疆生产建设兵团)棉浆粕和黏胶纤维行业生产废水排放标准,今后所有新、改、扩建棉浆粕、黏胶纤维建设项目,其水污染物排放统一执行一级标
为贯彻《萨班斯·奥克斯利法案}404条款的执行,美国采用了PCAOB(公众公司会计监督委员会)制定的第2号审计准则——《与财务报表审计相整合的财务报告内部控制审计》。通过对
长白山森林源头溪流每年11月至次年4月有约70%的河面被冰覆盖,季节性冻融过程特征明显.为了揭示溪流冻结初期凋落叶分解与底栖动物定殖的关系,在长白山地区1条源头溪流中,利
重卡载货汽车用底盘推力杆热铆,其组成总成用杆头为波浪型热铆技术,其杆头波浪纹在车削过程中,考虑到消除车削轴线与毛坯锻造轴线偏离,消除热铆后的总成受力不均衡导致的产品
以"铜锌原电池"教学为例,阐述当在实验教学过程中出现和教材或教辅结论有偏差的现象时,引导学生在现有认知水平基础上,以认知矛盾激发学习兴趣,积极地进行分析探讨,从而获得
目的:探讨唐氏综合症产前筛查的方法以及影响其风险值的主要因素。方法:自1 999年底至2002年底,用全自动时间荧光免疫分析仪对4126例怀孕9一20周零6 天妇女进行血清妊娠相关
会议
本文主要对不同Al含量的AlxFeCoCrCuTi0.5(x=0.25,0.5,0.75,1,1.5)高熵合金的腐蚀和生物性能进行了研究。首先探究了Al元素的添加对合金显微组织和结构的影响,然后从不同Al含
目的分析比较卡培他滨的几种基本的合成路线。方法选择以1’,2’,3’-O-三乙酰基核糖为原料,经过缩合、酰化、水解合成卡培他滨的路线,在合成2’,3’-二乙酰-5’-脱氧-5-氟胞啶时
对Schofield等提出的快速傅里叶变换(采用4次傅里叶变换和4次逆傅里叶)解包裹算法和Volkov等提出的相位重建算法(仅采用两次傅里叶变换和一次逆傅里叶变换)进行了讨论,提出基于离