基于词类和搭配的微博舆情文本聚类方法研究

来源 :南京师大学报(自然科学版) | 被引量 : 0次 | 上传用户:swan159357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博是近年出现的新型互联网信息交流平台,它具有主题分散、体量短小、文体自由等特性,它能对社会产生巨大的影响,所以信息监管部门和商业企业对基于微博信息的舆情分析都有迫切需求.提出了基于搭配的文本聚类新方法,该方法先进行微博文本预处理,然后利用词类模型进行自动抽取有效搭配,最后基于有效搭配的模型进行文本聚类.实验证明利用词类文本聚类方法比传统文本聚类方法性能提高6.3%,而本文方法比利用词类文本聚类方法性能提升了16.8%,结果显示了本方法的有效性.
其他文献
随着新媒体时代的到来,构建了全新的文化发展体系,为传统文化在新媒体中的传播带来了新的机遇和挑战。传统文化的传播模式呈现出新的特点。新媒体的传播过程中对传统文化产生
医,字本作"醫".<说文&#183;酉部>说:"醫,治病工,从酉,殴声".专门为人治病的人,称之曰"医".为人治病是医者的天职,研究、讨论、阐述和记载专门为人治病的学问称之为"医学".我
二陈汤出自《太平惠民和剂局方》,组方用“半夏(汤洗七次)、橘红各五两,白茯苓三两,甘草(炙)一两半,右为咀。每服四钱,用水一盏,生姜七片,乌梅一个,同煎六分,去渣热服”。因方中“陈皮、半
高校党建工作作为学校工作的重要组成部分,在取得一定成效的同时,也面临着新的问题和挑战。如何以创新精神进一步加强高校党建工作,寻找高校党建工作的突破口和切入点,是当前
香港回归祖国之后,香港中医药立法及其条例逐步建立和完善,中医药的大学教育也在香港得到政府资助而展开.笔者在香港大学中医药学院担任中药学的教学过程中,针对香港学生的知
在不同老化温度下,对2种基质沥青和2种温拌改性沥青进行老化试验,测试沥青不同老化时间后的软化点,采用线性回归的方法计算反应速率常数、老化反应活化能和指前因子等参数,得
将大数据作为一种战略资源和业务驱动力,已成为广告公司数字化转型发展的主要内容和使命。并购作为一种从企业外部获取战略资源和服务能力的公司战略,正成为我国广告产业发展
在药物化学理论教学中,通过教学方法改革,对有利于提高教学质量的各个环节进行了分析探讨,旨在进一步实现培养综合性应用人才的目的。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:通过对3I例早产儿的护理,有效提高早产儿成活率。方法:保暖,维持正常呼吸,喂养,预防感染,加强亲子亲密接触,预防高胆红素血症。结果:接诊33例早产患儿,其,931例在出院前均能自行吮