基于Word2Vec的微博文本分类研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:xujc8639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微博文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF(Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM
其他文献
目的:基于患者报告结局评价中药蜡疗治疗寒湿痹阻证类风湿关节炎的临床疗效。方法:纳入符合西医RA、DAS28评分>2.6,中医寒湿痹阻证的诊断标准的患者72人,用随机数字表法将患者分为两组,实验组患者36例,对照组患者36例,治疗组是基础治疗加中药蜡疗(每天一次),对照组是基础治疗加洛索洛芬钠(每次一片,每天三次),共治疗两周。以安全性指标(心率、呼吸频率)、实验室指标血沉、CRP、中医证候积
AOGS主席日本东京大学地震研究所佐竹健治(KenjiSatake)亚洲与大洋洲地球科学学会(AOGS)很荣幸地宣布授予陈运泰教授2013年度AOGS“艾克斯福特奖”(Axfor dMedal Award),以表彰他在
最近,发现了一系列异乎寻常的地震现象,包括间歇性深部颤动(Obara,2002)、低频地震(Katsumata and Kamaya,2003)、甚低频地震(Ito et al,2006)、慢滑动事件(Hirose and Obara,2005)及寂静地
选取武夷山市29个茶园的土壤样品及对应茶叶样品,采用BCR连续分级法研究了土壤中重金属元素Cu、Zn、Pb和Cr的全量及其化学形态,应用生物可利用性系数和富集系数进行生物有效
作为菲律宾海板块残余岛弧的九州-帕劳海岭正沿着日本南海海槽的最西端俯冲于欧亚板块之下。沿走向布设的地震反射剖面显示出沿弧前增生楔前缘俯冲的九州-帕劳海岭70km宽的构
德育工作是各个阶段学校教育中的重要内容之一,其对于学生的心理健康、人格健全甚至今后的长远发展都起着重要的影响作用。基于此,作为班主任,在课堂教学中应有效开展德育工
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的 探讨静脉治疗管理小组在中心静脉导管维护质量管理中的作用。方法 建立静脉治疗管理小组,分析比较在建立小组前(2013年5月~2014年4月)及建立小组后(2014年5月~2015年4月)患
猪蛔虫病是由蛔虫寄生在猪的小肠内而引起的猪消化絮乱、机体消瘦和生长发育不良的一种线虫病,是我国最常见且分布广的一种内寄生虫病。其发病主要是由于猪的肠道受到蛔虫感