基于关联规则的文本主题深度挖掘应用研究

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:canoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】准确理解文本信息中潜在的知识关联,丰富文本知识挖掘的方法。【方法】将主题模型和关联规则相结合,运用LDA主题模型抽取文本中的主题集合,在实现文本降维的同时,实现文本在语义空间的表达;通过关联规则进一步挖掘文本中主题的语义关联。【结果】设置合理的支持度和置信度阈值,可以有效地挖掘文本中潜在知识的关联,实现对文本的深入"理解"。【局限】数据预处理过程中,用户自定义词典的设计会对实验结果产生一定的影响。【结论】提出一种非结构化文本信息潜在语义关联挖掘的新思路,改善了针对文本信息知识发现的效果。
其他文献
现今随着经济全球化步伐不断加快,越来越多的国家竞相加入到世界经济一体化的浪潮中,积极参与国际市场的资本运作。会计,作为国际通用的商业语言,其在整个经济全球化过程中的
通过热分解法制备了Fe3O4纳米封堵剂,利用傅里叶转换红外光谱(FT-IR)仪、X-射线衍射(XRD)仪、透射电镜对所制备的Fe3O4纳米粒子进行了结构表征,考察了Fe3O4在不同盐度NaCl溶
羽衣甘蓝,是食用甘蓝的园艺变种,耐寒性强,为优良的冬春季室内外装饰用草花。穴盘育苗作为一种现代育苗技术,有助于羽衣甘蓝大规模的育苗和应用。羽衣甘蓝可用于花坛、花台、花境
每天早上7时-9时,江苏省南京市栖霞区尧化街道的居民外出锻炼或上班时,把在家中分好类的垃圾带下楼(主要是厨余垃圾和其他垃圾)。在小区出口附近的垃圾箱旁,会有两名垃圾处理公司
报纸
第四媒体的广泛使用,迎来了全民的议程设置时代。网络推手们也恰当地抓住了公众对于媒介的使用与满足心理,通过网络互动平台,制造出各种议题。而传统媒体的社会地位赋予功能
网络流行语成为语言研究者关注的焦点,它在产生与传播过程中形成自身符号化、谐音和省略缩写的独特语言特征。翻译中英文网络流行语过程中,可以根据语言所产生的不同文化背景
《辞海》里注释人才为有学问的人,德才兼备的人.人才指在各种社会实践中,有一定专门的知识和较高的技术、能力,以自己的创造性劳动认识自然、改造自然、认识社会、改造社会,
2013年1月1日实施的《民事诉讼法》对小额诉讼制度作了规定,这无疑是我国立法史上的一大进步。但是,作为一项新的制度,小额诉讼需要在实践中得以进一步地完善与发展。小额诉
随着社会的发展,各行业对人才的需求皆由原来单纯性的技术人员逐渐向综合素质强的全面型人才方向迈进。而作为承担人才培养任务的中等职业学校更应该适应市场发展需求,培养中
他已到了不惑的年龄却主动放弃在企业机关工作,义无反顾地跑到经营一线,风里来雨里去地去打拼;他放弃"小家",每月只休息一两天,就为能保质保量地完成公司交给的发展任务;他把