【摘 要】
:
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理
【机 构】
:
解放军理工大学信息管理中心,解放军理工大学指挥信息系统学院
论文部分内容阅读
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。
其他文献
目的:探讨尿胰蛋白酶原-2快速检测在诊断早期急性胰腺炎中的应用价值。方法:选取合肥市第二人民医院收治的46例急腹症患者作为研究对象。将这46例患者中的23例非急性胰腺炎患
一、“一带一路”倡议对境外档案工作的影响“一带一路”倡议是2013年9月10日,由习近平总书记提出的共建“丝绸之路经济带”和“21世纪海上丝绸之路”的重大倡议,也是当前我
八十年代后期英国开始在提供卫生服务等社会福利公共机构之间引进竞争,政府成为与医疗供应脱钩的提供基金的签约机关,本文从公众选择理论与广义政治学原理对这些改革的影响作了
在幼儿园阶段,让幼儿接受语言的训练,通过丰富多彩的语言训练活动,让幼儿敢于开口讲话,并且积极的组织自己的语言,应用在社会交流沟通之中,提高孩子们的语言自信,为幼儿今后
在人才需求不断增长的情况下,各大学校的招生工作范围不断扩大,高等教育首先被广泛推广与落实。为了实现高等教育的健康发展,建立有效的金融体系,促进金融管理改革显得尤为重
雷哈《36首赋格》对古典时期的赋格发展做出了巨大的开拓性贡献,并进一步证明了雷哈的赋格创作是西方赋格发展史上的承前启后者,是古典主义时期探索新的音乐语言的开拓者。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
本文通过国外、国内及温州商标品牌情况的调查研究,借鉴先进经验和做法,结合温州实际,突出温州特色,发挥优势、找准不足、明确威胁和挑战,从战略角度对温州商标品牌的发展提
大学生学习权由大学生个体主动学习为核心的学习自由权和受教育为核心的学习保障权两部分构成。大学生拥有学习权,意味着大学生拥有对学习的支配力和影响力,这种支配力和影响力