HDP主题模型的用户意图聚类

来源 :北京邮电大学学报 | 被引量 : 0次 | 上传用户:binwuwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现对网络搜索中用户意图的进一步理解,提出采用hierarchical dirichlet process(HDP)的方法来完成用户意图的聚类.动词能够较好地体现用户意图,因此,完成动词的聚类就可以获得更好的用户意图的聚类.提出用与动词具有依存关系的名词和与其共现的名词来表示动词文档.实验结果表明,加入文档层的HDP模型具有比潜在狄雷克来分配模型和狄雷克来混合模型(DPMM)更好的聚类性能.
其他文献
目的探讨小儿病毒性脑炎的MRI影像诊断和鉴别诊断。方法分析20例小儿病毒性脑炎患儿的临床资料及MRI影像特点。结果 MRI对小儿病毒性脑炎阳性率为80%,主要以双侧基底节区病灶
网络文学出版市场因技术发展而出现,伴随市场竞争而成长。精确的市场定位满足大众对通俗文学的消费需求,平台经济降低出版和阅读成本,加之清晰的盈利模式获得商业资本关注,以
财务管理的内容是财务规划、成本费用和预算,财务管理应用于出版社市场营销部门业务,则主要体现在有效控制图书发行的直接成本、最大限度地降低库房储运费用、节约销售费用、
在语言学习过程中,模糊现象不可避免,学习者对模糊采取的态度在一定程度上会影响到他们的学习成效。语言学习是一个复杂的过程,需要训练听、说、读、写、译等多种技能。其中,
<正>当前一些生活类期刊中数字用法颇为混乱,现将此类期刊中常见的数字不规范用法归纳整理,并与国家技术监督局发布实施的《出版物上数字用法的规定》(以下简称《规定》)进行
近年来,随着我国进入移动互联时代,企业危机事件频频曝光。劣质奶粉,地沟油,注水牛肉等词汇成为社会的敏感字眼,对企业当责的诉求日渐成为人们所热议的话题。在关于如何促进
行业内的相对企业社会责任(CSR)水平与消费者购买意向关系的实证研究表明:行业内的相对CSR水平高(或低),消费者购买意向也相应地高(或低);消费者能够接受的CSR处于行业领先水
研究目的:利用血氧水平依赖静息态功能磁共振成像技术(BOLD-rfMRI),研究比较正常老年人和阿尔茨海默病(AD)患者静息状态下脑神经元自发活动的变化。以期为AD病因病机研究及影
中国大学生在大学英语写作中面临着普遍性问题,即语法功底不足,写作素材积累不够和缺乏批判性思维。针对这三种问题,本文基于建构主义学习观的四大理想学习环境要素,提出了相
"一带一路"国家战略在版权贸易领域的落实,具有政策引路、正名顺言、坚定信念的现实意义,本文基于中南传媒"走出去"工作中的实践,总结成效,思考不足,并提出版权贸易工作与"一