一种基于统计语义聚类的查询语言模型估计

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:feifeifo123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义聚类技术,试图借助于独立分量分析的良好主题区分能力,将一组文档按照实际隐含的主题在语义空间上聚类.在语言模型的框架下,语义主题聚类将由用户初始查询按照一定的度量方式激活.利用激活语义聚类的信息估计一个反馈语义主题模型,并与初始查询模型一起形成新的查询模型.在5个TREC数据集上的实验结果表明
其他文献
Vishay Intertechnology推出用于遥控系统的完整系列微型自动增益控制分类5(AGC5)的红外接收器AGC5。Vishay的AGC5器件适用于短脉冲编码,具有出色的噪声抑制能力,在噪声条件下能
2010年,南宁市城市居民消费中,属于享受型消费的交通和通信类、家庭设备用品及服务类、文化娱乐类和其他商品及服务类支出,占整个消费支出比重为36%,较“十五”期末增加了11.4个百
过去5年,云南GDP从3462亿增至7220亿,年均增长11.8%2/3财政资金投向民生,累计5126亿政府工作报告显示,经过5年努力,云南省经济总量从3462亿元增加到7220亿元,年均增长11.8%,人均生产总值
9月9日9时19分,商务部和贵州省政府共同举办的“第二届中国(贵州)国际酒类博览会”在贵阳市国际生态会议中心开幕。据悉,本届博览会的主题是“展示全球佳酿,促进交流合作”,共有134
由于建筑行业的特殊性,存在的安全隐患很多,因此防范起来特别困难。本人总结了一些安全防范的措施,我觉得其中很重要的一点是对工作幸福感的认同.利用人人都有向往美好生活,不愿在
随着建筑市场的高度发展,建筑业的生产方式和组织结构形式发生了深刻的变化。同时,建筑企业之间的竞争也愈演愈烈。如何在僧多粥少、任务严重不足的情况下加强建筑工程成本的管
可扩展路由器是当前核心路由器研究的热点,直连式可扩展路由器是可扩展路由器研究的一种重要分支.但是,目前直连式可扩展路由器的研究局限于采用低维路由节点的方式进行扩展,这种
本文对MMT改性PVA进行了初步的研究,制备出了耐水性较好的内墙涂料,通过试验确定了MMT的最佳用量为3%,并对MMT改性PVA的机理进行了初步探讨.
形成有效的联盟是多Agent系统的一个重大课题.然而联盟结构的数目很大,对于包含n个Agent系统来说,其可能构成的联盟结构是O(nn),以至于通过穷举搜索最优联盟结构是不可能的.另
伴随着互联网技术的日益发展,海量数据的集成融合促进了大数据技术的广泛应用,尤其以面向服务为核心的Web Service技术被普遍用来提供新型互联网服务,这使得针对服务提供商及个人用户设计一种基于Web Service的个性化服务推荐系统变得十分必要.因此,提出一种基于混合协同过滤技术进行服务质量(QoS)预测的服务推荐模型.该模型利用迭代训练的思想,不断提升服务质量预测值的准确率,并通过基于预测树