【摘 要】
:
向量空间模型由于其算法简洁,可修改性强,广泛应用于信息检索领域。然而,在运用向量空间模型进行网络中文信息检索的时候,由于传统的TF-IDF方法不能很好的对网页内容进行描述
论文部分内容阅读
向量空间模型由于其算法简洁,可修改性强,广泛应用于信息检索领域。然而,在运用向量空间模型进行网络中文信息检索的时候,由于传统的TF-IDF方法不能很好的对网页内容进行描述,检索精度较低。 N层向量空间模型将文档按照重要程度划分成N层,对每一层的检索单元分别赋予不同的权重,相比传统TF-IDF方法,更能体现文档的特征,能够更好地描述文档。使用N层向量空间模型,会使针对网络中文信息进行的文本检索得到较好的结果。 本文提出了基于N层向量空间模型进行网络信息检索的方法,设计实现了基于N层向量空间模型的网络信息检索平台,并在此平台上,应用信息增益、平衡权重、查询扩展等方法改进算法,最后对实验结果进行了对比和分析。
其他文献
随着互连技术的高速发展,全球信息成几何级数增长,人们在互联网上搜索大量的信息、数据以服务于学习和工作,使用大容量数据文件的次数也越来越频繁,文件再也不是一张小小的软
随着现代通信技术的不断发展进步,高清电视、云计算、物联网、智能生活网等业务的兴起,传统的带宽传输速度已经难以满足人们对互联网的应用要求。GPON(Gigabit-Capable Passi
本文首先分析了网页上信息过滤的基本问题,包括:信息过滤的体系结构;过滤系统的特点及分类;检索和过滤的关系;过滤系统常用的模型以及过滤系统的性能评价指标等。从总体上对过
VDSL2是消除接入网“最后一公里”与全球范围部署三重播放业务,以及逐步过渡FTTH最经济、最理想的接入方式,具有广泛的应用价值与巨大的发展潜力。但是,VDSL2信号频谱的扩展
将EOS功能集成于多业务接入平台,构成MSTP(Multi-ServiceTransvort Platform)设备,相应成为城域网中的关键设备.其担负着在SDH骨干网和以太网的桥梁作用,同时也是网络融合的
软件测试是软件质量的保证。由于面向对象程序设计语言的出现,传统的测试方法已经不能满足面向对象软件测试的需要了。面向对象程序设计语言的三个重要特性是封装性、继承性
随着网络技术的发展,越来越多新出现的业务要求IP网络不仅能提供信息传输的可靠性,而且要能对信息传输的过程具有可预见性,更为重要的是用户要求他们使用的网络在任何情况下
网络技术的高速发展,使得远程教育越来越受到人们的关注。这种基于网络的教育模式将教师和学生分离开来,无法进行面对面的交流与解释,学习者必须进行自主学习。作为网络教学
计算机支持的协同工作(CSCW)能提高人们的工作效率,促进社会生产力的发展,深刻影响人类群体的生产方式、工作方式和生活方式。计算机支持的协同学习(CSCL)是CSCW思想在教育和学
无线Mesh网络具有可靠性高、容量大、组网灵活、成本低廉等特点,其已经成为下一代无线宽带接入技术的研究热点。在一些特殊环境中,由于部署区域内的终端节点移动范围较大,为