基于词语相关度的文档主题抽取算法

来源 :成都大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hyc20008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考虑到文档中出现频率较高的词语能够体现文档的主题,设计了一种中文文档主题抽取算法.该算法首先对目标文档进行预处理,然后计算文档中每个词语的出现频率,用出现频率最高的几个词语作为文档的主题.其中,将词语间的相关度作为计算出现频率的参考因素.词语相关度的计算是基于中文知识库《知网》的方法.实验证明,本算法具有较高的准确性.
其他文献
运用微分求积法研究了Winkler地基上变厚度矩形板的弯曲问题.给出了四边简支与四边固支Winkler地基上等厚度矩形板的解,同时给出了Winkler地基上变厚度矩形板的解.从算例的结
随着经济发展和城市化进程的加快,城市缺水问题尤为突出。当前相当部分城市水资源短缺,城市缺水范围不断扩大,缺水程度日趋严重。为了维持社会的可持续发展,必须彻底改变原有的水
9月7日-9日,由中国城镇供水协会科学技术委员会主办的“2005年城镇供水行业服务热线建设研讨会”在上海隆重举行。来自全国自来水行业的54家企业的领导及信息管理专家124人参
据北京市水务局副局长毕小刚介绍,“十五”期间全市总用水量从2000年的40.6亿立方米,下降到2005年的34.5亿立方米,平均每年下降1亿立方米。
为了促进荞麦和燕麦的高附加值利用,在分析荞麦和燕麦营养价值及功能性的基础上,总结了近年来生物酶技术在荞麦和燕麦加工利用中的应用.总体上看,在荞麦和燕麦加工中生物酶技
分析了汽车电动助力转向系统的结构,选择直线型的助力特性曲线进行控制,通过PID控制方法对电机进行控制,建立电机控制的数学模型,并在Matlab/Simulink仿真环境中搭建出电动助
目前,生物监测室消毒工作是监测站质量管理中的一个薄弱环节,生物检测室消毒管理尚无统一的标准,对物品、试验用品和室内空气只管进行消毒,不考虑消毒效果,这些可能会造成检测结果
在邓小平教育理论的指导下,我国高等教育从十年文化大革命动乱中走出来,打碎"两个估计"的精神枷锁,恢复高考制度,实现拨乱反正;邓小平"科教兴国"思想奠定了高等教育发展的思
详细介绍CFG的特点,作用原理,设计方法及工程应用情况.并指出CFG桩加固软弱地基具有良好的社会效益和经济效益.
根据<高职高专教育英语课程教学基本要求(试行)>规定,我国高等职业教育,普通高等专科教育和成人高等教育所确定的教学目标是培养实用性人才,高职高专英语教学应贯彻"实用为主