基于朴素贝叶斯模型的中文关键词提取算法研究

来源 :计算机应用 | 被引量 : 45次 | 上传用户:jiaqishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于朴素贝叶斯模型的中文关键词提取算法。该算法首先通过训练过程获得朴素贝叶斯模型中的各个参数,然后以之为基础,在测试过程完成关键词提取。实验表明,相对于传统的if*idf方法,该算法可从小规模的文档集中提取出更为准确的关键词,而且可灵活地增加表征词语重要性的特征项,因而具有更好的可扩展性。
其他文献
证券化可以在多方面解决再保险市场的无效率,并能够把风险转移给更大更广泛的资本市场。文章分析了国际上主流的巨灾风险连结证券的功能和特点以及与其有关的监管、会计及税
针对基于虚拟同步发电机运行的逆变器并联控制策略进行研究,分析了微电网中逆变器并联功率分配机理。将传统电力系统中的集中控制方式引入微电网逆变电源中,使逆变器具有同步
在分析目前电子商务推荐系统及算法存在问题的基础上,提出了一种准确的、实时的、基于Web日志的Internet电子商务推荐算法。基于客户浏览行为,设计了CGA(CustomerGoodAttribute)模型,综合考虑客户浏览路径和时间、商品属性及其在网页中的分布等因素,研究了客户对商品属性的隐性评分函数,给出了算例说明,讨论了基于商品属性的协作过滤算法。该算法已成功应用于电子商务智能模拟系统中。
随着金融全球化的推进,银行需要更全面了解公司的财务状况,各银行之间也需要相互获取财务信息,这些信息都需要从公司和银行对外公开的财务、商业报告中获取。以往的信息披露
土豆效应又称“土豆悖律”,是指在大萧条时期,消费者舍弃高端奢侈品而转向中低端产品,并导致对后者的需求上升,进而推高低成本产品的价格和销售。无论经济处于什么状态,人总
<正>时间:2016年7月6日-7日地点:河北石家庄国际博览中心3层大会议厅主办:中国印刷及设备器材工业协会丝网印刷分会协办:河北省印刷协会、北京印刷协会、天津印刷协会、山东
随着服装市场竞争的日益激烈,另外,消费者的观念较之以前也有很大的提升,服装类产品越分越细,深挖精细分类,商机就在那里.占尽视线和资源的女装市场,表象一直稳健的男装市场,
<正>富蕾公司成立于2005年,是一家专业生产植绒纸的印纸企业,产品包括普通植绒纸、高档荧光植绒纸以及植绒浆料、各档次静电植绒设备及辅料、植绒机器等。其中富蕾的单色、多
该文提出了一种用于数字助听器的非等宽多通道响度补偿算法.该方法基于人耳对频率的敏感度和对声强的感知,实现了一种非等宽多通道响度补偿方案.首先将语音信号按不同的比例
随着我国改革开放的步伐加速,各种水利工程有关的法律法规政策相继出台,包括1997年的《建筑法》之后的《水利工程建设监理规定》、《水利工程建设项目施工监理规范》等,我国