无词典抽词的RMMFS和BMMFS方法及其比较研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:skyliou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支持度指标筛选,不需要词典,不需要事先进行语料库学习,不需要建立字索引,通过串匹配获取中文文本中的汉字共现模式,实时地抽取出包含专业术语及专有名词等未登录词在内的专指语义串、短语和词.实验研究了抽词准确率受规则的影响及随文本大小和词频变化的分布,结果表明BMMFS可以取得更好的
其他文献
市场靠信誉,信誉靠质量。现代化企业要在竞争中打造核心优势,除了实现良好的内控和产品质量,更要抓住市场。提升企业的对外应对能力,否刚,仓业很难长足发展。
随着Internet上的信息量急剧增加,如何使用户获得有用的信息已成为Web信息检索研究急需解决的问题.文中提出了一种新方法Improveaccuracy,该方法综合了一系列措施,较好地解决
“智性直观”问题在本世纪的东方思想中发挥了至关重要的影响。一方面,牟宗三赋予“智性直观”概念以“本原直观”、“纵贯直观”和“如相直观”三个解释。他相信“智性直观”
<正> 西藏光核桃[A·mifa(Koenne)Kov·et kost)]又名西藏桃.藏语为康布.为西藏特有的野生桃种.具有适应性强、耐早、耐瘠、抗病、长寿、结果力强、更新容易等优良特性,是极
本文在对电子政务绩效评估进行跟踪研究的基础上,从定性和定量两个方面总结和分析了电子政务绩效评估的研究现状,在此基础上提出了电子政务绩效评估的研究方向和重点内容.
重庆市科委将结合摩托车行业,建设合作示范工程,以保证中国的摩托车产业在技术、市场、服务等方面的管理有质的提升。
专利战略是提升企业市场核心竞争力的重要武器和必备要素,专利申请量、核心技术专利授权量等指标是企业自主创新能力的集中体现。通过收集某一特定区域内的企业专利信息,可以