基于MMSeg分词的多部主题词表联合标注研究与实现

来源 :绍兴文理学院学报 | 被引量 : 0次 | 上传用户:gen19gu86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决多部主题词表联合标注中标注词条数量大、子串较多等问题,本文提出了基于MMSeg分词的标注方法.采用MMSeg分词算法将待标注文本先切分形成词串再进行标注,并改进了分词词典从而支持子串的标注,保证了较高的召回率.还就相关内容进行了研究并给出了具体实现.运行结果表明基于MMSeg分词的多部主题词表联合标注在标注速度、召回率和精确率方面均达到了实用要求.
其他文献
宋元鼎革,蒙古人建立元政权,成为统治的特权阶层。南宋皇亲贵族则与之发生大颠倒,失去权力与社会地位。这种身份的改变,在杭州城尤其明显。宋亡后,南宋理宗驸马杨镇出仕元朝,
辛亥革命前夜的皖浙起义主要由徐锡麟和秋瑾组织,学术界对此并无异议.然而,皖浙起义由光复会领导,光复会领袖陶成章在其中贡献尤大,却为学术界所忽视.陶成章引导皖浙起义的组
通过观察2013年届联合会杯足球赛16场比赛的实况录像,对本届比赛产生的68个进球进行统计分析发现,本届比赛的进球数高于上届比赛;抢点为进球最多的射门方式;下半场开始时15min和
在陆游的著述中,有一些资料和信息,弥补了厉鹗《宋诗纪事》、陆心源《宋诗纪事补遗》、孔凡礼《宋诗纪事续补》、钱钟书《宋诗纪事补正》的缺失,具有珍贵的研究宋诗的价值。
基于现行服装号型标准不能较好地反映当代人体特征的现象,随机抽取200名绍兴地区18~25周岁女青年进行人体测量,应用SPSS软件对所采集数据进行相关数理统计分析.以胸腰差为分
基于已有的研究,归纳了知识管理的五个流派即学习流派、过程流派、技术流派、智力资本流派和战略流派,详细论述了各流派的形成过程、学科基础、代表人物、主要观点、典型模型,以
在全球化浪潮的冲击下,国家认同问题日益凸显,而且更趋复杂。全球化引发的认同危机给国家带来的巨大挑战,主要表现为:个人层面的公民多重身份的构建对国家认同的竞争,文化层面
11月1日2日,由中国管理现代化研究会主办,中南大学商学院承办的第三届(2008)中国管理学年会在长沙明城国际大酒店举行。全国人大常委会原副委员长、中国管理现代化研究会理事长
本文以我国IT行业上市公司为样本,从个人和团队整体两个层面分析了高层管理团队成员的异质性与高层更换的关系.结果表明:在个人层面,年龄和领薪方式的异质性增加了董事长、总
越商企业的健康成长与良好的公司治理实践密切相关.通过公司治理调整和理顺企业发展的核心利益机制,越商企业的可持续成长才会得到保障.规范的公司治理是防范民营企业运营风