基于文法特征的无监督能愿词挖掘方法研究

来源 :第六届全国信息检索学术会议 | 被引量 : 0次 | 上传用户:chester116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于文法的无监督方法,挖掘中文里的能愿词,这些能愿词可以成为识别人们意图和愿望的重要特征。例如“能够”,“必须”,“宁愿”等等。另外,本文还介绍了在大规模中文博客资源中自动提取并标注能愿词的方法。实验验证,该方法的正确率和召回率分别可达74.25%和76.03%。在此基础上,本文根据推演公式提出了对中文能愿词进行迭代挖掘的思想。
其他文献
企业会计内部监督工作开展,是对企业的会计管理的所有内容科学监控,有效识别企业发展的问题.在企业的会计内部监督机制建设和实施中,也存在一定的影响问题,使得企业会计内部
识别不确定性信息对于信息抽取类的任务有着重要作用,因为不确定性信息往往会误导这些系统抽取出错误的信息。本文提出了一种自动识别中文中不确定性句子的方法,利用不确定性句
信息抽取是搜索引擎中的核心组成部分,发挥着举足轻重的作用。伴随着互联网信息的爆炸式发展,传统的搜索引擎已经不能满足人们的需要。大量有针对性作用的搜索引擎应运而生。Ht
做一个顶尖人物的24小事是什么样子的?在飞机上处理公务?早餐时间连线世界各地开电话会议?在度假海滩上接受盈利报告?在spa的时候苦想渠道建设?这些商务形象早已经out,不是成
2005年,福建省保险改革发展的新闻大事不断涌现,很大程度上让当地百姓受益匪浅。福建保监局、福建省保险行业协会、福建省保险学会因此共同评选出了2005年福建保险十大新闻。
悖向重排序是一种面向个性化信息检索的新型排序策略,其借助相悖于查询意图的描述结构,实现倔强非相关反馈的识别和降解。目前,悖向重排序研究中的关键问题之一是如何建立极大区
会议
物流信息技术是技术性很强的专业,为了培养学生具有较高的信息技术技能和树立为人民服务的思想,物流信息技术国家级职业教育专业教学资源库项目团队依据专业特性和训练技能要
期刊
财务管理是经济主体运行管理的核心,因为其掌握着企业的经济命脉.随着时代发展,财务管理也必须要随之改变,否则就会成为企业发展的制约.本论文讨论了大数据时代对电力企业财
随着供电企业的崛起,电力营销业绩也是逐日攀升,但附带产生的增值税问题也成为国内的焦点话题.就当前电力企业快速拓展的过程汇总,电力企业在国内有关税收规定的框架下,科学
Web 访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话中的主题(topic)是指会话中具有相同用户意图的部分。将session 进一步划分成能体现用户
会议