【摘 要】
:
新词发现在自然语言处理领域具有重要意义,在微博内容上的新词发现比在一般语料上更难.文中提出引入词关联性信息的迭代上下文熵算法,并通过上下文关系获取新词候选列表进行
【机 构】
:
智能技术与系统国家重点实验室,清华信息科学与技术国家实验室筹,清华大学计算机科学与技术系
【基金项目】
:
国家自然科学基金项目(No.60903107,61073071);国家863计划项目(No.2011AA01A205)资助
论文部分内容阅读
新词发现在自然语言处理领域具有重要意义,在微博内容上的新词发现比在一般语料上更难.文中提出引入词关联性信息的迭代上下文熵算法,并通过上下文关系获取新词候选列表进行过滤.为进一步提高精度,引入自然语言处理中的词法特征,提出与统计特征相结合的过滤方法.与现有方法相比,准确率和召回率均有大幅提高,F-值提高到89.6%.
其他文献
我国全面推行素质教育,美育被列为教育方针的内容之一,音乐教育作为美育教育的重要载体,得到了迅速的发展。但是,由于教育观念、教育内容、教育方法和评价体系等方面的制约,
交易量和空盘量是衡量期货市场交易活跃程度的两个重要指标。将交易量、空盘量分别分解为可预期和不可预期两部分,可更准确地研究交易量、空盘量与期货价格收益之间的动态关
在中国服饰史上,清末至民国时期的女性服饰有着重要地位,其变革也最为明显,本文将文化语境的概念引入近代女性服饰文化研究中,通过近代文化语境来呈现和感知近代社会文化背景,其中
社交网络服务伴随着移动网络技术的发展以及智能移动终端的大众化与更新换代,正以其蓬勃发展的强劲势头席卷全球,几乎世界的每个角落都有它的身影,它不仅缩短了人们之间的距
随着近年来我国离婚率的不断增加,关于未成年子女的探望、抚养等民事纠纷也日益增多,逐渐成为一种社会问题引起了全社会的关注。我国的《婚姻法》于2001年对探望权制度进行了
由于现存法律制度不够完善,不能有效解决日益增多的网络侵权问题。本文通过分析网络商家安全保障义务产生的理论基础,结合具体的网络侵权案例,利用立论和驳论来论证赋予网络
以各类常见的食品为材料,分别采用凯氏定氮法和杜马斯燃烧法测定其蛋白质含量。对两种方法检测原理及步骤进行对比,并研究两个检测方法的精密度、准确度、回收率和适用范围,
命案犯罪是刑事犯罪活动中恶性程度最高、危害最为严重的犯罪,公安机关历来都把侦破防范命案工作摆在十分重要的位置。本文以台州市椒江区2000-2007年111起命案为例,进行实证
<正>人力资源是现代企业的一种战略性资源,已经成为企业发展中的关键因素。激励机制是企业人力资源管理的重要内容,是指组织系统中,激励主体通过激励因素或激励手段与激励客
慢性肾脏病是一个严重的公共健康问题,威胁着患者的身心健康,给患者及社会带来了沉重的负担。慢性肾脏病在很多国家发病率高达每年每百万人群中200例,在美国、台湾和墨西哥的