【摘 要】
:
基于话题信息、词的位置关系和互信息等特征,提出一种无监督的跨语言词义消歧算法。该算法仅利用在线词典和web搜索引擎,通过上下文信息选择评论句中多义评论词的词义。实验
【基金项目】
:
国家自然科学基金(60573189,61005052);国家科技支撑计划(2012BAH14F03);福建省自然科学基金(2006J0043)资助
论文部分内容阅读
基于话题信息、词的位置关系和互信息等特征,提出一种无监督的跨语言词义消歧算法。该算法仅利用在线词典和web搜索引擎,通过上下文信息选择评论句中多义评论词的词义。实验结果表明,所提出的词义消歧算法具有较高准确率,对于具有较多候选词义的评论词仍能表现出较好的性能。
其他文献
目的:分析牙槽骨高度降低对上颌前磨牙桩核冠修复后应力分布的影响,为临床桩核冠修复设计提供理论依据。方法:采用锥束CT扫描数据建立牙槽骨高度不同的上颌前磨牙桩核冠修复模
XML在数据交换中的应用越来越广泛,但由于标记引入而使其空间膨胀较大,对传输及存储资源耗费严重。压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行高效的查
目的:分析血浆D-二聚体水平在肝硬化患者不同病因、不同肝功能分级、不同并发症之间的表达情况,探讨其参考价值。方法:选择2015年3月-2017年3月本院住院治疗的肝硬化患者120
"道德主体"是讨论儒家现代价值的基础。福柯认为,以"笛卡尔时刻"为标志,真理与主体的关系断裂了,现代自我既受到规训权力的制约和生产,又发展出自我关怀的技术试图逃离权力,这指
<正>杭州市清泰实验学校,是由原杭州铁路中学和铁路第五小学合并组建的一所九年一贯制学校。学校地处清泰门外,闹中取静,四季绿树成荫,开辟了富有深厚文化内涵的听雨苑、墨香
近年来,随着锂的市场需求量不断增长,从液态锂资源特别是从盐湖中提取锂,已成为锂工业发展的主攻方向。我国盐湖卤水中含有大量的锂资源,但其含量低、分布广,且含有其它的碱
提出一种基于Adaboost的实时算法,并应用于车载嵌入式系统。用红外光源和红外摄像头获取驾驶员的视频图像,对其疲劳状态进行监控。首先通过人脸检测定位驾驶员的人脸,然后提
本文探索了“Ca ̄(14)CO_3法”和“有机碱法”两种测定水中痕量 ̄(14)C的方法,并进行了核反应堆循环冷却水的实际测量。“Ca ̄(14)CO_3法”是先把水样(约300mL)用5mool/LH_2SO_4酸化并加热蒸馏出 ̄(14)CO_2气体,再用NaOH和CaCl_2浓集吸收 ̄(14)CO_2并生成Ca ̄(14)CO_3沉淀;最后把
<正>在中国共产党执政的60多年里,1976年是极不寻常的一年。从这年年初开始,一条条噩耗伴随着一个个重大事件接踵而至:1月8日,开国总理周恩来病逝;清明节前后,爆发了以北京天
针对目前裂缝性储层建模方法存在的问题,探讨DFN离散裂缝网络模型的裂缝性储层建模的思路和方法,提出分大尺度和中小尺度两种裂缝级别建立DFN离散裂缝模型。首先,按照确定性