蛋白质相互作用有向关系抽取的特征选择

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户：hghg2000

【摘要】

：

蛋白质相互作用关系抽取是蛋白质知识网络构建的必要前提，对生物医学领域的研究具有十分重要的意义。本文使用了基于SVM的方法，从生物医学文献中抽取蛋白质相互作用的有向关系

【作者】

：

刘培磊;李满生;王挺;

【机构】

：

国防科学技术大学计算机学院,湖南长沙,410073

【出处】

：

第五届全国信息检索学术会议CCIR2009

【发表日期】

：

2009年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蛋白质相互作用关系抽取是蛋白质知识网络构建的必要前提，对生物医学领域的研究具有十分重要的意义。本文使用了基于SVM的方法，从生物医学文献中抽取蛋白质相互作用的有向关系。首先针对蛋白质关系的特点，抽取了几组合理有效的特征集合，并根据句法分析的结果设计了依存句法特征集合，有效地改善了蛋白质关系抽取的效果。在此基础上，围绕蛋白质相互作用的关联词抽取特征，判断了蛋白质相互作用的方向，为蛋白质知识网和生物实体关系网的构建提供了更为充分的信息。本文在LLL05语料上进行了实验，取得了较好的效果。实验结果表明，依存句法特征集合对关系抽取具有重要影响;围绕关联词抽取的特征集合对关系判断是十分有效的。最后，本文分析了不同特征对实验结果的影响，明确了下一步的研究方向。

其他文献

中国氮肥工业协会名誉理事长刘淑兰

目前,中国硝酸硝铵产能和产量已经自给有余,且在生产技术、安全管理方面逐渐成熟,但整个行业发展中存在着产能过剩、创新能力不强问题。未来硝酸硝铵应发挥自身优势,通过发展

期刊

氮肥工业刘淑兰产能过剩硝铵农业应用生产技术生存发展空间水肥一体化配肥

面向专利文献的中文分词技术的研究

针对专利文献的特点，本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记，结合切分文本的上下文信息进行最大概率分词，并利用术语前后缀规律

会议

专利文献中文上下文信息未登录词切分概率分词文本识别问题分词方法前后缀后处理多策略语料统计术语实验规律测试标记

基于词语形式标记的句际语义关系自动识别方法

句际语义关系是指语篇上下文中相邻句子之间存在的语义关系。准确的识别句际语义关系对于文本理解、文本推理和文本结构分析具有重要的意义。然而，由于受到语篇上下文环境、指

会议

一种开放式中文命名实体识别的新方法

本文研究开放式中文命名实体识别问题。针对传统命名实体识别方法具有训练语料标注困难，自适应能力不强等缺点，研究人员提出了开放式的命名实体识别。但由于汉语的特殊性，使得开

基于词位置与同现特征的中文自动文摘研究

在利用统计方法对文摘中词频特征和词位置分布特征进行分析的基础上，提出增加词同现特征用于自动文摘系统的新方法。文中把该方法表示为基于词位置与同现特征的中文自动文摘模

基于奇异值分解的蛋白质关系抽取

随着生物医学的迅速发展，从医学文献中抽取蛋白质关系已经成为面向生物医学方面的自然语言处理任务中一项非常重要的任务。目前研究学者已经提出很多蛋白质关系抽取的方法，但是

会议

基于模板抽取和丰富特征的药名词典生成

近年来，关于药的作用及其对人类健康影响的研究越来越多，相关的文献也迅速增长，工业界认为90％的药物标靶来自于生物医学文献，随之基于药的相关检索逐渐成为焦点。而为相关专家提高

会议

基于伪LCS的中文专利句子相似度计算方法

针对专利文献专业术语相对较多、形式规范、语言严谨的特点，本文提出了一种基于伪LCS的句子相似度计算方法。该方法通过对传统的最长公共子串(LCS)算法进行改进，并加入了词汇语

会议

中文专利文献句子相似度计算相似度计算方法最长公共子串专业术语语义信息形式规范语言算法实验对齐词类词汇

中文网页搜索日志中的特殊命名实体挖掘

特殊命名实体**是指字面特征不明显、与人们日常生活和休闲娱乐活动密切相关的实体名，比如电影名、餐馆名、大学名以及人名等等。在以娱乐为主的中文搜索中，这些命名实体占据重

会议

杨向阳:我得花些时间享受一下人生

“很多书我都没看过,很多作家都没听说过,很愚蠢。那么多思想,人类宝贵的财富,那么美好的东西我都没有经历。”2011年,我跟(薛)蛮子一样也得了癌症,也是肠癌,部位也差不多,但

期刊

杨向阳细胞治疗免疫治疗生物医药过程论大音希声《几何原本》八年思考点大象无形

蛋白质相互作用有向关系抽取的特征选择

与本文相关的学术论文