基于自然语言处理和机器学习的实体关系抽取方法研究

来源 :图书馆学研究 | 被引量 : 0次 | 上传用户:linan9348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实现非结构化文本中实体关系的有效抽取,并形成一条简单化、易操作、可重复的实现路径,为图书情报等相关领域分析处理与整合利用网络非结构化数字资源提供方法基础.充分结合自然语言处理与机器学习方法的优势:首先,通过词性标注、句法分析等多种自然语言处理方法实现对非结构化文本数据的语义化处理与特征提取,使其转变为机器学习模型可以接收的输入;其次,采用远程监督和设计决策程序的方式将得到的初始化特征进一步转换为机器学习模型可以使用的一组规则化标签;最后,指定预测变量,训练机器学习模型,使其能够使用预先生成的标签数据进行学习和推理,并推断出实体关系的边际概率.能够使用预先给定的领域知识提高非结构化文本中实体关系抽取的精度和质量,并有效解决一定的统计推断问题.暂未能在一些专业领域进行验证,有待引入和开发可扩展的高性能学习和推理引擎,以支持更多的基础机器学习算法的快速运行.
其他文献
通过网络调研和文献调研,从服务概况、科研数据管理政策体系、数据管理计划、主动数据管理、数据发布和保存5个方面梳理苏黎世联邦理工学院科研数据管理的实践经验.结合我国高校科研发展的具体情况,为我国高校图书馆科研数据管理工作的顺利开展提出建议:强化政策引领,建立完善的科研数据管理保障体系;优化管理模式,构建科研数据管理服务体系;重视技术驱动,提供一站式科研数据管理服务.
在信息素养教育从“普适技能”到“情境化能力”变革的时期,探索符合ACRL《高等教育信息素养框架》及元素养理念的泛信息素养情境化教育体系.从泛信息素养教育及相关概念出发,构建泛信息素养情境化教育模型,并进行教学案例实证研究.总结泛信息素养教育需要构建面向学科融合、学术交流生态系统、数据素养与能力以及特定社会文化等情境的教学内容,并基于元认知理论,分层次用“情境识别”“情境创设”“情境统合”策略完成泛信息素养情境化教育的“知识目标”“能力目标”和“价值目标”.
以大数据、人工智能为代表的互联网技术以及以该技术的平台组织为代表的数字经济实践表明,人类活动正处于不确定环境中.知识服务的提供者——图书馆需要重新进行角色定位,重塑内涵,以适应数字经济等外部环境变化所带来的影响.全面梳理图书馆知识服务相关文献,在总结知识付费、知识开放、知识共享等因素的基础上,分析数字经济背景下知识付费、知识开放对图书馆知识服务的影响,并构建数字资源、组织模式以及开放模式三个方面并重的图书馆知识服务创新路径,为我国图书馆的角色定位与内涵发展提供重要的重塑依据.
在向智慧图书馆转型的背景下,无接触式服务逐渐成为公共图书馆服务的主流方式之一.文章通过网络调查、内容分析和电话访谈等方法对我国128家公共图书馆进行调查分析,了解公共图书馆的无接触式信息发布、无接触式资源使用、无接触式自助服务、无接触式网络服务、无接触式参考咨询和无接触式智慧服务等无接触式服务现状.从整体发展的角度提出构建公共图书馆无接触式服务体系,主要包括无接触式用户服务、无接触式空间服务、无接触式自助服务和无接触式延伸服务.
中国版刻古籍图文并茂地呈现了中国古代纺织技术水平,是我国纺织史上遗留下来的重要物质文化遗产.从设计学的研究视角,深度挖掘版刻古籍纺织图像,提出基于“纺织图像-母体文献”双轨分类体系建立可视化纺织图像谱系,并在“8+5+4”实体-联系模型的基础上设计数据库检索系统,为纺织领域的研究者们提供一个获取中国版刻古籍纺织图像、文献和设计解读的网络资源载体,对于在高校数字图书馆资源平台环境下实现版刻古籍纺织图像的再生性保护和数字化传承具有重要价值.
信息检索范式经历了系统导向、用户导向阶段,正在转向认知导向.信息检索的认知主义范式为进一步解决人类知识需求和利用问题提供了理论支持.以波普尔3个世界理论为基础,对信息检索的认知主义范式的内涵、空间模型和交互阶段进行了解读,进一步明确了认知主义信息检索具有感知计算、迭代交互、动态聚合、智能发现的核心属性.在此基础上,构建了由用户认知系统、信息检索系统以及交互系统组成的用户认知导向的信息检索框架.以科研用户活动为例,构建了面向用户需求的知识服务系统作为应用范例,进一步说明和论证了认知导向的信息检索框架的预期应
为发挥我国高校图书馆参与数字人文教育服务中的作用,采用网络调查法、内容分析法、系统分析法对欧美具有代表性的高校图书馆参与数字人文教育情况进行分析,运用WSR(物理-事理-人理)方法论,揭示各维度之间的相互作用.借鉴欧美高校图书馆参与数字人文教育服务的成功经验,提出建立跨机构合作数字人文项目、搭建数字人文教育网络平台、构建数字人文体验空间、采用分层次与多元化的课堂教学、注重跨学科及体验式自主学习模式、设置数字人文馆员岗位、培养数字人文馆员研究与服务能力等建议,为高校数字人文育人提供一种新框架、新视角和新实践
为进一步了解图书情报院校发展定位话语设置情况,多向度、多功能、批判性地把握当前图书情报教育的发展特征.采用费尔克拉夫的三向度理论,从文本、话语实践、社会实践3个向度对iSchool联盟院校发展定位话语进行整合分析.研究结果显示,文本向度层面,院校定位话语能够较好地回应社会和学界的发展热点,呼应iSchool联盟定位;话语实践向度层面,院校、政府和社会等话语主体间存在协调关系,话语客体涉及院校、学生、教师3个方面;社会实践向度层面,自身环境、行业环境、外部环境三者彼此间形成一个交叉融合的有机体,共同影响着院
对历届(2002-2021年)IFLA国际图书馆营销奖获奖项目汇总整理和全景式扫描,结合2021年济南市图书馆获奖项目“泉城书房——快递小哥驿站”,在消费者、成本、便利和沟通4个方面提炼项目营销特点,提出四点启示:挖掘潜在用户群体,聆听用户需求;借助社会优势力量,发展协同营销;丰富阅读服务供给,优化营销环境;加强营销效果评价,注重营销规划.
运用文献调查法和网络调查法,分析我国公共图书馆与红色旅游融合发展的现实需求,总结归纳两者融合发展的实践模式,包括常规业务模式、数字服务模式和红色主题图书馆模式.在此基础上探索我国公共图书馆与红色旅游高质量融合发展路径,即未来公共图书馆应当从“走出去”和“引进来”两大视角,立足资源、空间、服务三大维度开展与红色旅游的高质量融合实践.