自动抽取相关硕士博士期刊学术论文

自动抽取相关论文

基于K最近邻的隐含主题自动抽取

现有的关键词抽取技术仅仅是对正文词汇的抽取，不能够抽取隐含主题。隐含主题的抽取是关键词自动抽取技术的难点。众所周知，K最近邻......

会议

关键词自动抽取 K最近邻隐含主题向量空间模型

术语同义词的自动抽取

术语同义词对的自动发现和识别在文献检索领域有着重要的研究意义和应用价值。本文提出一种在文献中自动抽取同义词的方法，它将问题......

会议

同义词指代消解 SVM分类器自动抽取

基于语义的Web服务主题自动抽取

从特定领域的多个Web服务中自动抽取出描述其功能特征的主题信息,利于服务分类管理、高效服务发现及合成.将WSDL文档中的服务、操......

会议

Web服务服务主题自动抽取统计计算权重语义覆盖度

面向传媒语言语料库的关键词自动抽取研究

本文根据广播电视语言及其关键词的特点，提出通过建立过滤词典过滤垃圾串直接切分短语，并将切分好的短语序列作为关键词候选，进而对其......

会议

自动抽取关键词传媒语言语料库短语切分过滤词典

领域术语自动抽取方法研究

提出了一种领域术语抽取方法,该方法结合分词和粗切分两种方式对语料进行处理,利用体现字串间结合强度的互信息算法构建候选词集,......

会议

领域语料自动抽取粗切分术语抽取领域种子词

基于SVR模型的中文术语自动抽取研究--面向图书情报领域

本文结合语言学和统计方法,首先通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对......

会议

图书情报中文术语自动抽取 SVR模型

网络环境下知识抽取的特点与应用前景

从知识抽取技术在网络环境下面临的新挑战入手,在对国内外相关研究项目进行深入分析的基础上,认为网络环境下知识抽取开始表现出技......

期刊

知识服务抽取技术基础化互联网站终端服务使用记录答疑系统网页内容自动抽取分布式应用程序

基于引用背景信息的关键词自动抽取方法研究

科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于......

期刊

自动抽取关键词科技文献引用 automatic extraction keyword scientific literature citatio

面向情报学课程设置的数据科学技能素养自动抽取及分析研究

情报课程是情报学教学体系的核心和灵魂,是新的情报学人才培养模式的基础。在大数据、数据科学、人工智能发展的大环境下,数据学科......

期刊

情报学课程数据科学深度学习自动抽取 informatics curriculum data science deep learning automatic

WD—ZBJ中文文献自动标引检索系统

本系统是在ＩＢＭ－ＰＣ机上应用ｄｂａｓｅ Ⅲ实现的。具有自动标引、机编索引、联机检索和定题服务等功能。采用“关键词的部件词一尾续词词典”和“非......

期刊

自动标引 ZBJ WD 检索系统自动抽取情报检索联机检索检索效率中文文献定题服务

完善财务共享费用报销系统的实践与建议

中国石化在改革发展和经营规模高速增长的背景下,建立了财务共享费用报销系统,目的是为了解决中石化所属各个企业财务报销标准、业......

期刊

自动抽取货币资金集中核算系统用户登录系统经营规模业务流程资金结算集成功能业务招待费系统上线

新生借书证办理与校内信息资源共享

一、引言每年的九月份是高校新生入学的时间,也是图书馆最繁忙的季节。要在短时间内及时地为新生办理借书证,是一项艰巨的任务。......

期刊

资源共享读者信息流通管理计算机图书联合目录校对工作直接打印招生量工作效率自动抽取

中文文献主题的自动标引

本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统ＣＳＡＩＳ２．１的主要思路、基本算法及其基本结构 This article int......

期刊

自动标引文献主题中文文献上海交通大学应用技术研究所自动切分标引人员《情报学报》自动抽取自动分词

针对学术定义的抽取规则构建方法研究

学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一......

期刊

学术定义知识抽取规则构建文本信息自然语言处理

会议文献开放资源采集与服务系统的元数据抽取

在会议文献开放资源采集与服务系统中实现了自动抽取＋人工校对的元数据抽取流程,并设计了一个自动抽取器。针对会议文献开放资源本......

期刊

数据抽取开放获取服务系统会议文献自动抽取元数据信息抽取资源采集实体类模板

技术路线图中未来技术词表构建方法研究

利用文本挖掘技术,并结合科学计量、自然语言处理等方法,提出一种基于三重共现算法的技术路线图中未来技术词表构建方法,以揭示特......

期刊

未来技术三重共现技术路线图科学计量自然语言处理文本挖掘技术特征词匹配算法自动抽取情报分析

等线体和圆头体曲线轮廓字形的自动生成系统

本文叙述了等线体和圆头体汉字曲线轮廓字形的自动生成系统．该系统从黑体汉字曲线轮廓字形中自动抽取骨架单线体，结合等线体和圆头体......

期刊

等线体曲线轮廓曲线段生成系统

基于Sesame及Rdfizer扩展工具的关联数据应用平台

采用MetaStudio和DataScraper对网络源非结构化数据按照需要进行自动抽取和XML结构化,并自主开发Rdfizer软件包,将XML数据转换为RD......

期刊

关联数 Sesame框架 RDF 关联数据自动抽取非结构化数据转换 Sesame Rdfizer 发布平台

社会信息化情境下用户在线评论数据挖掘模型构建研究——以汽车行业负面观点评论自动抽取系统为例

随着互联网技术的发展,Web逐渐变为更主流的用户信息反馈平台。其中用户评论信息为政府决策、企业发展提供更为具体化、细节化的用......

期刊

汽车评论观点抽取句法分析图传播算法词极性分类

引文元数据的自动发现和标注方法研究——以外文引文为例

【目的】在总结当前引文元数据抽取方法的基础上,结合语义学知识和机器学习方法,对引文元数据的自动抽取方法进行探索。【方法】实......

期刊

元数据信息神经网络机器学习元数据抽取标注方法自动抽取向量空间抽取方法分类算法支持向量机

知识组织系统构建技术研究

文章从传统知识组织系统和现代知识组织系统两方面介绍了知识组织系统构建研究现状,并从术语自动抽取及统一知识组织系统自动映射......

期刊

组织系统构建技术研究现状自动抽取知识信息资源术语抽取现代知识查询扩展相关方法可移植性

信息领域汉英术语的特征及其在语料中的分布规律

在对 725万字的信息领域专业文献中带英文注释的术语（汉英术语）进行了人工标记，然后利用程序提取汉英术语及其前界环境（前至少 4个汉字......

期刊

自动抽取语料库汉英术语信息领域语料库人工标记术语自动抽取分布规律相关统计数据前界注释

英语复合词生成趋向的协同语言学研究

本研究以上海交通大学科技英语语料库(JDEST)为基础,运用计量语言学的研究方法,以协同语言学为理论框架,对英语复合词的生成趋向进......

期刊

语言学理论词长词干义项数复合词生成趋向协同语言学计量语言学句法功能自动抽取研究方法语言学习

基于极大相容块的产品评论文本情感分类研究

随着网络技术的迅速发展,Internet已成为大多数人们表达自己观点和获取信息的平台。越来越多的商家通过网上出现的大量评论信息,了......

学位

情感分类关联三元组特征重要度极大相容块 Bootstrapping

口语解析与短语翻译对自动抽取方法研究

口语翻译是语音、语言技术领域重要的研究方向之一，具有巨大的应用价值。口语翻译涉及到语言学、计算机科学、语音识别、语音合成和......

学位

口语解析短语翻译语音识别自动抽取机器翻译

面向上市公司公告的文本聚类技术研究与应用

本文针对自动聚类技术进行了一定的研究工作，并将其应用于研究上市公司公告对股价的影响。详细分析和研究了文本聚类技术的各个方面......

学位

文本聚类特征词自动抽取上市公司公告

基于贝叶斯排序学习的关键短语自动抽取

关键短语自动标引技术可以有效地从文本中自动抽取出关键短语，近年来一直是自然语言处理领域的研究热点之一。其中，自动抽取方法是当......

学位

关键短语自动抽取排序学习算法朴素贝叶斯模型置信分数 AJS评测

中文电子书的元数据自动抽取研究

元数据是指用来标志、描述和定位电子资源的数据，也被称为数据的数据。它专门用来描述数据的特征和属性、提供某种资源有关信息的结......

学位

中文电子书元数据自动抽取

基于双层模板结构的机器翻译方法研究

传统的基于实例的机器翻译方法对语料库规模要求极高,而在语料库规模不够的情况下存在精确匹配率不高、模糊匹配译文质量差等缺点,......

学位

机器翻译双层翻译模板自动抽取原型系统

专业领域术语抽取的研究

本文对汉语术语的抽取进行了一定的研究，设计了一个统计方法和规则方法相结合的汉语专业领域术语抽取算法，并具体实现。在本文的实验......

学位

汉语专业术语抽取算法自动抽取规则方法统计方法

文本数据挖掘在工程图文档中的应用

文本数据挖掘技术是自然语言处理研究的重点问题之一,而工程图文档是工业技术中的重要数据媒体之一。在信息时代,同其他多媒体数据......

学位

文本数据挖掘工程图信息检索文本分类信息隐藏

生物信息文献数据库构建与软件Web自动发布

随着Internet的迅猛发展,信息逐步数字化、网络化、全球化。如何高效、准确地利用互联网上的有用信息已成为人们关心的课题。对于......

学位

文献数据库元搜索引擎生物信息软件信息抽取 Web自动发布 MVC设计模式

基于源代码的设计模式自动抽取技术的研究

设计模式为设计者们交流讨论、书写文档以及探索各种不同的设计提供了一套通用的设计词汇。在许多大型软件系统的开发过程中，开发者......

学位

设计模式软件系统 JAVA源代码自动抽取

WEB数据自动抽取技术及其应用研究

随着Internet的飞速发展,网络中包含着海量可以被利用的数据。其中由Web数据库返回并根据预定义模板展现在用户响应页面中的数据记......

学位

Web数据抽取自动抽取标签树视觉信息

基于领域特征的两阶段查询接口抽取技术的研究实现

近几年，大量丰富而有价值的数据在网络中趋于深化，隐藏在查询接口后面的在线数据库中。这些“Deep Web”数据与基于静态网页的“Surf......

学位

查询接口自动抽取领域特征在线数据库 Web数据集成

中文上下位关系自动抽取技术研究

词汇之间存在多种关系,如：上下位关系、同义关系、反义关系、整体-部分关系等等。其中,作为重要语义关系的一种,上下位关系是描述事......

学位

上下位关系语境相似度布朗聚类相似度点互信息模式匹配聚类验证

基于视觉特征的BBS用户发言信息抽取技术研究

本文研究从BBS主题网页中自动抽取用户发言信息的问题。该类问题的传统解决方法主要基于对HTML网页的DOM树和标签结构的分析,密切......

学位

BBS用户发言视觉特征信息抽取聚类视觉块

Web数据抽取技术研究

当今,互联网已成为信息传播与共享的重要资源。由于Web数据的半结构化、异构、海量等特点,使得传统的数据挖掘技术不能直接运用到W......

学位

Web数据挖掘 Web数据抽取自动抽取扩展DOM树信息抽取模式

面向专利的双语术语自动抽取技术的研究

术语集中承载特定领域的核心知识,术语的自动抽取能够辅助人们便捷地获得和积累该领域知识,而双语术语更是兼有两种语言的映射关系......

学位

双语术语相似度条件随机场机器学习机器翻译

基于J2EE-SSH框架的小鼠信息数据库系统的设计与实现——PBMICE-SR语义检索框架

针对PBmice小鼠信息系统功能扩展的需求,文章提出并实现了PBMICE-SR语义检索框架。检索框架在PBmice系统基础上提供了智能获取数据......

学位

PBMICE-SR DAGSVM-BM25 语义检索切面自动抽取

一种基于前缀表达式的Web信息抽取方法的关键问题的实现

万维网的迅猛发展,引起了Web数据的急速膨胀。面对泛滥的海量Web信息,“富数据,贫知识”的现象引起了越来越广泛的重视。为了解决......

学位

网页信息抽取前缀表达式包装器爬虫算法网页去噪

实体关系自动抽取技术的比较研究

随着计算机技术和网络技术的不断发展,海量信息以电子文档的形式出现在人们面前。从这些自然文本中提取出有用的信息,日益成为人们......

学位

实体关系抽取领域术语抽取 Bootstrapping 聚类 DCM合并

基于语义文法的实体空间关系知识的获取方法研究

地理信息与知识是组成客观知识世界的重要内容。互联网上大量的地理信息都以非结构化的文本形式存在,如何利用智能化的方法,从网页......

学位

空间关系地理本体语义文法知识抽取

基于互联网的城市机构知识条目抽取方法

随着互联网的高速发展,网络信息成爆炸式增长,百科知识已经成为人们获取知识的重要手段。人们对垂直化知识的需求对百科知识库提出......

学位

互联网城市机构知识条目自动抽取相关度百科知识库自动构建系统

基于Markov网络模型的复述自动抽取方法的研究

复述是含义相同而表达方式不同的词、短语和句子。例如,英文单词“film”和“movie”为单词级别复述又称同义词或近义词;英文短语......

学位

机器翻译复述自动评价 Markov网络相关性

大中华区词对齐自动抽取研究

由于文化与地域的差异,中国大陆、香港和台湾(简称大中华区)在汉字的书写和表达习惯上均存在着一定的差异。从形态学角度看,香港和......

学位

大中华区词对齐 word2vec 最长公共子序列映射规则平行语料

基于页面模块识别的Web文章自动抽取方法研究

20世纪90年代以来，互联网技术快速发展，网页页面样式也越发多样。现时的网页中，充斥着大量的导航、广告等与页面主体内容无关的信息，这......

学位

可视化信息页面分块信息抽取分类聚类

基于DOM的Web信息自动抽取技术的研究

随着互联网技术的发展，Web成为各种应用与研究的重要数据源之一，为信息检索、数据挖掘等领域提供高质量的数据。Web中一类重要的数据......

学位

web信息抽取列表页面决策树熵

基于BERT模型的排比句自动识别方法

排比句的条理清晰、气势宏大,为各类文体的写作所广泛使用,但目前排比句自动识别方法的识别效率欠佳。采用深度学习的方法来优化排......

期刊

作文排比句自动抽取 BERT模型

网络环境下医学人才知识结构的自动抽取与呈现

网络化创新外包是企业借助互联网手段获取外部创新力量完成创新研发任务的行为,已经得到企业、人才和学者等的广泛认可,但其发展仍......

学位

网络化外包知识结构自动抽取自然语言处理知识树

看过本文同时还关注