企业关系挖掘技术研究

被引量 : 0次 | 上传用户:liongliong584
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网电子商务的兴起,越来越多的企业将企业信息发布在网络上。这种渠道使企业的经营市场不再受时间和空间的限制,各企业无论大小拥有一样的信息资源。但是对于企业而言,如何从浩瀚的Internet上获取感兴趣的企业信息,如何寻找企业的潜在竞争对手及潜在合作企业,对企业的经营决策和生存发展都有着极其重要的意义,企业关系挖掘技术研究就是在这一环境下产生的。本文的研究工作包含两方面内容:企业信息抽取和关系挖掘。本文利用了基于DOM的抽取方法抽取企业信息。首先利用网络爬虫从企业门户网站爬取企业网页,由于来自同一个网站的网页在结构上具有很大的相似性。本文利用DOM Tree对企业网页进行解析,首先借用HTML Tidy将HTML格式网页转化为XML格式,然后根据规则进行信息节点定位,抽取需要的企业数据信息。在关系挖掘上尝试了两种方法:基于文本相似度的方法和基于领域Ontology的方法。基于文本相似度的方法利用抽取的部分企业信息作为代表企业的文本,将企业间的文本相似度值作为判定企业竞争关系的依据。本文中以向量空间模型表示企业文本并进行文本相似度计算,并基于此方法进行了实验验证。基于领域Ontology的企业关系挖掘首先对所分析的产品领域构建领域本体,本文详细分析了领域本体的构建过程并借助斯坦福大学开发的Protégé本体构建工具针对计算机领域构建了一个Ontology,并利用Jena解析Ontology文件。通过设定规则对产品的关系产品进行推理查询,针对企业产品查询其相关联产品。因为企业关系通常体现在企业经营产品的关系上,本文中借助Ontology推理出的产品关系判定企业关系。实验证明,这种方法相比基于文本的方法在准确率和召回率上都有显著提高。
其他文献
百丽公司基于产业链纵向一体化的竞争策略使其从中国制鞋行业脱颖而出,在非主流制造领域取得了突破性进展。它的商业实践为中国本土制造企业应对全球化挑战提供了一条可供借
科学的评价一国的汇率水平是否合理,关键是比较其现实汇率是否与均衡汇率水平相一致。理论研究表明,在开放经济条件下,如果现实汇率明显地偏离均衡汇率,即出现汇率失衡,将会
文章介绍了基于电子商务的供应链成员间信任的定义以及产生的信任危机,阐述电子商务下供应链成员间相互信任的作用,对电子商务供应链成员中的信任进行博弈分析,得出单周期下
<正> 本书系统地阐述钢筋混凝土结构中预埋件设计方法及计算实例。结合大量试验研究成果和有关规范规程的规定,着重对新规范中预埋件和吊环设计方法的依据进行了详细的剖析和
基于风洞试验对体育场悬挑屋盖的脉动风压谱进行系统研究,旨在得到适用于此类结构的脉动风压谱模型,为风振响应分析提供必要的信息。通过对屋盖表面脉动风压进行谱分析,可知
激光干涉测量技术以其非接触、可溯源、精度高的特点广泛应用于超精密加工与装备制造业中,随着科学技术的不断进步,对干涉测量技术的测量精度、测量速度与测量范围提出了更高
转型期基层社会问题越来越复杂,基层政府治理能力面临考验与挑战。本文通过分析农村公共文化服务体系构建中出现的各种问题,聚焦基层政府治理不足之处,并对其加以论证分析,最
目的分析导致肘管综合征二次手术的相关因素,为提高手术疗效提供参考。方法采用改进术式对16例住院患者行二次手术治疗,对复发的肘管综合征病例进行总结,分析需进行二次手术
<正> 课文特点《夜莺的歌声》一文,在故事情节的逐步展开中表现了孩子的机智勇敢和爱国主义精神。文字含蓄是突出的特点,要叙述的内容,要表达的思想感情,乃至写作方法都含而
当今世界已经进入了知识经济时代,知识和人才是经济社会发展最重要的因素。发展中国家与发达国家之间的差距归根结底是掌握和运用知识与人才培养两方面的差距。加强我国科技