基于Web挖掘的企业竞争情报系统构建研究

被引量 : 0次 | 上传用户:dancingbug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,Web储存了大量有价值的知识,企业竞争情报系统(Competitive Intelligence System,简称CIS)的建设也已经成为各企业的战略举措。当前主流的竞争情报系统采用的全文检索或关键词检索的检索机制不可避免地会带来实际检索结果与用户需求之间的大量偏差,在准确性上很难把握。目前基于自然语言、HTML结构分析和本体等方式的竞争情报抽取方式存在的许多不足,无法从大规模杂乱的检索结果中获取最相关的需求。针对这些问题,本文通过对国内外的竞争情报获取技术进行研究,构建出基于Web挖掘的竞争情报系统。本文研究从获取网页信息入手,首先使用正则表达式灵活、快捷、准确地从大量杂乱的Web网页中抽取最初始的企业竞争情报。这些初步结果由于网页结构的半结构化而存在许多冗余知识,因此对抽取的初步结果使用数据预处理技术进行筛选,以去除广告页面和噪音数据,得到进一步结构化的竞争情报知识集。在竞争情报的挖掘方面,使用基于相似度计算的竞争情报挖掘方法,大大提高竞争情报挖掘的准确率。本文研究主要分为六个章节,第一章描述基于Web挖掘的企业竞争情报系统国内外研究现状,第二章描述Web挖掘和企业竞争情报系统的相关概念,第三章进行基于Web挖掘的企业竞争情报系统需求分析,第四章描述竞争情报系统的Web挖掘关键技术,第五章构建基于Web挖掘的竞争情报模型,第六章实现基于Web挖掘技术的竞争情报系统。本文研究的主要成果有:1)提出了整套Web竞争情报抽取和挖掘的方法和技术,提出了基于正则表达式的网页信息抽取、基于编码经验规则的Web文本抽取和基于相似度计算的竞争情报挖掘方法;2)基于Web挖掘理论和竞争情报系统理论,构建了基于Web挖掘的企业竞争情报系统模型,为企业智能化竞争情报系统的建设提供了理论模型;3)基于提出的算法,实现了基于Web技术的竞争情报系统,为进一步研究提供了素材。本文研究理论结合实际,通过系统实现检验了模型应用的可行性,能对相关企业开展竞争情报工作起到一定的借鉴作用。
其他文献
<正>腺垂体功能减退症是个比较常见的内分泌疾病,是由于各种原因引起的垂体及其靶腺如性腺、甲状腺、肾上腺皮质功能不全,临床表现复杂,容易漏诊、误诊,严重时发生垂体危象并
20世纪90年代频繁发生的金融风潮和2008年爆发的全球性金融危机,使商业银行安全问题获得空前关注。然而,银行危机的频繁发生及其给危机发生国或地区带来的巨额成本意味着维护
英语随早期英国移民来到北美,并在新世界不断发展成为北美各族的共同语言。本文从历史文化与语言发展相结合的角度,考察了美国英语的起源及其纯正性问题的争论,帮助读者透过
代谢组学是继基因组学、转录组学和蛋白质组学等以后新近发展起来的一门新学科,主要是定性定量分析、研究某一生物或细胞内所有低分子质量的代谢产物。近年来,代谢组学技术发
运用调查访谈、逻辑分析等方法,归纳了我国高校体育市场的产品开发与营销高校体育市场的传统模式。从市场学产品供求的视角,提出了组建区域型体育联合会,搭建区域校内赛事合
介绍了直升机回避区的意义和生成 ,并指出影响回避区范围的主要因素是直升机重量、旋翼的转动惯量和密度高度等 ;拟定了计算轻型共轴式直升机回避区的方法 ,该方法考虑到共轴
目的分析和探讨创伤性血气胸的临床治疗措施以获得最佳治疗方法。方法选取我院2012年6月至2013年6月收治的创伤性血气胸患者64例作为研究对象,男性患者46例,女性患者18例,其
<正>题目(2014年高考陕西卷理科压轴题)设函数f(x)=ln(1+x),g(x)=xf′(x),x≥0,其中f′(x)是f(x)的导函数.(Ⅰ)g1(x)=g(x),gn+1(x)=g(gn(x))(n∈N*),求gn(x)的表达式;(Ⅱ)若f(x)≥ag(x)恒成立,求实数a的取值范围;(
目的 为了探讨中药加味真武汤与特异性免疫疗法相结合治疗外源性哮喘的机理及临床疗效,作者对外源性哮喘98例作了临床观察。方法 在发作期应用加味真武汤(炮附子、茯苓、白术
背景:基因组印记是指来自父方和母方的一对等位基因,其中一方发生DNA修饰导致单等位基因表达,发生修饰的基因不表达,未修饰的基因表达。印记基因相当于功能上的单倍体,仅一次