网络数据的挖掘

来源 :辽宁工程技术大学学报:自然科学版 | 被引量 : 0次 | 上传用户:O70607227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对当前实用的搜索引擎技术作了较为全面的综述,主要介绍了搜索引擎中较为核心的两大技术:信息采集及数据搜索技术,对当前较为先进和常用的相关技术进行了列举,并对各类技术的优缺点作了简要的比较及说明。特别对信息采集中网络蜘蛛的工能及原理进行了介绍,详细介绍了著名的互联网搜索引擎Google在数据检索方面所使用的PageRank算法,最后较为全面的给出了几种主要的中文分词技术。利用个别现有的著名搜索引擎实例对相关技术的实现进行了举例和说明。
其他文献
目的初步探讨早孕蜕膜和绒毛组织中芳香烃受体(AhR)的表达及其与原因不明自然流产的关系。方法采用Real-Time PCR和Western blotting技术检测34例原因不明自然流产患者(流产组)蜕
由于采空区陷落岩石构成的气体孔隙渗流介质空间是极度复杂和不规则的,并且目前还不存在可行的手段对采空区内部状态进行观测.利用传统的数学物理方程描述的渗流问题的精确解
8月6日下午,由上海交通大学医学院附属第九人民医院(以下简称"九院")普外科牵头的九院胃肠道肿瘤多学科专家组协作组(MDT)举行了隆重的成立仪式。九院罗蒙副书记、医务处张少明处长
目的研究老年高血压患者动态血压的特征,血清尿酸等心血管危险因素与动态血压参数、靶器官损伤的关系。方法选取2009年1月—2013年7月的老年高血压住院患者,排除继发性高血压
结合实际应用中模糊控制的特点,提出了正规模糊闭环控制系统的概念,在特征合成算法的基础上得出了正规模糊闭环控制系统的一个简便的稳定性判据。
随着我国互联网金融的爆发式增长,第三方支付由电子商务带动,从线上支付拓展到线下场景的支付,从网络支付到移动支付,其规模正稳步提升。而银行和第三方支付的关系由最初的合
目的应用神经网络算法提高非编码碱基序列文献的查全率和查准率。方法从PubMed数据库中选取样本。对样本处理后,应用词频(TF)×逆文档频率(IDF)方法选取特征项,建立基于后向传
不锈钢热水加热器在使用中常常发生筒体破裂漏水的问题,本文通过材质分析、无损探伤、金相检查等实验手段对加热器筒体及焊缝分别进行分析,结果表明,造成热水器失效的主要原因是
针对一挖掘机回转铁道的早期断裂失效现象进行了研究,分别从材料成分,组织,性能,生产工艺及使用环境因素等方面分析了失效工和失效机理,认为由于生产过程中焊接操作不当对一次焊缝
高级职业教育是高等教育的重要补充部分,而民办高职院校在其中又承担了重要角色。高职院校工作计划的有效开展,教育方针的贯彻实施,最终都要依靠班级教育教学实践活动来实现,