面向化工领域的Web文本搜索与分类

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:ddr133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息资源的迅速增加,对于主题Web文本信息的搜索与分类日益成为信息处理领域的一个重要问题。本文建立了一个面向化工领域的Web文本搜索与分类系统,该系统在crawler子系统搜集Web文档的基础上,利用支持向量机对网页进行二次分类,找出化工专业中文网页;然后利用向量空间模型,对分类好的专业网页进行多子类分类。与综合搜索引擎相比,具有速度快、搜索信息准确度高和具备学习能力的特点。 With the rapid increase of network information resources, the search and classification of topic Web text information has become an important issue in the field of information processing. This paper establishes a web-based text search and classification system for the chemical industry. Based on the web crawler subsystem collecting web documents, the system uses support vector machines to classify the web pages twice to find out the chemical professional Chinese web pages. Then, Model, a good classification of professional web pages more sub-categories. Compared with the integrated search engine, with high speed, search information accuracy and possess the ability to learn.
其他文献
研究背景:表氧化二十碳三烯酸(EpoxyeicosatrienoicAcids,EETs)是花生四烯酸(ArachidonicAcid,AA)经细胞色素P450(CytochromeP450,CYP450)表氧化酶代谢产生的生物活性物质。AA是
研究背景:膀胱腺癌是一种发病率低的恶性肿瘤,尽管在所有的膀胱癌中位居第三位,但发病率只有0.5-2%。一直以来,对于早期的膀胱腺癌患者而言,根治性手术是最佳的治疗手段,但是在全球
目的:改进人植入前胚胎细胞超薄切片的制备方法,观察不同时期人早期胚胎细胞超微结构的变化。方法:选取我院生殖中心试管婴儿助孕技术后异常受精的3原核胚胎,于2-8细胞期进行
第一部分CYP1B1基因缺失小鼠房角组织结构的观察【目的】研究细胞色素P4501B1 (cytochrome P450 family 1 subfamily B polypeptide 1,CYP1B1)基因对小鼠房角组织结构的影响