【摘 要】
:
针对已有网页分割方法都基于文档对象模型实现且实现难度较高的问题,提出了一种采用字符串数据模型实现网页分割的新方法。该方法通过机器学习获取网页标题的特征,利用标题实
【机 构】
:
武汉市广播电视大学现代教育技术中心,华中师范大学教育信息技术学院
【基金项目】
:
教育部人文社科基金资助项目:数字化学习资源无障碍适配决策模型研究(15YJA880062)资助
论文部分内容阅读
针对已有网页分割方法都基于文档对象模型实现且实现难度较高的问题,提出了一种采用字符串数据模型实现网页分割的新方法。该方法通过机器学习获取网页标题的特征,利用标题实现网页分割。首先,利用网页行块分布函数和网页标题标签学习得到网页标题特征;然后,基于标题将网页分割成内容块;最后,利用块深度对内容块进行合并,完成网页分割。理论分析与实验结果表明,该方法中的算法具有O(n)的时间复杂度和空间复杂度,该方法对于高校门户、博客日志和资源网站等类型的网页具有较好的分割效果,并且可以用于网页信息管理的多种应用中,具有良好
其他文献
目的:探求矫形器在康复工程上的运用,分析脊柱矫形器对特发性脊柱侧弯患儿的康复矫治作用.方法:以2003-04/2004-10福建省假肢中心收治的处于骨骼生长发育期的35例特发性脊柱
活血化瘀法治慢性盆腔炎46例宋瑞香,施丽洁(山东省肥城市中医院271600)关键词慢性盆腔炎,中医药疗法,活血化瘀法临床应用自1992年6月至19q4年12月,我们采用活血比瘀治则,治疗慢性盆腔炎46例,收到了较为满意
目的采用RNA干扰技术,研究人脑胶质瘤SHG44细胞对化疗敏感性的影响。方法用脂质体法转染人脑胶质瘤SHG44细胞株,通过RT-PCR检测癌胚抗原相关细胞黏附分子1(carcinoembryonic
针对以“基地”为典型的国际恐怖组织网络化运作的趋势,从组织行为学的角度分析恐怖组织网络特点及其带来的挑战,总结社会网络分析在描述恐怖分子静态网络特征,定位关键人物
一直以来,传统的MEMS压阻麦克风始终存在一个灵敏度低、信噪比差的问题,其主要原因是压敏电阻采集到的应力较小。这使得MEMS压阻麦克风无法得到广泛的应用。本文介绍了一种新型
SNOM (Scanning Near-Field Optical Microscopy)是一种微纳尺度物质结构、形貌、理化和生化性质研究的先进光电子学技术,是扫描探针显微镜的一种,其利用局限在物体表面小于
在1945年发现的钛酸钡(BaTiO3,简称BTO),是第一个被发现的含有氧八面体的钙钛矿铁电材料。由于铁电材料具有良好的铁电、压电、介电和热释电等性能,近几年铁电材料的研究和发
基于供应链的质量管理已经成为企业竞争优势的重要来源,传统的质量管理是单个企业的视角,缺乏供应链视角的、系统的关注。国内外学者对供应链质量管理进行了大量研究,文章采
生态文明建设已然成为当前乡村振兴背景下农村建设与发展的重要内容,但从现实层面来看,陕西农村生态文明建设目前仍存在一定的问题,给其发展造成了一定的限制。据此,就乡村振
<正>近年来,作者运用中药治疗盆腔炎11例,取得明显疗效,现报告如下。 临床资料 收治的11例病人均有急性或慢性盆腔炎史及典型体征。根据辨证和辨病相结合的原则,分为湿热夹