基于拉普拉斯回归主动学习的大数据流分类算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:fantasy1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实时数据流中标记样本所占比例较小,并且存在大量的噪声数据和冗余数据,导致数据流的实时分类准确率较低。针对这种情况,提出基于拉普拉斯回归主动学习的大数据流分类算法。为分类器设计相对支持度差异函数作为分类的决策方法,通过阈值判断当前数据流的标记样本量。设计基于约束规则的半监督主动学习算法,从无标记样本集选择信息量最丰富的样本。采用拉普拉斯正则最小二乘回归模型作为半监督学习的回归模型,迭代地扩展数据流的标记样本量。仿真结果表明,该算法有效地提高了数据流的分类准确率,并且满足实时性的需求。
其他文献
1983年5月5日上午10点40分,中国民航296号班机由沈阳东塔机场起飞,飞往上海。机上共有105人,其中机组人员9人,日本乘客3人。飞机起飞后不久,领航员王培富从驾驶舱出来寻找食
2015年7月11日,以“民族地区社会治理与社会发展”为主题的中国社会学会2015年学术年会分论坛在湖南长沙中南大学举行。该论坛由贵州民族大学民族学与社会学学院、贵州省社会
【正】 (一) 建筑产品价格体系是指由各种建筑产品价格组成的经济网络。它反映了各种建筑产品价格之间相互联系和相互制约的关系。主要研究建筑产品的比价、差价及其价格形式
目的研究NLRP3炎症小体信号通路相关分子在幽门螺杆菌(H.pylori)感染C57BL/6小鼠胃组织和血清中的表达情况,初步探讨NLRP3炎症小体信号通路在H.pylori致病中的作用。方法将C5
西安市高新区第二污水厂一期规模为5×104m3/d,核心生物处理单元采用A2/O工艺,由于进水碳源不足,在污水厂调试运行期间,投加乙酸钠作为反硝化碳源,但是考虑到节约运行成本,通
2013年,库车县预计完成地方生产总值138.8亿元、同比增长10.4%。完成全社会固定资产投资120亿元,同比增长17.4%;实现地方公共财政收入27.1亿元,实现全社会消费品零售总额15.0
文章以中国知网数据库为依据,对有关我国图书馆婴幼儿服务已有的研究成果从发表时间、论文类型分布、发表期刊、作者等方面进行计量分析,从而揭示我国图书馆婴幼儿服务学术研
总结在京承线小半径曲线地段,对上股和下股钢轨进行非对称廓形设计及钢轨铣磨的工程实验,提出对小半径曲线钢轨上股和下股,分别采用1/40和1/20轨底坡标准60钢轨廓形非对称铣
脑血管病的高发病率,高致残率是严重威胁人类生存及生存质量的疾病。目前对缺血性脑血管病的治疗及减少复发问题一直困扰着神经科学界的工作者。脑血管病危险因素的干预(除药
p21是一种重要的周期蛋白依赖性激酶抑制因子(cyclin-dependent-kinase inhibitor, CKI),主要通过调控细胞周期维持细胞的生长和增殖。此外, p21还参与调控细胞凋亡、细胞衰