论文部分内容阅读
随着互联网环境中数据规模的剧烈增长,从海量的数据中提取有意义的信息变得越来越困难。认知计算技术作为人工智能领域的一个重要分支,在如今的互联网环境下能够起到十分重要的作用。而在认知计算技术中,如何快速有效的完成数据的处理工作是在整个认知计算系统中十分重要的一环。因此,本文主要研究认知计算中基于机器学习的数据处理模型。文章首先提出了一种认知计算模型,然后研究了模型中可能用到的数据处理技术(分类、决策等)以及分布式环境下的任务调度算法。总结起来,研究主要内容和创新之处主要表现在如下几个方面:针对互联网应用的使用过程中产生大量的感知数据和数据流难以分析处理的问题,研究一种基于上下文感知数据流的认知计算模型,实现对上下文感知数据的有效分析。此外,针对VFDT(Very Fast Decision Tree)算法选择分裂属性的随机性导致准确率不理想的问题,提出一种面向数据流的决策树算法来对数据流进行有效的分类。针对互联网中的海量信息有效性与否的决策问题,提出一种基于深度置信网络和线性感知器的认知决策算法,在深度置信网络训练结果的基础上搭建一种具有错误控制功能的认知决策模型,综合考虑信息本身和上下文信息,最终给出信息有效与否的决策结果。针对RAM(Reward optimAl Matching)算法中,资源队列类别分类不准确导致的任务调度效率不高的问题,提出了一种基于改进型队列匹配的任务调度算法来解决分布式的计算环境下的任务调度问题。该算法首先对资源进行聚类,然后根据聚类后资源队列进行任务调度,从而提高了任务调度系统的调度效率。