基于近邻熵的主动学习算法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:yuerenqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在主动学习中,采用近邻熵(Neighborhood Entropy)作为样例的挑选标准,熵值最大的样例体现基于近邻分类规则,最无法确定该样例的类标.而标注不确定性高的样例可用尽量少的样例获得较高的分类性能.文中提出一种基于近邻熵的主动学习算法.该算法首先计算未标注样例的近邻样例类别熵,然后挑选熵值最大样例的进行标注.实验表明,基于近邻熵挑选样例进行标注,较基于最大距离(Maximal Distance)挑选和随机样例挑选可获得更高的分类性能. In active learning, the neighborhood entropy (Neighborhood Entropy) is chosen as the sample selection criterion, and the sample with the largest entropy value is based on the nearest neighbor classification rules, and the sample with the highest uncertainty can not be identified We can get a higher classification performance by using as few samples as possible.An active learning algorithm based on neighborhood entropy is proposed in this paper.The algorithm first calculates the entropy of the nearest neighbor samples without marking the samples and then selects the largest sample with the highest entropy value Experiments show that, based on the nearest neighbor entropy selection example, higher classification performance is obtained than that based on Maximal Distance selection and random sample selection.
其他文献
本文从目前职业教育现状分析,提出了在职业学校探索“班级企业化管理”的必要性。介绍了我校在探索“班级企业管理”模式中具体措施以及在实践过程的反思,指出“班级企业化管
一年一度的ISE(Integrated Systems Europe)欧洲集成系统展今年如期在荷兰阿姆斯特丹隆重举行。这个由CEDIA与infoComm共同举办的盛会是一个充分融合了家用与专业定制安装技
近日,全国政协委员、宗申产业集团董事长兼总裁左宗申做客中央人民广播电台经济之声两会特别访谈《企业家说》。左宗申委员围绕今年所带来的提案以及2013年百姓关心的一系列
句子是表达思想感情的最小的语言单位,一篇文章是由无数个句子组成的。句子的优劣会直接影响整篇文章的质量。那么,如何才能写好一个英文句子呢?首先你写的英文句子要能符合下列基本要求,否则就不是一个好句子。
从2011年8月开始,全国新闻战线组织开展了“走基层、转作风、改文风”活动,广大新闻工作者带着对基层、对群众的深厚感情深入社会生活,了解国情民情,反映火热实践,把大量服务
本研究依据建构主义等理论,先后进行了五次学习者共同阅读教学实践。学习者之间的谈话分析表明:学习者在阅读过程中互相协作解决问题和任务,促进了对文章整体的理解,学习者为
本文依据学生课外听写文本和访谈,对学生自主听力理解构成障碍的语言因素做了统计分析。发现实词障碍中,已知词汇的比例大于生单词的比例;语法和虚词也构成了一定的影响。听
随着时代的不断进步,人们在获取信息、传播知识、消遣娱乐的同时,对电视传媒也有了更多新的要求和需求。在这种需求之下,更加平民化的讲述类故事性栏目悄然兴起,这种节目形式
本文通过对荣华二采区10
期刊
坚持以人为本,树立全面、协调、可持续的发展观,促进经济社会和人的全面发展,是党的各项工作的出发点和归宿,也是我们新闻工作必须遵循的基本原则,特别在电视专题栏目设置上