【摘 要】
:
主动学习已经被证明是一种成功的机器学习算法,最主要的缺点是它只注重样本的标签信息而忽略了样本的分布信息.因此带来的后果就是稳定性差,容易陷入局部最优解,同时对初始样本的选择非常敏感.论文将稀疏子空间聚类与主动学习相结合,首先利用稀疏子空间聚类找到原始数据的分布信息,然后利用该信息指导主动学习选取初始样本,使样本标注更加有效,提高了主动学习的效率,同时降低了主动学习对初始样本的敏感度.最后通过多组仿真实验证明,本方法可以有效的改善主动学习的性能.
【机 构】
:
许继电科储能技术有限公司,河南 许昌 461000;三菱电机上海机电电梯有限公司,上海 200230
论文部分内容阅读
主动学习已经被证明是一种成功的机器学习算法,最主要的缺点是它只注重样本的标签信息而忽略了样本的分布信息.因此带来的后果就是稳定性差,容易陷入局部最优解,同时对初始样本的选择非常敏感.论文将稀疏子空间聚类与主动学习相结合,首先利用稀疏子空间聚类找到原始数据的分布信息,然后利用该信息指导主动学习选取初始样本,使样本标注更加有效,提高了主动学习的效率,同时降低了主动学习对初始样本的敏感度.最后通过多组仿真实验证明,本方法可以有效的改善主动学习的性能.
其他文献
研究了一种基于Bézier曲线的碰撞角约束的制导律.通过模型转化将制导指令设计的问题转化为二次Bézier曲线形式的航迹角设计问题.首先,利用Bézier曲线的性质设计了导弹速度大小不变的制导律;然后进一步对导弹速度时变的末端角度约束的制导律进行了研究,同时对导弹速度时变情形下的剩余飞行时间进行了估计;最后通过不同情况下的数值仿真,验证了所提出的制导律的有效性.
针对传统的通用飞机铅酸蓄电池测试方法精度低、工序繁杂等问题,提出了基于LabVIEW的通用飞机铅酸蓄电池测试系统设计方案.通过不同传感器多点采集蓄电池信息,利用独立式采集卡与工控机,实现对蓄电池充放电数据采集和处理.利用LabVIEW软件,完成模块驱动程序的设计,通过记录分析电压、电流等数据的变化,可以图形化直观展示蓄电池的工作状况,实现对蓄电池的自动精确测试,提高了测试效率和精度.
以机器人上下料工作站为研究对象,针对其轨迹优化和自动化生产协调之间难度大的问题,提出了利用RobotStudio仿真软件进行机器人上下料工作站的离线编程和动态模拟.给出了工作站的结构布局及上下料平台的Smart组件设计,结合机器人离线编程对工作站进行了仿真调试.在此基础上,设计出实际的模拟机器人上下料工作站,工作站由双爪机器人、供料单元、机床卡盘、立体仓库及主控PLC等组成.给出了工作站主控系统架构和设备间的通信方式,将仿真工作站的程序导入实际工作站进行设备调试.这种由虚拟仿真到实际设计制造的方式,大大缩
可再生能源具有随机性和间歇性的特点,然而随着分布式电网的渗透率不断提高,其并网也给传统电网带来了可靠性降低、双向潮流、电能质量恶化等问题,传统电网的被动调压策略已难以为继.主动配电网能支撑分布式电源的消纳,通过有载分接开关(OLTC)协调可实现电压控制.本文旨在阐述基于OLTC协调的主动配电网控制研究,先说明OLTC调压对功率的影响,介绍各传统电网调压方法,并指出了各方法的弊端.再阐述基于OLTC调压的主动配电网电压控制方案,最后对该领域进行了展望和总结.
设计了一种基于决策树算法的N1+N2结构语法关系判定方法.首先建立了该结构的语料库,对每条语料都标注构建特征集所需的词性、《同义词词林》语义编码、语法关系和词义相似度等信息;然后为证明相似度在判断语法关系中的合理性,根据语言学原理研究了N1+N2结构两个名词间语义相似度与语法关系之间的内在规律:①从语法关系的角度比较两个名词间的语义相似度结果为:并列关系>复指关系>定中关系>主谓关系;②从语言功能焦点的角度比较两个名词间的语义相似度结果为:并焦型短语>后焦型短语.最后以此为基础构建了特征集,运用决策树C4
多元线性回归模型通常用来研究一个因变量依赖多个解释变量的变化关系,但它有一个前提条件就是解释变量之间不存在相关关系.在实际的应用中,特别是计量经济学中,解释变量之间一般都存在有高度相关关系或近似相关关系,从而使得模型估计不准确.为此,通过协方差计算变换矩阵,提供一种变换矩阵消除随机变量之间相关关系的方法,通过spss25进行实证分析,最后发现通过矩阵变换变换后的数据t检验的显著性值明显降低.
针对传统三维地形生成算法在生成大规模地形数据时用时较多的问题,提出了一种结合双线性插值和Perlin Noise的地形生成算法.该方法首先将初始地形数据进行扩展,之后利用双线性插值和Perlin Noise进行地形细节生成.该方法能够有效降低生成大规模地形数据时的时间,并且该算法还可利用低分率地形数据生成高分辨率地形数据.
为提高火车票识别精度和效率,将图像处理技术和BP神经网络结合,提出了一种基于图像处理和BP神经网络的火车票号识别算法.首先,通过图像预处理、目标区域的定位、二值化、倾斜校正和字符分割,提取火车票的身份证号码特征信息,建立特征信息库;之后,将特征信息库作为BP神经网络的输入,数字和字符类别作为BP神经网络的输出,建立BP神经网络的火车票号识别模型.研究结果表明,与模板匹配和SVM相比,提出的方法可以有效提高火车票号的识别精度和效率,识别精度高达97.7%,从而为火车票号识别提供新的方法.
粗糙集属性应急数据存在冗余特征,降低挖掘效率,提出基于信息熵的粗糙集属性应急数据去重挖掘算法.将粗糙集理论和信息熵相结合,离散化处理应急数据,离散化完成后,约简对于决策表的条件信息熵大小不产生任何影响的属性,设定决策属性集合和条件属性集合,选取将同约简属性集合B的属性组合数目最小的熵值实现约简,去除冗余特征,完成应急数据去重挖掘.以大型船舶应急数据为研究对象展开数据去重挖掘,结果表明:可有效去重挖掘到船舶旋回性相关应急数据,利用数据增比特征能够分析到各因素对船舶旋回性的影响,并且所研究算法的挖掘效率较高,
为使智能光网络(ASON)在受灾时各等级协定(SLA)波长业务重获局向资源,研究了一种风险规避算法.首先通过构建动态损毁数学模型为不同SLA等级波长业务的连接分别设定稳定度阈值条件.然后借鉴启发式算法计算思想为受灾的各等级SLA波长业务分别制定自愈策略.再根据灾后通路资源需求变化设计带宽重置方案以保证灾后SLA业务的生存性.仿真表明,算法在稳健性、失效率、呼损率多指标中均有良好的优势.