【摘 要】
:
在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过
【机 构】
:
江苏大学计算机科学与通信工程学院,无锡市精神卫生中心,无锡市妇幼保健院,无锡市第五人民医院
【基金项目】
:
江苏省重点研发计划社会发展项目(BE2016630,BE2017628),无锡市卫生计生委科研项目(Z201603)
论文部分内容阅读
在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过引入SNP权重因子量化SNP位点重要程度的差异性,同时将重点SNP邻域正则项引入模糊聚类的损失函数中,挖掘高度重要SNP与同邻域内其他SNP的关联性。实验结果表明,GN-FCM具有较好的收敛性,与DW-FCM算法相比,其构造的SNP子集在支持向量机、决策树和朴素贝叶斯分类中准确率分别提升5.73 %、3.40 %和3.79
其他文献
以G008A等为材料,应用隐性上位互作遗传原理,育成隐性核不育系S017AB、临保系M017及恢复系,并配制出系列杂交油菜新组合在生产上应用。介绍了隐性核不育系S017A的选育经过、
为实现云计算服务用户虚拟资源租赁利润最大化,提出一种新的云计算虚拟资源租赁算法。在由虚拟资源供应商、云服务提供商和最终用户组成的三功能模块云计算环境下,给出虚拟资
为阐明福建邵武烟区不同烤炯品种的生态适应性和烟叶质量,对邵武烟区不同乡镇烤烟品种翠碧1号、K326和云烟85的理化特征进行了分析。结果表明,3个烤烟品种烟叶的开片度、干物质
针对基于接收信号强度(Received Signal Strength Indicator,RSSI)的无线传感器网络节点定位算法精度低的问题,本文提出了一种基于Voronoi图划分的节点模糊信息定位算法(Node