【摘 要】
:
本模型充分利用了所给数据的特点,运用统计、最优化等数学方法,从已知样本序列中提炼出能较好代表两类特征的关键字符串,据此提出量化的分类标准,能较好的对任给DNA序列进行分类.
【机 构】
:
北京大学,Peking University,;
论文部分内容阅读
本模型充分利用了所给数据的特点,运用统计、最优化等数学方法,从已知样本序列中提炼出能较好代表两类特征的关键字符串,据此提出量化的分类标准,能较好的对任给DNA序列进行分类. 首先,从已知样本序列中用广度优先法选出所有重复出现的字符串,并计算其标准化频率及分散度. 然后,利用样本数据结合最小二乘法确定两类字符串各自的优先级函数,并且逐步优化其参数使之达到稳定,提高了可信度. 最后,根据优先级函数找出关键词,然后确定权数,用层次分析法对未知样本进行分类,并定出显著水平,从而得到了一个比较通用的分类方法. 经过检验,此方法对21—40号待测样本进行了很好的分类,对后面的182个DNA序列进行同样的操作,也有较好的效果.
其他文献
高校人力资源的范围较广,是从事教学、科研、管理和后勤服务等方面工作的教职员工总体所具有的劳动能力的总和.人力资源管理则是强调把教职员工作为一种具有潜能的资源,强调
本文提出多项式组符号求解的主项解耦(主项只含主元)消元法:视多项式为变元不同幂积的线性组合,以主项解耦三角型多项式组DTS为引导,用逐项伪除求余式,将多项式组PS化为与其
本文讨论了两类M/M/1动态系统的数学模型 ,利用常微分方程所描述的M/M/1系统的结果证明了较复杂的偏微分方程所描述的M/M/1系统的一些性质,该方法简化了已有结果.
《往五天竺国传》的作者确为新罗人慧超 ,慧超传中“当土是胡 ,所以信也”一语表明 :慧超已明确指出大勃律国、杨同国、娑播慈国人的衣着言音人风信仰与吐蕃不同 ,因为他们是
城镇化是工业化发展的必然结果,主要表现为人口的集聚和工业化总产值占GDP比例的提高.中国改革开放30多年来,主要采用投资型城镇化方式,以GDP量的扩张为代表,到目前潜力已基
本文用部分求和项满足反演关系的方法给出了两个q-级数恒等式. 证明了这种方法对寻求新的恒等式还是很有效的.
本文给出求0-1型整数规划的一种新方法,该方法利用对所有目标函数值排序的方法,求出最优解. 该方法简单易行且计算量较小.
深入学习贯彻党的十九大精神和习近平新时代中国特色社会主义思想,是当前和今后一个时期的首要政治任务.学习好、研究好、阐释好十九大精神,用马克思主义中国化最新理论成果
9月5日,2019世界风筝帆板水翼板锦标赛暨第十一届中国潍坊滨海国际风筝帆板邀请赛在潍坊滨海盛大开幕.风筝为媒,碧海为介,五颜六色的水翼板风筝、激情四射的参赛选手与蔚蓝的
本文使用书面测试形式对122名非英语专业一年级大学生掌握英语语篇中衔接手段的情况进行了调查。调查结果显示,这些学生对衔接手段的识别理解能力较弱,在测试中暴露出规则使