基于机器学习的信息预测研究分析

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:huanghong198122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息是客观事物之间相互联系和相互作用的表征,反映了客观事物运动状态和变化的实质内容,能够调控蛋白质表达的基因是一种生物信息,人们的日常交流以及新闻等都是信息,如果能够对这些信息进行预测,那么人类社会将会进入全新的时代。本论文从三个实际问题,预测乳腺癌疾病,肺部图像诊断以及新闻信息预测入手,通过机器学习的方法研究信息预测问题,论文的主要工作如下:首先,(1)论文对生物信息标志中的microRNA在早期预测乳腺癌疾病做了深入研究,分析了多种机器学习方法对乳腺癌的预测效果,提出了一个预测精度以及召回率较高的分类模型。(2)为了减少模型特征,本文使用多种特征选择方法筛选对于疾病预测影响更大的microRNA,提出了含有5个microRNA的基因组合预测乳腺癌疾病的模型,模型的预测召回率与全基因预测值相比仅降低了 0.5%。在论文研究的第二个问题中,我们通过卷积神经网络AlexNet对肺部影像进行识别诊断研究,同时为了增强模型的泛化能力,论文中结合了最前沿的对抗生成网络,搭建了含有对抗生成网络的AlexNet,提升了模型的泛化能力,识别准确率达到了 81.6%。接着,论文通过抓取新浪微博以及新浪新闻数据深入研究网络新闻消息的点击规律以及消息热度的预测模型。(1)文章先从统计角度分析了消息的点击时延与点击量的联系、消息的发布时间与点击之间的关系以及重大消息对于点击曲线的影响。(2)通过低通滤波发现消息的点击序列是由多个伽马分布加权得到的,因此文章提出了一种使用混合伽马分布拟合消息的点击序列的模型,并且拟合效果良好。在预测消息的影响力问题上。(3)论文提出了两种不同的方法对消息的受欢迎程度进行预测,一种是基于目前较为通用的特征工程的方法,预测准确率能够达到83%左右。另一种方法是基于深度学习的方法,在分类模型上则选取了适用于文本分类任务的TextCNN,该方法的准确率也达到了 73%左右。
其他文献
雷州话属于闽方言的一支,在雷州话中有一些特殊的亲属称谓,分别是普通话中的"妈妈"、"爸爸"、"孩子"、"女儿"、"叔叔"、"儿媳妇"、"妯娌"、"大娘"和"舅舅"等,每一种称谓又分为面称和叙称。其中
爆炸应力波入射非连续岩体时,通过引入节理面的本构模型考虑张开节理处张开和闭合的行为,建立波的能量衰减解析模型。理论推导得到入射应力波通过张开节理时透射波和反射波的
垃圾焚烧具有占地面积小,减容率高和垃圾处理量大的优点,逐渐成为处理城市生活垃圾的首选方法。城市生活垃圾中含有半挥发性的重金属,容易在焚烧过程中挥发、冷凝生成能够穿透除尘设备的亚微米颗粒。城市生活垃圾中的NaCl能够促进半挥发性重金属的挥发,本文以Pb和Cd为研究对象,探究垃圾焚烧过程中NaCl对Pb和Cd挥发的作用。首先,研究了NaCl对PbO和CdO的间接氯化作用。氮气气氛下,温度在1000℃以
本文介绍了我国国有企业资本结构优化的一种新思路,针对我国国有企业目前的现状和未来的改革发展趋势,提出以实施市场主导型的资产重组为主要方式,以市场化的产权改革为突破
本文构建了最新的向量自回归模型,运用浙江省1978-2012年间的数据,研究劳动分工(本文涉及的劳动分工一般指农村劳动力在农业和非农业上的分工,把二元经济结构下的劳动力转移现象
中国特色社会主义经济理论体系是中国特色社会主义理论体系的基础和核心。本文将其概括为十大理论内容。一方面着重从正面阐述和评析这一理论体系的重要内涵和实践意义;另一
在石油开采、加工和储运的过程中,由于泄露和事故等原因,常常导致石油类有机污染物进入含水层,对地下水造成了严重的污染,危及生态环境和饮用水安全。石油类污染物进入地下含
当代制造业和服务业正处于高速发展阶段,虽然农业发展成就也很举世瞩目,但无论是从农业所占GDP的比重来看,还是与二三产业所取得的成就相比,都显得黯淡无光。对于新旧动能转
随着国家金税三期工程的不断推进与深入,涉税业务信息化、无纸化以及服务化的程度越来越高。在“以票控税”的指导思想下,通过简化流程、信息共享、统一平台、运用互联网技术
南京市农资公司亚太肥料发展有限责任公司生产的高含量复合肥在油菜上进行了不同用量的试验。经对比试验施用量以667m^2施27.5kg作基肥,最为经济,增产率为39%。