【摘 要】
:
由于概率图模型便于建模变量关系、概率推理以及知识发现,所以其思想在人工智能前进的浪潮中发挥了十分重要的作用,最近更是有一些神经网络结合概率图思想的研究在某些问题上取得了state-of-the-art的结果。另外,无论是计算机硬件不发达的上个世纪,还是大数据时代的到来,提高算法性能都至关重要,而这一点在并行程序设计理论中找到了不错的解决方案。作为一名统计学学生,本文在研究了大量计算机理论的基础上,
论文部分内容阅读
由于概率图模型便于建模变量关系、概率推理以及知识发现,所以其思想在人工智能前进的浪潮中发挥了十分重要的作用,最近更是有一些神经网络结合概率图思想的研究在某些问题上取得了state-of-the-art的结果。另外,无论是计算机硬件不发达的上个世纪,还是大数据时代的到来,提高算法性能都至关重要,而这一点在并行程序设计理论中找到了不错的解决方案。作为一名统计学学生,本文在研究了大量计算机理论的基础上,使用C++语言复现了一些基础并重要的概率图算法,并对算法效果及性能进行了测试。也许性能以及稳定性不能媲美现有优秀的机器学习算法库,但对统计模型如何使用高级语言有效复现做了不少的论述,讨论了一个良好的算法库应该具有的特征,为我国提高自主研发贡献了绵薄之力。在学科融合日渐重要的今天,如何结合另一个学科的优势解决问题一直是难点,本文也算是一个有价值的统计与计算机学科融合的案例。本文工作主要是研究概率图算法的代码实现,针对多核CPU进行程序设计,使用C++11标准以及thread线程库提高算法的执行效率以及可移植性。复现的算法有静态贝叶斯网络和马尔可夫网络的因子图表示、和积变量消除法、团树推断法、团树校准法、隐马尔科夫模型。其中大多数算法都进行了多次调试,并使用kaggle天气预测数据集测试了一些概率图算法。由于带特征的条件随机场实现略微复杂,并且由C++语言实现的CRF++工具表现稳定,代码结构优良并且效率较高,所以我在通读CRF++所有源码的基础上,分析算法每一步的CPU以及内存使用情况,对该工具源码进行了并行程序的优化,在论文中详细分析了程序设计的每一个需要注意的问题。值得一提的是,该研究在复现算法时对所有较大向量或矩阵的内存情况都经过了慎重考虑,讨论了许多在复现算法时需要“小心翼翼”的地方。
其他文献
公司决议撤销之诉有维护公司决议合法合章的作用。但是,若股东滥用这一制度,则会影响公司内外部法律关系的稳定性,造成公司及其利害关系人权益减损的后果。从公司决议撤销之诉制度的域外发展来看,这一制度从诞生之初就饱受滥用问题的困扰。通过分析2019年至2020年的相关案件,发现我国也存在着类似问题。故针对公司决议撤销之诉滥用问题的研究,对于制度完善以及滥用问题的规制有着现实意义。本文共分为三部分。首先,确
近些年来,我国的房地产市场迅速成长起来,房地产价格大幅增长,而且虚高不下,这导致很多人买不起新房,因此人们只能将目光转向二手房;另一方面城市化导致大量土地被占用,新建房越来越少,而存量房却大量积压,导致我国房地产市场中心由新房转向了二手房市场。从房屋成交量方面看,很多城市的二手房成交量甚至有赶超新房的趋势。基于此,对二手房价格的精准预测变得至关重要,这一来可以为政府制定相关的房价调控政策提供参考,
随着大数据和互联网领域的飞速发展,现代互联网社区逐渐向UCG模式开始转变,与一开始大多用户只能从网上被动获取知识不同的是,现在的用户可以选择自己创造信息与用户互动,用户发表自己观点的同时也在接受他人的观点。于是许多用户在进行决策时会根据羊群效应,即依赖于相关的评论带来的信息作出决策。但是面对大量的数据,如何从中获取有效信息成为目前研究的主流。于是基于评论文本的情感分析为用户决策和节约时间成本等带来
在2015年前,学界与实务界都对是否应允许民事二审撤回起诉的问题有多种解读,致使司法实践出现混乱,无法统一。2015年出台的《最高人民法院关于适用<中华人民共和国民事诉讼法>的解释》第338条解决了问题,使当事人在民事二审程序中撤回起诉变得有法可依。这是一大创举。但它的缺陷也十分明显:过强的职权主义干预、诉权与审判权的失衡、部分规范内容不明确,实操性差等问题无不在扰乱其正常适用。为此,在借鉴两大法
人工智能的发展开拓着一个又一个新的领域,经济水平的提高使得人们对健康服务的需求不断扩大。目前我国医疗资源存在着分布不平衡、卫生服务供不应求以及医患关系紧张的问题,这些问题在疫情期间体现尤为突出。在线医疗平台是解决我国卫生服务不平衡的一个重要方法,医疗问答社区平台是在线医疗中的一个主要存在形式,患者可以通过与医生以在线交流的方式了解病情,但患者提出问题的数量远大于医生数量,如何通过人工智能的方法推进
建筑工程管理是项目作业中至关重要的一项工作,其能够优化作业安排、解决工程问题等,对提高工程作业的综合效益起到显著的促进作用。但传统建筑工程管理模式已难以适应当前建筑工程管理需求,不利于高质量建筑项目落地,在一定程度上影响建筑行业的健康发展。基于此,文章分析了建筑工程管理的现代化和精细化意义,探讨建筑工程管理过程中存在的问题,并提出了建筑工程管理现代化和精细化的实现途径,旨在全面提高建筑工程管理水平
为了推进我国法治社会的建设,满足公民日益增长的法律诉求,司法行业正在不遗余力地进行深化改革。由于以律师、法官等代表的法律机构以传统人工的方式处理海量的法律文本已不再现实、“同案不同判”等涉及到司法自由裁量权的现象也屡见不鲜,因此如何借助大数据技术优势,提高相关机构工作效率,维护行政处罚决策的公平性就显得尤为重要。本文旨在通过大数据技术处理海量的法律文本,借助时下热门的深度学习方法,提高行政处罚决策
以某复杂老矿山地质环境保护与土地复垦方案编制为例,总结复杂老矿山编制工作的相关经验,对编制该类矿山地质环境保护与土地复垦方案的要点进行阐述。对于复杂老矿山,必须在彻底调查地质环境条件的基础上,针对长期开采遗留的治理难题,以安全性为重点开展现状评估工作;对于边坡等敏感设施,需要做出稳定性分析以及必要的治理;开展预测评估工作时以土地损毁为重点,为后续开展的环境保护和土地复垦工作提供切实可行的技术依据。
随着经济全球化的深入,各种突发事件如金融危机、恐怖主义等发生的频率也越来越大,突发事件对股票市场的影响已经不再是地域性的,而是对全世界的股票市场都会产生冲击。此次新冠肺炎疫情是一个典型的突发事件,在短期内对我国的经济产生了冲击,而股票市场是经济的晴雨表,能够在一定程度上反映此次疫情对我国经济产生的影响。同时随着疫情的全球化蔓延,对世界的股票市场也会产生一定的冲击。准确评估突发事件对我国股票市场风险