【摘 要】
:
现代科学已成为数据密集型学科。因此,用于数据管理,数据共享和发现新颖数据集的创新解决方案的需求与日俱增。大数据时代,时序数据在各行各业的重要性渐渐凸显。通常时序数据具有非平稳的特点,常见的相关性分析方法难以刻画。多重分形降趋势交叉相关性分析(Multi-Fractal De-trended Fluctuation CrossCorrelation Analysis,MF-DCCA)方法却能够很好的
论文部分内容阅读
现代科学已成为数据密集型学科。因此,用于数据管理,数据共享和发现新颖数据集的创新解决方案的需求与日俱增。大数据时代,时序数据在各行各业的重要性渐渐凸显。通常时序数据具有非平稳的特点,常见的相关性分析方法难以刻画。多重分形降趋势交叉相关性分析(Multi-Fractal De-trended Fluctuation CrossCorrelation Analysis,MF-DCCA)方法却能够很好的刻画两个非平稳时间序列之间的非线性波动相关性。本文在药物研发、产业工人、股票市场领域做了以下研究:在药物研发领域,本文率先使用假性时间序列和MF-DCCA方法研究了药物分子性质与水溶性之间的非线性交叉相关性。实验结果表明,药物分子的分子量和水溶性之间具有较弱的长程交叉相关性;其他药物分子性质和水溶性之间具有较弱的幂律交叉相关性;滑动窗口宽度对时变赫斯特指数的鲁棒性较强。这项工作可以为深度学习药物分子性质预测的多尺度特征输入任务,提供一种新的特征选择方法。在产业工人领域,本文通过网络大数据和MF-DCCA方法的结合对产业工人队伍的研究文献和网络搜索做了调研。对产业工人队伍相关的文献基金资助、文献发表年度、主要研究机构情况进行了统计分析。通过自然语言处理、百度指数和MF-DCCA融合的方法提出了一种分析产业工人队伍的框架。利用知网文献提取关键词,使用关键词进行百度指数的时间序列检索,使用MF-DCCA方法分析基于关键词的时间序列与产业工人时间序列的相关性,可以帮助政府了解舆情,研究现状并采取相关措施响应民意。在股票市场领域,本文提出了一种股票价格涨跌趋势预测框架。它包含了数据收集,MF-DCCA相关性分析和股票价格涨跌趋势预测环节。实验结果表明,网络大数据与股票价格涨跌趋势之间存在长程交叉相关性;百度指数加入前后对股票价格涨跌趋势预测性能表现出贡献不统一。可能存在的原因是投资者的不理智行为使得百度指数与实际股票市场信息不匹配或百度指数对大众搜索行为数据的整合性太差。这项工作可以为股票价格涨跌趋势预测和决策提供帮助。
其他文献
静脉血栓形成(venous thromboembolism,VTE)是心血管疾病患者死亡的三大原因之一,也是唯一可以预防的致死原因,年发病率为(1~3)/1 000。而孤立的远端深静脉血栓形成(isolated
<正>资源枯竭不断引发经济危机和生态危机,使城市陷入结构性衰退,几乎所有的资源型城市都面临资源枯竭后居民生活如何持续、城市如何进一步发展等问题。发展循环经济,可以通
编制背景及过程2015年,受国家战略咨询委员会和工信部的委托,中国汽车工程学会组织行业专家历时一年编制完成了《节能与新能源汽车技术路线图1.0》(以下简称《技术路线图1.0
随着时代的发展,社会的进步及信息化的不断深入,高校图书馆已成为高校教学中的不可或缺的关键部分,因此馆藏资源建设就显得尤为重要。本文从纸质文献资源与数字化信息资源两
在社会经济水平飞跃式发展的背景下,各行各业开始高速发展,化工生产中化工设备的使用也因此受到很多人的关注。而在整个化工生产中,机械设备的维修与保养能够直接决定化工生
文章对肉苁蓉中松果菊苷和毛蕊花糖苷闪提工艺进行了研究,分别从肉苁蓉药材中活性成分提取工艺优化,肉苁蓉多糖的分离纯化;肉苁蓉精制多糖理化性质检测,肉苁蓉药材植物图谱的
空间负荷预测(Spatial Load Forecasting,SLF)是城市电网规划建设的基础性工作,从未来用电负荷的大小和空间分布方面进行考虑,来指导和规划电网的未来发展,其预测结果将直接
中职数学与专业的融合是中职数学教学改革的必经之路。教师应在这一背景下做好备课工作,通过有效的备课来提升学生对数学的学习兴趣,提高学生在专业学习中的理解与应用能力,
重庆实施西部大开发战略的前十年城市建设目标构想是:完善主城区中心城市功能;启动都市圈城市建设;万州、涪陵基本建成大城市,黔江、永川、江津、合川、南川、长寿、开县基本
目的:研究胆胃郁热型胆汁反流性胃炎患者采用大柴胡汤加减治疗的临床效果。方法:病例样本为2018年3月至2020年3月时间段我院收治的100例胆胃郁热型胆汁反流性胃炎患者,分组方