基于稀疏模型的学术著作信息采集方法的研究

来源 :电子乐园·下旬刊 | 被引量 : 0次 | 上传用户:guanjianjun1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:社会的进步和科学技术的迅猛发展,各类研究成果以前所未有的高速度增长。拟采用稀疏表示模型,使用稀疏重建算法,通过重建实现对学者信息的采集。
  关键词:信息采集;稀疏模型;重建算法;高效
  1 引言
  随着学术交流活动的日益活跃,研究人员通过图书出版的形式将研究过程中形成的对某一问题的总结性思想、某一领域取得的前沿成果等进行记录和传播。这些图书一般具有较高的学术水平和原创性,在某种程度上体现了作者的学术积累并以“学术著作”的名称为学术界所认同和使用,逐渐成为日益重要的学术文献,对这种承担重要功能和作用的学术文献进行数据采集和分析具有重要的意义。
  社会的进步和科学技术的迅猛发展,各类研究成果以前所未有的高速度增长,直接导致了相关文献数量的急剧增长。仅以科技文献为例:据统计,全世界每年出版的图书有80万种以上。学术信息的爆炸式增长,研究人员和研究管理人员面临选择的难题,如何从浩如烟海的文献中获取最有效的信息资源无疑是一项严峻而重要的课题。
  一方面,相对期刊论文而言,学术著作通常篇幅大、出版和使月周期长、电子化程度低。这些因素造成对学术著作数据的采集和分析都比较困难。另一方面,相对期刊论文而言,有关著者的基本信息包括姓名、所在单位、项目支持情况、学者类型等基本情况不能直接从著作本身准确获取。因此,如何有效获取学术著作的数据是亟待解决的问题。
  本文多维度分析学术著作相关特征,创新性提出基于稀疏模型的采集方法,实现对学者信息、学术著作的匹配,建立稀疏模型,有选择地联动高校机构知识库(科研管理系统)的数据,从而实现对学术著作相关信息的采集和分析。
  2 基于稀疏模型的学术著作信息采集模型
  立足于信号本身就具有稀疏性或可压缩性的先验特性。Donoho[1],Candès [2]等提出信号采样和重建的理论—压缩感知。考虑到学者信息与学术著作的匹配问题的实际情况,即相对于著作信息,学者的信息--学者的姓名和单位具有稀疏性,因此提出将稀疏重建模型引入到学术著作信息采集,公式如(1)所示:
  subject to (1)
  其中待重建的为N个学者信息,表示为待重建的未知信号,那么可以通过求解一个最小平方的问题重建信号,即存在最优支撑集的索引和满足,其中是矩阵的第J列。通过最小化误差函数实现对学者信息的获取。
  3 结果分析
  采用待重建的信号维度是1024,对应数据库里有1024个学者信息,稀疏度K的范围为100至150,即有100至150名學者信息需要采集。仿真结果如表1所示,模型所使用的观测矩阵为满足约束等距性质的贝努利随机矩阵矩阵,在稀疏度范围的100至150的情况下,成功重建的概率为99%以上。
  4 结语
  随着通信和电子技术的飞速发展, 人类对信息量的需求与日俱增。与此对应的大量数据产生。如何有效提取和采集有用信息是亟待解决的问题,特别是各类研究成果如何有效与学者信息配对。考虑到信息本身的特点,从稀疏的角度出发解决问题是一个实用高效的方法。
  参考文献
  [1] Y. Tsaig, D.L. Donoho. Extensions of compressed sensing. Signal Processing.2006, 86(3): 533-548
  [2] E. J. Candès, J. Romberg, and T. Tao. Robust uncertainty principles: Exact signal recognition from highly incomplete frequency information. IEEE Transactions on Information Theory.2006, 52(2): 489-509
  [3]练秋生,陈书贞. 基于解析轮廓波变换的图像稀疏表示及其在压缩传感中的应用. 电子学报. 2010, 38(6): 1-6
  [4]刘亚新,赵瑞珍.用于压缩感知信号重建的正则化自适应匹配追踪算法. 电子与信息学报. 2010,32(11):2713-2717
  毕雪,助理研究员,项目资助编号:SCAA16B10,四川学术成果分析与应用研究中心,西华大学重点项目资助Z1520908,四川省教育厅资助项目17ZB0416,教育部春晖计划项目资助Z2017075
  1西华大学电气与电子信息学院;2四川学术成果分析与应用研究中心
其他文献
摘要:传统的高压实业线路检修管理主要是通过人工的方式来实现的,针对检修任务的分配、完成情况以及结果反馈等都存在信息记录缺失以及反馈不及时等问题。本文引入安全管控信息系统,该系统通过对高压实业线路检修模块的建设,实现检修过程管理的全面信息化管理,帮助公司加强对检修执行过程的安全管控,严格计划审批、发布流程,规范现场施工作业过程,优化安全管控方式。  关键词:信息化;系统化;安全管控;线路检修  0引
期刊
摘要:在我国经济技术不断发展和进步的同时,低压配电柜技术也随之获得前所未有的发展。在现场总线被广泛应用的推动下,低压配电柜已经向着智能化、技术化和模块化的方向发展。基于此,本文首先对现代低压配电柜技术创新发展进行了浅析,进而又对现代低压配电柜未来发展趋势进行了浅析  关键词:低压配电柜;技术创新;发展  在经济和技术飞速发展的背景下,用于分配和控制电能使用的低压配电柜也相应的取得了快速的发展。现阶
期刊
摘要:随着社会城市化建设进程不断加快,城市居民电力资源需求量日渐提升。为从根本上保障电网运行效率以及运行过程中的安全性,需要细致分析居民分布式光伏发电系统实际运行过程中对电能采集以及线损造成的影响。本文就针对此,以居民分布式光伏发电概念为切入点,分析分布式光伏发电并网情况,阐述居民分布式光伏发电对电能采集以及线损的影响,以期为相关工作人员提供理论性帮助。  关键词:居民分布式光伏发电;电能采集;线
期刊
摘要:在数字化背景下,电力企业的档案工作迎来了重大的机遇,同时,档案管理效率显著提升,同时,档案数字化质量问题以及安全性问题成为了当前电力企业重点关注的问题。档案数字化质量关系到了电力企业的发展,为了充分的发挥出档案数字化的重要作用,电力企业方面 必须要强化档案数字化管理,同时,提升档案安全等级,减少档案信息风险,把电力企业的档案工作推向新的发展高度。本文对此进行分析,并且提出了几点浅见。  关键
期刊
摘要:文章从三相不平衡度的基本定义出发,通过对三相不平衡度的计算和分析,为三相不平衡度的实际校准工作提供应用基础。  关键词:三相不平衡度;对称分量法;负序分量;正序分量  引言  一个理想的三相平衡电路的三相电压源应该是正弦波,且幅度相同,频率相同,三相相位差为120°;当三相的负荷阻抗相同都为线性阻抗时,三相电流也都会是正弦波,且幅度相同,频率相同,三相相位差为120°。A、B、C三相的各相电
期刊
摘要:分布式光伏作为一种污染力小,环保效益较为突出的新型发电系统,它具有相对的独立性和并网性,我国现存光伏发电主要有集中式和分布式两种,本文主要从分布式体系架构入手,结合对配电网电压波动的影响,提出问题的解决途径,希望能为合理、科学地解决电压越限等问题提供参考性建议。  关键词:分布式发电;配电网电压;影响  在分布式光伏电源运作的过程中,由于大量分布式电源的接入,导致局域电网负荷监测出现混乱,也
期刊
摘 要:在不断探索科技,追求更高技术的脚步下,计算机技术不断更新完善,稳步提高,同时推动了其他产业的技术创新进步。自动化就是在社会飞速发展下的产物,本文将从几个相关角度简单谈论电气自动化控制系统的设计,以供参考。  关键词:电气自动化;系统设计;控制系统  引言:随着我国经济社会的工业化水平不断提高,电气自动化控制系统逐渐走入人们的视野中。电气自动化是不断进步更新计算机技术和长久以来坚持创新的自动
期刊
摘要:南京地铁宁天线开通初期,正线运营列车不明原因EB故障频发,严重影响了列车的服务可靠度。经统计故障原因,Deadman(死人按钮)触发占比较高,为21.7%。分析警惕回路发现,警惕回路的设计参数不能满足列车的使用需求。经整改该回路,不明原因EB故障率大幅度下降。  关键词:列车;EB;Deadman;警惕回路  1问题的提出  南京地铁宁天线开通初期,正线运营列车不明原因EB故障频发,运营前1
期刊
摘要:电力企业作为经营性服务企业,电费是主要经营收入,更是和企业生存及发展存在必然联系。而在此过程中,电力营销是电力企业的重要架构,但由于现场服务风险、自动化系统风险和电费安全风险等问题的存在,致使电费风险管理工作逐渐受到管理者的重视,即科学构建电力系统内控体系,优化电费风险措施,避免电费经营损失,是电力企业目前关注的焦点。  关键词:电力营销;全过程;电费风险  电费是供电企业生产经营的价值体现
期刊
摘要:社会经济的不断发展,使科学技术不断更新,世界经济趋于一体化,企业竞争越来越激烈。市场竞争的日趋激烈,对于电力企业的管理水平提出了更高的要求,作为企业管理的重要组成部分,人力资源管理受到了越来越多的重视。本文将对电力人力资源管理对企业经济效益的影响进行分析,并对电力人力资源管理的策略进行简要的讨论。  关键词:电力企业;人力资源;经济效益  电力行业发展速度不断加快,智能化的发展、技术创新,使
期刊