中文期刊论文数据治理工作实践r——以挖掘中国知网题录及PDF文档为例

来源 :西安文理学院学报(自然科学版) | 被引量 : 0次 | 上传用户:qq184343882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为探讨数据治理工作在既定规范下取得相同或相近质量成果的可能性,尝试提升数据治理手段和工具的智能化与自动化,以某高等学校在中文期刊发表论文数据治理工作实践为例,使用Python编写程序自动挖掘从中国知网下载的题录及PDF文档内容,实现署名作者身份甄别、业绩点核算、文章所属期刊被各类评价体系收录情况统计等工作.结果表明,所编写程序自动化程度高,基本达到预期效果,在数据治理工作尚无成熟统一的大平台支撑背景下,编写个性化数据治理工具大有可为.
其他文献
社区医疗以其方便、人性化的服务方式和规模较小的设置特点,在居民生活中发挥着重要作用.城乡接合部承载着城市大量的涌入人口,面临极大的医疗卫生服务压力.分析社区基础医疗设施可达性,可以促进就医资源公平共享和医疗资源的最大效率利用.以西安市长安区为例,采用两步移动搜寻法,以社区基础医疗服务中心的服务人数确定搜索半径.结合社区和社区基础医疗服务中心的空间数据,表明长安区主要人口和社区基础医疗服务中心集中于郭杜街道和韦曲街道;可达性随着到主城区的方便程度增大而减少;长安区区域边缘部分,存在社区基础医疗服务中心资源闲
以溶液聚合法得到聚甲基丙烯酸甲酯溶胶,分别混合不同紫外线吸收剂,制备一定黏度的涂层溶胶,采用旋涂法将其涂覆于聚碳酸酯(Polycarbonate,PC)板材表面.为提高PC板材的抗紫外线能力,采用红外(FT-IR)判断聚合物的官能团变化;以拍片观察其形貌;以可见分光光度计对涂层进行透光率测试;以接触角测量仪对表面物质的亲疏水性进行分析.结果表明,含三种紫外线吸收剂的聚甲基丙烯酸甲酯耐紫外线涂层,随着紫外线吸收剂含量的升高,涂层的光学性能和表面平整性略有下降,但其抗紫外线性能提高.根据接触角均大于90°,说
大气混合层高度是影响大气扩散的主要因子之一,其对大气质量评估和污染物的存储量及分布起着重要作用,也是空气污染数值模式实际应用中的重要参数.利用2014-2018年间逐日的气象资料,通过程水源等研究的公式计算得出咸阳市的混合层高度,并研究其时间变化规律及其与AQI指数之间的关系.研究发现,2014-2018年间咸阳市年平均混合层高度呈现逐年下降的趋势,混合层高度在12月至次年7月间逐渐增大,在7月至11月逐渐减小.年平均混合层高度、月平均混合层高度与AQI指数之间整体上均呈现负相关关系,但是在不同时段内存在
煤泥矿物成分主要以粘土质矿物和石英砂为主,有机质主要以—COOH、—OH、—C=O和—OCH:等烯烃类、烷基侧链和杂原子官能团等形式存在,升温过程中有机质在400℃左右分解生成多孔碳.当温度升高至1200℃时,有机质裂解多孔碳相继与煤泥中石英砂、偏高岭石高温分解生成方石英和莫来石高温分解生成的方石英发生反应生产β-SiC,而添加石英砂煤泥样品则主要发生多孔碳与添加石英砂之间反应,伴随有微量SiC纤维相生成.煤泥中少量长石相和含钙矿物相也相继发生反应促进SiC晶相生成,微量重金属元素分别起到提高材料性能、促
针对隧道人员定位系统常用平均定位误差反映定位算法的精度,在实际应用中,某些边缘区域的定位误差远大于平均定位误差问题,提出一种基于误差区域划分的隧道人员组合定位方法,用于提高整体定位精度.首先,对常用的四边质心定位算法和极大似然估计算法进行区域分布仿真,找出其定位误差区域分布规律,分析误差形成的原因;其次,基于不同的误差区域特征,提出不同区域采取不同定位算法的解决方案,即将误差区域划分为3个区域,中间区域用四边质心定位算法进行仿真,上、下边缘区域用极大似然估计算法,以及四角区域分别将质心视作其整个区域的估算
镉(Cadmium,Cd)胁迫条件下,通过水培试验研究接种(寡养单胞菌属Stenotroph-omonas sp.)GBR32菌株对番茄生长和Cd累积影响.结果表明,与对照组相比,接种菌株GBR32后,番茄地上部和根部的生物量分别增加了63.6%和98.6%,MDA(malondialde-hyde,丙二醛)含量分别降低了46.4%和14.5%,根部的SOD(superoxide dismutase,超氧化物歧化酶)和POD(peroxidase,过氧化物酶)活性分别降低了19.8%和10.4%,叶绿素a
以芜湖市玩家为研究对象,运用文献资料法、问卷调查法、调查访问法对中国弹弓制作工艺的演变进行研究.研究表明:传统弓皮筋的材质和股数决定使用寿命、杀伤力和所需臂力;芜湖市弹弓玩家主要选择1745型号配4股的皮筋;鸡尾酒皮筋和扁皮筋在型号选择、绑发方式,及杀伤力方面各有差异;传统弓在造型上各有差异且售价不同,卡球弓外形张扬有个性,易上手,准确度高,滑轮弓皮筋拉力平衡,射击稳,适合横瞄;早期弹弓皮兜主要有羊皮、牛皮、猪皮,现主要选择纳米级超细纤维皮料,其强度大、韧性强、价格便宜.
随着绿色化学和可持续发展理念的兴起,作为一种物化性质与离子液体类似的新型溶剂,低共熔溶剂在植物提取物中引起广泛关注.为了探究低共熔溶剂体系对燕麦蛋白质提取的影响,分别以蛋白质得率、提取率、蛋白质含量、回收率等为考察指标,研究各个因素对蛋白质提取的影响.结果表明,低共熔溶剂体系种类、含水量对燕麦蛋白质的得率、提取率、蛋白质含量、回收率影响较大,而料液比、温度、时间等因素对其影响较小.较佳工艺为:以摩尔比为1:3的氯化胆碱/乙二醇合成低共熔溶剂,含水量为15%、料液比为1:7、温度为50℃、时间为100 mi
利用碳纳米纤维(CNFs)网络结构固定三维针状氧化锌(ZnO)晶须,从而制备得到ZnO/CNFs中间层,并通过中间层曲折的孔隙通道,延长多硫化锂的穿梭路径,使其能稳定的通过化学吸附和物理吸附对锂硫电池的“穿梭效应”进行抑制,通过充放电测试和循环测试等表征结果表明,在0.1 C的电流密度下,电池初始放电容量达1458 mAh·g-1,库仑效率保持在99.4%;在0.5 C的电流密度下,初始放电容量仍能达到1113 mAh·g-1,经过300次的充放电循环后,放电容量依然维持在734 mAh·g-1.
针对传统ORB算法存在特征点分布集中,在光照条件变化的情况下特征点提取不稳定,匹配准确率下降的问题,提出一种改进ORB算法.首先构建高斯差分金字塔,然后将各层图像划分成多个区域,根据区域内像素值的中位数计算每个区域的阈值,提取每个区域的特征点,之后采用双向匹配算法对特征点进行粗匹配,最后提出一种加权网格运动统计(Weighted Grid Motion Statistics,WGMS)算法对粗匹配结果进行优化.实验结果表明改进ORB算法可以使特征点提取更为均匀,在光照变化的情况下,可以稳定地提取特征点,算