【摘 要】
:
[目的]解决海量篇级文献的存储与在线访问、大规模数据治理和服务性能低的问题,建设科技文献大数据平台.[方法]以分布式技术为基础,分析科技大数据特点及服务导向,结合服务器
【机 构】
:
中国科学院文献情报中心 北京100190;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190;中国科学院文献情报中心 北京100190;中国科学院软件研究所 北京100190
论文部分内容阅读
[目的]解决海量篇级文献的存储与在线访问、大规模数据治理和服务性能低的问题,建设科技文献大数据平台.[方法]以分布式技术为基础,分析科技大数据特点及服务导向,结合服务器、网络等硬件资源条件,采用共租部署策略,设计了“5+2”整体架构的科技文献大数据平台.[结果]建成PB级科技文献大数据平台,数据存储量达到200TB,文献实体量达3.2亿条,实体关系量达60亿条,基于MapReduce的元数据处理性能提高3倍,形成了基于微服务的知识服务架构.[局限]该平台未设计完整的流式处理流程,不能满足增量数据即时响应的需求.[结论]本文建设的科技文献大数据平台已支撑中国科学院文献情报中心知识发现平台、慧科研等产品体系,取得较好的线上服务效果,提升了对科技文献数据的处理计算与服务能力.
其他文献
艺术与生活密不可分,生活是艺术的源泉,写生是艺术创作的重要环节.历来卓有成就的艺术家们都重视生活,重视艺术与自然、社会的关系,依照“外师造化,中得心源”的原则进行创作
中国传统文化讲究礼仪和品德,从古至今都是国人所遵循的准则。关于教育层面同样如此,不论年纪大小,都需要通过文化素养的教育。良好的品德素养是从小开始培养,通过教师和家长的共
[目的]利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取.[方法]将关键词抽取问题视为一个序列标注问题.对期刊文本进行
[目的]促进数字化古汉语的组织与利用,通过建立标注体系并构建层叠深度学习模型实现古汉语自动断句与标点,从而推动人文社科领域的发展.[方法]以《四库全书》构成海量典籍的
叙事语篇与论证语篇在前景与背景的及物性上呈现出相反态势.叙事语篇中,前景具有“高及物性”而背景具有“低及物性”;论证语篇中,前景具有“低及物性”而背景具有“高及物性
教育装备在教育发展和改革中属于重要的物质基础,能够使办学条件实现均衡,教育教学工作的总体质量获得物质保障。有关部门需要对教育资源进行统筹配置,对中小学内教育装备的质量
在农产品的销售过程中,包装对消费者的吸引力是显著的,所以为了更好地促进农产品销售,对产品包装进行创意设计有突出的现实意义.总结目前市场上的农产品包装会发现产品包装同
随着我国社会的不断发展与进步,对于我国的古诗词的学习与运用愈发的重视,对我国的初中语文古诗词阅读教学提出了新的机遇与挑战。因此,各地初中语文教师对现有的教育教学方法进
今年来,游泳溺水事件频频发生,开发设计一款防溺水报警项圈,为游泳者提供安全保障十分必要。文中设计的智能溺水呼救项圈使用STC89C51RD+单片机作为MCU,MS5837-30BA压力传感
在死亡这一人生的最终话题面前,民众以自己独特的诗性幻想去克服恐惧,维持身体、精神与秩序的平衡.挽联,不仅是丧葬民俗中的应用文体,更是民众在丧礼上的传统仪式.文章以帕里