基于云服务平台的数据知识资源管理系统的设计与开发

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:whqqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,以信息技术为核心的数字化工作模式日益盛行,各企业单位也紧随潮流不断创新,而传统资源管理方式具有不便共享、不便查阅、不便管理及易丢失等问题,所以线上智能知识资源管理需求应运而生。本文设计的基于云服务平台的数据知识资源管理系统,不仅解决了传统方式存在的问题,而且保障了企业知识的内部共享,提供了一个便捷、有效的资源管理平台。本文主要研究内容分为资源推荐、搜索引擎实现、手写笔记识别以及同步消息反馈四个方面:(1)针对不便共享问题,本文将基于用户的协同过滤推荐算法和基于内容的推荐算法相结合,实现兴趣资源的推荐。先根据系统用户的日志记录和对应记录的关注度,计算用户可能感兴趣的资源信息,再结合基于内容的推荐算法,补全推荐。其中基于用户的协同过滤推荐算法采用皮尔逊(Pearson)相似度计算方法,使预测结果比传统计算方法更加准确,基于内容的推荐算法采用同类型资源相关度更高的推荐原则。采用上传资源占据资源关注度的方式,可有效解决“物品冷启动”问题。此外,根据基于流行度的推荐算法,提供热度资源推荐服务。(2)针对不便查阅问题,本文以系统知识资源为数据源,基于云服务平台实现搜索引擎。通过数据处理和分发系统Apache Ni Fi获取数据库资源信息及对应文档,转码后推送至云服务平台。在云平台利用搜索服务器Elasticsearch建立索引,配合文档抽取插件Ingest-Attachment实现文本预处理,并配合分词器IK Analyzer指定搜索字段的分词类型。使用汉语言处理(Han Language Processing,Han LP)包对用户输入的内容做去停用词处理,最终实现全文检索。(3)针对管理困难问题,本文加入手写笔记识别,以协助用户管理个人资源。本文采用了百度文字识别处理技术,其中,首先使用百度试卷与分析接口定位笔记图中的表格区域并裁剪保存,记录表格相关信息,之后使用百度手写文字识别接口识别笔记图并处理识别结果。当处理的结果信息在表格区域外时,直接将文字识别结果写入结果文档,在表格区域内时,使用百度表格文字识别接口识别表格并将识别结果写入文档。多图识别利用模板记录历史内容的方式实现,文档处理采用文档处理接口Apache POI实现。(4)针对管理者无法及时传达指令问题,本文采用通信协议WebSocket实现公告消息的实时提醒,即同步消息反馈,便于客户端和服务器之间的无障碍消息互传。使用心跳检测及重连机制可以确保客户端和服务器处于及时通信状态,能够将公告通知数据及时推送给在线用户。通过对以上重点内容的研究,本文实现了一个智能知识资源管理系统,可有效避免资源易丢失的问题。
其他文献
现如今,机器学习、人工智能等技术逐步与畜牧业相结合,推动了智慧畜牧业的高速发展。在智慧畜牧业领域中,针对奶牛等反刍动物的研究尤为广泛。反刍时长可以反映出反刍动物的健康状况。因此,如果能实现对奶牛反刍行为的识别检测,就能及时发现反刍异常的奶牛,让患病的奶牛及时得到治疗,避免牧场的损失。本文针对音频数据、视频数据等类型的数据具有的提取困难、噪声多、模型对其识别结果不理想等问题,基于奶牛的活动量数据和神
如今,无线传感器网络(Wireless Sensor Networks,WSNs)引起了全世界的关注,并被大范围的应用在各个领域,例如医疗护理、情报探测、军事行动和空间探索等。其中,时钟同步技术是关键的支撑技术之一。因为每个传感器节点只有运行在统一的时间基准上,采集到的信息才有价值。然而,WSN中由微型电池提供所需要的能量,这往往会出现能量不足的问题以及存储能力、处理和计算资源有限等问题,给时钟同
近年来,物联网(Internet of Things,Io T)技术发展迅速,同时也带动了其他产业的发展。无线传感器网络(Wireless Sensor Networks,WSN)作为Io T的底层技术支持,凭借着其低成本、易部署以及广泛的应用场景等特点成为了一个热门的研究领域。而WSN的节点能量有限且无法对电池补充能源,导致WSN的生命周期有限。所以如何提高节点的使用时间,延长网络的使用寿命就成
随着城市建设的快速发展,许多高层建筑应运而生,原来的城市供水已不能满足高层居民的用水需求,因此二次供水系统已成为必不可少的设施。二次供水系统是城市供水管网系统的重要环节,是保证城市高层住宅正常供水的优势,体现在很多方面。许多早期的二次供水系统的供水性能存在严重问题,包括高层建筑设计设施老化,系统设计不良,管理不到位等一系列问题,对高层住宅水质造成严重影响,给整个城市的供水系统带来了巨大的隐患。因此
社交网络的普及使得垃圾邮件发送者在平台上无处不在,一是垃圾邮件挤占了网络有限的硬件资源和信息传输渠道,影响了网络有效信息传播的效率,严重降低了用户体验;二是垃圾邮件还会对合法用户构成多重安全风险。社交网络平台通过技术手段对垃圾邮件发送者进行过滤,然而,互动形式多样化和用户关系多维化都使得有效检测垃圾邮件发送者的难度加大。本文提出一种基于图神经网络(Graph Neural Network,GNN)
近年来随着互联网平台的开放,各个平台为了提高其与用户的黏性,都开通了相应的社交渠道,广大用户可以自由地发表个人意见和观点。然而,一些用户利用互联网平台的跨时空性和透明性等特点,违反网络平台管理条例,肆意发表不利于国家稳定发展、社会安定团结、有损他人身心健康的毒性言论,对社会造成了不良影响。网络言论毒性识别对提升用户体验、网络环境净化和促进国家社会的健康发展具有重要意义。为了有效解决毒性言论在网上肆
数据采集卡作为测试测量设备的一种重要仪器,在航空航天、工业控制等领域中得到了广泛应用。当前国内市场上的数据采集产品所用的集成电路芯片长期依赖国外供应商,而且大部分受制于美国公司。随着中美贸易战的不断升级,关键芯片被“卡脖子”的风险越来越高,因此研制一款基于国产芯片的数据采集卡愈发重要。本论文旨在研制一款基于CPCI总线的国产化扫描AD模块。该模块具有32路差分通道,采样分辨率为16位,单通道最高采
近年来随着人工智能时代的来临,机器学习作为人工智能的核心及实现方式也得到了全面的发展.机器学习通过使用各种算法对大量的数据进行训练,从而学习如何完成任务,使得机器变得更加智能.聚类分析和半监督分类分析作为机器学习的重要学习任务之一,更是得到了研究者们的广泛关注.本文分别提出了一种新的平面聚类和半监督分类算法,以解决目前聚类分析和半监督分类分析中存在的问题.具体的研究工作如下:(1)在聚类方面,传统
在人类基因组中,基因的表达水平和表达模式表现出巨大的多样性。尽管已经发现基因表达可以由转录因子(Transcription factor,TF)和其他调控因子共同控制,但解密其复杂性仍然是一项艰巨的任务。在真核生物中,多种转录因子可以协同结合不同种顺式调控元件来调控靶基因的表达水平。为了系统的分析转录因子组合与基因的表达水平之间存在的关联,本文基于GM12878和K562两种细胞系的表达谱RNA-