【摘 要】
:
在科研、教育和商业化生产等领域,随着数据规模的扩大以及数据的不断传播,数据变得难以管理和理解。数据起源技术为了解数据的演化和派生过程提供了支持,对于基于数据的分析和决策有着重要的意义。在数据库环境下,数据起源技术主要通过日志文件等历史数据来调查对数据库中曾经存在的表和记录进行的更改,然而前提是数据必须真实有效。现有的研究主要从建立用户间信任的角度来提高历史数据的可信度,依赖网络审计等措施来检测内部
论文部分内容阅读
在科研、教育和商业化生产等领域,随着数据规模的扩大以及数据的不断传播,数据变得难以管理和理解。数据起源技术为了解数据的演化和派生过程提供了支持,对于基于数据的分析和决策有着重要的意义。在数据库环境下,数据起源技术主要通过日志文件等历史数据来调查对数据库中曾经存在的表和记录进行的更改,然而前提是数据必须真实有效。现有的研究主要从建立用户间信任的角度来提高历史数据的可信度,依赖网络审计等措施来检测内部的攻击,在可靠性和复杂性两方面难以平衡,因此,本文提出了一种基于时态关系的数据起源模型,它消除了基于用户的信任,提供可验证的历史记录,并解决了该模型存在的查询效率问题,具体而言:(1)提出带有链式安全信息的时态关系模型。时态关系存储了关系的记录变更历史,利用时态表可以获取关系表在特定时间戳下的数据快照。提出了两种方法来降低时态关系的数据冗余。将用户唯一标识、当前记录的数字签名以及前一条记录的数字签名作为时态表的安全信息属性。表中每条记录通过数字签名链接起来,可以通过发现数据的不一致来检测对时态表记录的篡改,因此保证了数据起源信息的真实性可验证。(2)解决了时态数据库的查询效率问题。分析了时态关系存在的查询效率问题,提出利用预计算的快照来降低查询应答的时间。由于快照会占用较多的存储资源,提出快照的最优放置问题,即计算指定数量的时间戳,使得使用这些时间戳下的快照对查询的优化效果最好。通过数学方法证明了单个快照的最佳位置是所有查询时间戳的中值,提出计算查询的最优分段来确定多个快照的最佳位置。给出了寻找最优分段的递归算法、动态规划算法、K-Means算法和K-Medoids算法。通过实验对比了四种算法的优缺点,K-Means算法更有利于本文的场景。(3)基于本文研究成果设计了并实现了可运行在业务系统中的数据起源模块,该模块提供了创建最佳快照、时态表查询和记录验证等功能,为数据分析人员快速查询和验证关系数据库的历史数据提供了支持。
其他文献
自第三次民主化浪潮以来,公民参政意愿增强,社会运动成为勃兴的社会力量,90年代在拉美形成反新自由主义社会运动浪潮,以被剥夺权利、土地、工作的社会边缘群体为主体的运动成为其重要组成部分。其中,阿根廷皮克特运动与巴西无地农民运动同属于拉美具有代表性的大规模新社会运动,其兴起均肇始于新自由主义经济改革所引发的一系列社会问题。在经历了发展及高潮时期后,两社会运动均于21世纪初期左翼政府执政期间进入去动员化
自从翻译活动出现之后,误译现象就随之出现了,由于误译现象在翻译活动中非常常见,其一直被国内外翻译界学者们所关注。在早期很多人将误译狭义地视为错误翻译,认为应该在翻译中极力避免误译,而谢天振教授将误译划分为无意误译和有意误译这两种类型,而有意误译在很大程度上像是译者出于多方面考虑而有意识采取的翻译策略,是具有一定的研究价值的。无论是哪一种类型的翻译,它都是将一种语言所表达的信息用另一种语言再表达出来
在这个互联网飞速发展的信息时代,个性化推荐已渗透到生活的方方面面,成为各大主流网站的不可缺少的服务。新闻推荐与已经被全面研究的产品和电影推荐相比,对新闻推荐的研究更为有限,仍有许多挑战需要进一步研究。尤其是如何在海量的信息数据中为用户过滤出用户可能感兴趣得新闻列表,并根据用户的历史兴趣提升用户的浏览体验,提供优质的个性化服务。本文以个性化新闻推荐系统为研究课题,重点研究了基于新闻信息和用户历史行为
本论文的研究目的在于探讨中国改革开放以后,在沪日籍就业者的就业结构及其变化。1978年中国的改革开放以后,许多日本人到上海就业。在这40多年来,居住在上海的日籍就业者有很明显的特征。这与其背后的中日经济关系及外资政策紧密相关。本文主要关注中国改革开放后至今在沪日籍就业者的就业结构,从在沪日企的产业结构这一侧面来看日籍就业者就业结构的特征。并分析改革开放政策、中日经济关系相关的因素,导出在沪日籍就业
<正>人到底为什么而活着,到底要怎么活?如果不弄清楚这个原点性的问题,那么,就可能出现"有的人活着,但他已经死了"。维克多·弗兰克尔在自传体回忆录《活出生命的意义》中,讲述了自己在奥斯维辛等集中营的经历以及自己对精神病患者的治疗实践,并从中归纳出可能寻找到生命意义的三个途径,这对我们探寻为什么而活、怎么活具有很大的启发意义。
肌少症是一种由肌肉力量、肌肉质量和躯体功能共同衡量的老年综合征,能够极大削弱老年人的独立性,进而引发多种不良结局。本文针对当前肌少症面临的发病机制不明确、诊断标准不统一和无有效治疗药物等问题,基于机器学习技术开展老年肌少症计算机辅助决策研究,为肌少症的危险因素分析提供新的手段,建立肌少症患者预后预测和治疗方案推荐模型,设计实现老年肌少症辅助决策系统,提高医生诊疗效率,促进肌少症的精准防治。论文主要
在教学实践中我们发现具备一定词汇量和句法知识的中高年级西班牙语学生依然无法读懂某些西语句子,我们猜测这是因为部分学生无法构建或错误构建语境。为证明这一假设,本文基于关联理论的语境观,探讨具有一定西班牙语基础的中国学生阅读西语句子时在语用层面上遇到的问题,从逻辑信息、百科信息、词汇信息三个方面论证中国学生理解西语句子时语境信息的缺失阻碍了他们对于句子意义的理解。本文在引言部分讨论了选题缘由、研究目的
特发性水肿辨治一得杨廷海河南矿业建筑安装工程公司职工医院(476611)主题词水肿/中医药疗法,活血祛瘀马某,女,35岁,机关干部,1991年6月3日初诊。素体肥胖,10年前产后失血,汗出恶风,身肿腰痛,西医调治,外感既除,然全身浮肿,冬轻夏重,虽经...
<正>我国产业园区发展现状及困境20世纪90年代初,分税制改革导致地方政府财权与事权的矛盾凸显,由地方政府直接开展的基础建设投融资行为受到严格规制,城投公司在此背景下设立。负责产业园区开发建设的城投公司一般由园区管委会或国资委直接设立和实际控制,承担园区开发、招商等职责。从发展历程看,城投公司设立初期依靠土地整理、厂房建设,取得土地开发的预期价值;
近年来,深度神经网络在三维数据处理方面取得了重要的进展。点云作为代表性的三维数据格式之一,相较于其他三维数据格式,其结构简单统一,更加容易学习。而基于点云的三维目标识别既保持了三维数据处理的优势,同时相较于基于其他三维数据格式的算法,会更少的产生冗余数据,大大节约计算和存储成本。本文主要研究了基于点云数据的三维目标识别系统的关键技术,首先设计了一个基于深度相机的多视角三维重建算法,该算法可以完成从