可变长度数量编码快速算法及在数据脱敏中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zj75924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的发展,数据压缩作为一项基础支撑技术广泛应用于海量数据存储及传输场景。整数通用编码作为无损压缩的一类,适用于待编码符号先验概率未知的情况。另外,在数据存储及传输过程中,数据脱敏技术可以根据脱敏规则对敏感数据进行变形,从而实现有效保护隐私信息。因此,在以上过程中实现数据压缩与脱敏联合进行也具有实际研究意义。可变长度数量(Variable Length Quantity,VLQ)编码是一种整数通用编码,它使用任意数量的八位比特字节表示任意大的整数。在每八位比特字节中,最高位用于指示是否有下一个字节跟随,而剩余7位比特用于存储整数的二进制序列。VLQ编码分为大端模式和小端模式。小端模式将整数的最低7位比特组在第一个字节中编码,最高7位比特组在最后一个字节,而大端模式相反。VLQ的大端模式称为Conventional VLQ,小端模式称为LEB128。然而,Conventional VLQ和LEB128都存在编码冗余,即每一个整数可以对应多个码字。目前存在变体Git-VLQ去除了 Conventional VLQ的编码冗余,但也引入了额外的算数操作使其具有更高的计算复杂度。另外,在数据脱敏过程中,传统动态脱敏方案要求根据访问人员权限匹配相应的脱敏规则从而产生不同级别的非敏感数据,并期望降低网络带宽和数据存储空间消耗。基于以上问题,本文工作如下:1.RR-LEB128快速算法及其N比特变体本文第一个工作提出了一种基于LEB128的VLQ变体Removing Redundancy LEB128(RR-LEB128),去除了 LEB128中存在的编码冗余,实现了码字与整数一一映射。其次,提出了一种新的快速解码算法,可以直接采用码字进行解码,与LEB128和Git-VLQ比较具有更低的解码复杂度。实验模拟表明,RR-LEB128的编码吞吐量比Git-VLQ高55%左右,解码吞吐量比Git-VLQ和LEB128高20%左右。最后,基于RR-LEB128,提出了一般化的去除冗余N比特VLQ编码。2.基于整数通用编码RR-LEB128的动态脱敏方案本文第二个工作首次将整数通用编码RR-LEB128应用到动态脱敏中,并提出两种整数脱敏算法,一种基于低位数值替换,一种基于分组变长码字。所提方案具有以下特性:(1)采用RR-LEB128对整数编码压缩从而减少数据量;(2)对同一敏感数据脱敏时,根据脱敏规则可以直接对码字变形产生不同级别的非敏感数据,而无需将码字解码后再脱敏。效果评估表明,相较于传统动态脱敏方案,本方案既保证了一定的安全性和可用性,又节省了存储空间与网络带宽。
其他文献
采用不同掺量的直投式改性剂对SBS改性沥青进行改性,并进行了不同改性剂掺量下,改性沥青的PG高温分级试验、MSCR试验和主曲线测试。PG分级试验结果表明,改性剂掺量的提高,能够显著提升SBS改性沥青的高温分级。MSCR试验结果表明,直投式改性剂能够显著降低SBS改性沥青蠕变回复率的温度敏感性,改善SBS改性沥青的抗永久变形能力和其对于高温的温度敏感性,并能在一定程度上降低改性沥青的应力敏感性。主曲
期刊
江南是我国当代著名通俗小说作家,作品横跨青春、奇幻、武侠等多个领域,其中质量最高、数量最丰、影响最大的是奇幻小说。幻想是人类的天性,神话是文学的原型,在奇幻小说里不难发现神话的人物、意象和叙事结构屡次再现。江南奇幻小说最主要的原型来自于北欧神话。本文运用神话——原型批评理论,辅之神话学、结构主义、叙事学等理论,立足具体文本,剖析江南奇幻小说的北欧神话原型。第一章分析江南“九州”系列中的北欧神话意象
学位
以往研究表明,个体加工面孔的专家化能力会随着知觉经验的增加而逐渐增强。在面孔知觉时使用整体加工就是面孔专家化的一种表现形式。相较于长期知觉经验少的异族面孔,个体在知觉长期知觉经验多的本族面孔时更倾向于使用整体加工。然而一些研究却发现,人们对于长期知觉经验不同的本族和异族面孔表现出同等程度的整体加工。因此,长期知觉经验作用于整体加工的必要性仍有待验证。此外,短时训练的研究发现,少量短期知觉经验也能诱
学位
利用管道机器人或管道内检测器等装备进行管道维护检测,是保证油气管道投产与安全运营的重要技术手段。管道机器人在其运行过程中,由于管道内存在凹陷与焊缝等缺陷,难免会与其产生冲击碰撞,这会影响管道机器人的稳定性与内检测作业的效果。因此需要对管道机器人冲击凹陷过程进行分析,为管道机器人稳定运行提供正确的设计和运行参数以及理论基础。本文以管道机器人通过凹陷这种外部障碍的过程为例,对管道机器人进行受力分析,建
学位
近年来,社会上有关“换脸”的负面报道层出不穷,例如捏造多媒体虚假新闻来侵犯公民隐私名誉,危害个人财产安全等。因此,发展高效可靠的人脸伪造鉴别技术,保护网络空间中十分重要的人脸安全,成为了当下备受关注且亟待解决的问题。目前,人脸伪造检测方法主要分为基于人工特征、基于深度学习、基于多任务迁移、基于伪造过程、和基于数字水印5类方法。其中,大部分检测方法都是从整个面部区域提取视觉特征,虽然在大型公开数据集
学位
20世纪20年代初期,由郑振铎、叶圣陶、赵景深等文学研究会成员组织发起的“儿童文学运动”,作为“新文化运动”中的重要文化事件,对中国现代儿童概念的发现与发明,以及现代儿童文学的产生发展都意义匪浅。“儿童文学运动”中的文学活动事件,包括儿童期刊的出版、儿童文学主题的公开讨论及讲演,以及儿童文学作品的翻译和创作等,都是20年代中国现代儿童文学图景的重要构成。本文聚焦由文学研究会主持的“儿童文学运动”,
学位
本文探索了采用力化学和热化学脱硫制备不同微观形态脱硫胶粉的可行性,并研究了对改性沥青性能影响。结果表明,两种手段均可制备不同微观形态的脱硫胶粉。由于脱硫机理不同,两种方式制备的脱硫胶粉微观形态不同。随着反应温度升高,脱硫胶粉的交联密度及硫含量降低、氧含量增加,溶胶含量及PDI增加、Mn降低。脱硫胶粉改性沥青的加工和易性增强、高温性能及弹性降低,储存稳定性先变弱后增强,力化学脱硫胶粉改性沥青的低温性
期刊
家庭暴力现象的存在,曾经因为被看作是“家务事”而使得施暴者的残忍行为合理化。随着2016年国内《中华人民共和国反家庭暴力法》的实施,公众人物家暴等各类社会案件在媒介中频繁曝光,家暴议题逐渐成为公众讨论和反思的热点。本研究基于社会性别理论视角,以B站的家庭暴力议题相关视频为研究样本,采用费尔克拉夫的三维分析研究方法,从话语文本分析、话语建构实践、社会实践分析的三层框架出发,对视频样本中两性形象的媒介
学位
政府信息公开法律制度有助于提高政府工作透明度,保障行政相对人依法获取政府信息。2019年修订的《政府信息公开条例》完善了依申请的政府信息公开中会损害第三方合法权益条件下的处理程序,但信息公开义务机关得以何种标准判断第三方之“合法权益”?如何判断“不公开可能对公共利益造成重大影响”?理论界实务界看法各异,域外立法各有不同。公民知情权与信息权利人隐私权之间的冲突与平衡是政府信息公开法律制度所面临的基本
学位
配制废胶粉理化复合改性沥青时需要加入多种化学助剂,以胶粉、软化剂、活化剂和交联剂等4种材料作为影响因素,各选取3个水平进行正交试验,以软化点、延度和软化点差为评价指标进行极差分析,研究4种材料掺量对废胶粉理化复合改性沥青性能的影响,经综合对比分析确定废胶粉理化复合改性沥青最佳配方为23%胶粉、2%软化剂、2.5%活化剂、3%交联剂。试验表明,最佳配方废胶粉理化复合改性沥青无论高、低温性能还是储存稳
期刊