【摘 要】
:
随着信息技术的发展,图书馆馆藏资源趋于数字化。资源数字化方便了用户使用,但其自身具有的易复制、易传播特性使数字资源抄袭、拼接现象越来越严重,图书馆数字资源版权保护
论文部分内容阅读
随着信息技术的发展,图书馆馆藏资源趋于数字化。资源数字化方便了用户使用,但其自身具有的易复制、易传播特性使数字资源抄袭、拼接现象越来越严重,图书馆数字资源版权保护面临严重的威胁。解决数字资源版权纠纷问题不能仅依靠法律,还需要一定的技术支持。数字资源的相似检测可以实现抄袭行为的鉴定,传统的相似检测方法更多侧重字符串的匹配,在面对同义词替换等高级抄袭行为时,无法准确判断抄袭;且传统的检测方法存在计算量大、不能反映资源内容等不足,无法扩展到海量数据处理,因此逐渐被基于数字指纹的相似检测方法代替。基于数字指纹相似检测的方法通过数据降维降低了计算难度,为在海量数据上进行快速、准确的数字资源抄袭检测奠定了技术基础。本文提出的数字指纹生成算法综合词语关联度、词语语义、TF-IDF特征和位置因子多种因素提取文献主题词,将主题词经过SHA-1编码降维处理后形成基于文献内容的数字指纹。其次利用基于椭圆曲线的三方比特承诺实现对数字指纹的安全保护。最后利用基于内容的数字指纹比对实现文献相似度检测,为文献类数字资源的版权保护研究提供有力保障。为支持大数据处理,本文将数字指纹的生成算法与相似检测算法基于MapReduce编程框架实现,以提高计算效率。另外,本文在资源相似度检测时,通过局部数字指纹间的比较实现对抄袭文献来源的精准追踪定位。实验表明使用本文提出的算法生成的数字指纹具有明显的可区分性和较强的鲁棒性,指纹间距离可有效感知文献内容变化;同传统相似度检测方法比较,本文提出的并行算法在检测文献间的相似度时更准确且计算速度有明显提升,能够满足大数据环境下文献相似性检测的要求,可有效解决数字资源所面临的版权侵权现象,为版权所有者提供有力保护。
其他文献
本文对高校新闻传播专业教育过程中出现的问题进行了分析,旨在探索高校新闻传播专业如何利用就业市场提供的信号,按照需求导向的规律重新构造新闻传播学专业的实践教学体制。
静电纺丝技术是目前制备纳米纤维最重要的基本方法之一。这一技术的核心是使聚合物熔体或溶液在高压静电作用下,克服表面张力形成一股带电的喷射流,之后纤维固化,纳米级纤维
现行《企业所得税法》对企业从事国家重点扶持的公共基础设施项目实行"三免三减半"优惠政策。以通信、铁路和电网为代表的网络型基础产业的技术升级项目大都属于上述公共基础
本文主要从初中信息技术教学的现状以及初中信息技术教学改革措施两个方面来研究,力图找出初中信息技术教学的不足,从而改进初中信息技术教学,为培养新兴科技时代的全面人才
虎式坦克是第二次世界大战期间纳粹德国装备的一种重型坦克。作为战争期间投入使用的一种新式武器,德军对虎式坦克给予了极大的期望。与纳粹在战争中使用的众多新式武器一样,
自来水行业的发展一直都是关系着国计民生的大事,近年来国家和政府都对水行业的发展加大了投资力度,从国外引进并自己投产了一系列先进的设备和先进的处理工艺,这些先进的工
青钱柳是我国特有的珍稀树种。集药用、保健、用材、观赏多用功能于一身,以青钱柳叶为主要原料的降糖、降压系列产品备受青睐;速生性状明显,为家具良材;其树姿优美,果似铜钱,
说谎行为的发展可以说是儿童社会化的一个过程,因此儿童对说谎的认知及儿童自身说谎行为的产生发展引起了众多研究者的关注。有关正常儿童说谎概念的道德理解和评价,以及说谎
某新建铁路隧道斜穿山体出洞,洞口危岩落石强烈发育,地形陡峻,且洞口下方为既有省道,为保证洞口及桥台的施工与运营安全,洞口设计拟采用棚洞结构。目前国内外采用的棚洞结构形式种
论文运用海洋渔业产品生态标签制度,以两个海岛型旅游目的地为案例,对海洋生态产品生态补偿标准区域差异化进行了研究。结果表明:1)浙江省舟山市普陀区和山东省烟台市长岛县