基于simhash与倒排索引的复用代码快速溯源方法

来源 :通信学报 | 被引量 : 0次 | 上传用户:xinshouji1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新颖的复用代码精确快速溯源方法。该方法以函数为单位,基于simhash与倒排索引技术,能在海量代码中快速溯源相似函数。首先基于simhash利用海量样本构建具有三级倒排索引结构的代码库。对于待溯源函数,依据函数中代码块的simhash值快速发现相似代码块,继而倒排索引潜在相似函数,依据代码块跳转关系精确判定是否相似,并溯源至所在样本。实验结果表明,该方法在保证高准确率与召回率的前提下,基于代码库能快速识别样本中的编译器插入函数与复用函数。
其他文献
重视会计凭证装订工作,是做好会计基础工作和会计档案管理的重要前提。因此,切实抓好会计凭证装订工作,探索会计凭证装订工作规律,制定会计凭证装订制度十分重要,不可小视。文章着
陈云经济思想是一个系统的、完整的理论体系,其形成过程伴随着我国革命、建设和改革的实践历程,有一个从萌芽到形成、成熟再到深化发展的过程。其主要内容包括:综合平衡思想
在经验正交函数分解(EOF)分析的基础上,采用旋转经验正交展开(REOF)方法,对江西省81个气象站6月降水进行客观分区,发现前4个主成分的累积方差达到了76.6%,这4个旋转主分量的高值区(绝
目的:调查安徽皖南地区5所三级综合医院外科护士深静脉血栓形成(DVT)防控知信行现状,为改进DVT防控护理理念提供参考依据。方法:采用自行设计的DVT防控知信行调查表,以便利抽样法
<正> 在湖北省新闻界,提起吴东林,有人说他是一个“外功”打入新闻圈儿的“怪才”。也有人说他是一个通晓新闻“十八般武艺”的“杂家”。探寻这位“杂家”的“怪招儿”,的确
期刊
实验采用营养液培养法,进行了缺磷和Fe^2+诱导,形成相同厚度铁膜后进行了铁膜成分和铝毒缓解机理研究。结果显示铁膜的主要成分Fe(Ⅲ),约占总铁量的77%~84%,且水稻根表铁膜可
目的探讨重叠综合征(OS)早期肾损伤情况及相关指标分析。方法选取2014年1月至2018年8月南京市第一医院呼吸与危重症医学科收治的16例OS患者(OS组)及42例慢性阻塞性肺疾病(COP
“中国模式”研究近年来再度成为热点主题。相对于最初单一的经济视角,当前海外学者开始从政治、社会、文化等多角度重新审视“中国模式”,实现了中国模式研究从传统的“公民
目的探讨肿瘤标志物在类风湿关节炎合并肺间质病变(RA-ILD)中的临床意义。方法 80例RA患者,根据是否合并ILD分为观察组(RA-ILD患者)和对照组(RA未合并ILD患者),各40例。比较