【摘 要】
:
对基本邻近排序算法(basic sorted-neighborhood method,SNM)进行分析,指出其不足,提出了SNM算法的一种改进方法。采用变步长伸缩窗口,动态改变检测窗口大小,避免漏配问题,并减少不必要的比较。采用动态调整等级法,根据记录相似度调整字段等级,并通过等级法将字段等级转换为权重,解决了人为赋予固定权重主观性强、不准确的问题。通过对实际系统中的数据进行测试,验证了方法的有效
【机 构】
:
解放军理工大学指挥信息系统学院,总参第六十三研究所,吉林陆军预备役步兵第47师
【基金项目】
:
中国博士后科学基金特别资助项目(201003797),江苏省博士后科研资助计划项目(0901014B),解放军理工大学预研基金项目(20110604)
论文部分内容阅读
对基本邻近排序算法(basic sorted-neighborhood method,SNM)进行分析,指出其不足,提出了SNM算法的一种改进方法。采用变步长伸缩窗口,动态改变检测窗口大小,避免漏配问题,并减少不必要的比较。采用动态调整等级法,根据记录相似度调整字段等级,并通过等级法将字段等级转换为权重,解决了人为赋予固定权重主观性强、不准确的问题。通过对实际系统中的数据进行测试,验证了方法的有效性和优越性。同时,这两种方法适用于大多数基于排序—合并的相似重复记录检测方法,提高了相应方法的效率和准确度。
其他文献
针对当前软件体系结构动态演化方法很少考虑组成元素之间关联的问题,从关联的角度考虑软件体系结构的组成,用关联矩阵和关联基数矩阵描述软件体系结构及其动态演化的各项需求,提出了一种基于关联矩阵的软件体系结构动态演化方法,并设计相应的算法进行实现,最后通过案例进行分析和实验,验证了方法的有效性。本方法可有效地实现软件体系结构动态演化的可追踪性和可控性。
为了方便维文图像的切分和识别工作,提出将基于凸多边形的最小面积外接矩形法和基线拟合法相结合的检测和校正图像方法。首先提取边缘像素生成凸多边形,利用基于凸多边形的最小
根据压缩感知理论中的采样模式,提出了一种基于改进采样模式的压缩域图像融合算法。该算法首先通过双星型采样模式获得待融合图像的稀疏域压缩测量值,然后利用一种简单的绝对值最大融合规则直接在压缩感知域进行融合,最后通过贝叶斯的方法重构融合图像。在图像重建的过程中采用了贝叶斯方法。由于考虑了误差以及噪声的影响,使得融合图像的质量进一步提高。仿真结果表明,该算法具有良好的融合效果。
针对AOMDV协议最短路径的路由选择策略没有考虑网络负载情况而容易造成局部堵塞,以及缺乏对备用路径的有效维护,导致使用无效的备用路径增加丢包率、降低路由效率的问题,提出了带分流反馈的AOM-DV协议。提出的协议综合考虑跳数、路径使用频率、路径状态等因素设计分流规则,使数据分组在多条路径中并行传输来均衡负载;利用网络局部信号强度动态设置接收信号强度阈值,通过对比报文接收信号强度和动态阈值来标志危险路
认知无线电网络中,主用户(primary users,PU)和认知用户(cognitive users,CU)的行为均会给认知节点间的频谱分配带来重大影响。考虑CRN中主用户对认知用户的影响及认知用户间相互干扰这两种因素,提出认知用户可用信道的潜在竞争节点数(number of potential competition node,PCNN)这一概念,进而定义信道稳定度作为衡量频谱质量的参数。在信
针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低、聚类精度低等问题,提出了一种新的K-means聚类算法。算法引入粒计算理论,并依据密度和最大最小距离法选择初始聚类中心,避免初始聚类中心在同一个类中,结合粗糙集,通过动态调整上近似集和边界集的权重因子,以解决边界数据的聚类问题;最后采用类间距和类内距均衡化准则函数作为算法终止判断条件,来得到更好的聚类效果。实验结果表明:
为了克服传统的谱聚类算法求解normalized cut彩色图像分割时,分割效果差、算法复杂度高的缺点,提出了一种基于鱼群算法优化normalized cut的彩色图像分割方法。先对图像进行模糊C-均值聚类预处理,然后用鱼群优化算法替代谱聚类算法求解Ncut的最小值,最后通过最优个体鱼得到分割结果。实验表明,该方法耗时少,且分割效果好。
双系统密码技术下的身份型广播加密方案具有在标准模型下,尺寸固定的短密文和密钥,无须随机标签和全安全等特点。研究发现该方案是不安全的,进而提出了一种改进方案,并在标准模型下运用双系统密码技术给出了改进方案的安全性证明。
基于线性反馈同步的理论,实现了统一混沌系统的线性反馈同步的控制,并将该混沌同步方式应用于混沌参数调制的保密通信系统中。在系统的发送端利用发送的信息信号调制混沌系统的参数,将信息信号隐藏在混沌信号中,在系统的接收端利用混沌同步信号提取出相应的混沌系统参数,进而恢复出所传输的信息信号。仿真结果表明其同步时间短,在保密通信系统的接收端恢复出信息信号非常逼近发送的信息信号,具有较强的保密性和实用性。
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。