基于Apriori算法的车辆检测相似重复记录消除方法

来源 :天津大学学报 | 被引量 : 0次 | 上传用户:cgrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为消除在数据库中存在的中文相似重复记录,提出一种改进的Apriori算法,利用该算法获得数据库记录的频繁项集.基于频繁项集,消除进行比较记录的共有项,有效提高相异字符的计算权重.然后利用FRMA算法计算记录间的相似度,最终消除中文相似记录.在车辆检测数据库中对该算法进行了实验,取得了较好的实验结果,证明该算法具有较好的实用价值.
其他文献
本文介绍了远端液压控制注射器的工作原理和构成部分,具有避免X射线照射、可直视操作、使用成本低和安全等优点,可用于各种放射造影检查。
为提高稀薄燃烧汽油机的稀燃极限,提出了一种借助低温等离子体,利用稀薄燃烧发动机排气中的氧气和水蒸气对燃油进行重整,以制得富氢的混合气体辅助发动机进行稀薄燃烧的方法.设计
为研究机翼在随机参数激励下的稳定性和可靠性,建立了在一个随机气流速度影响下的二元机翼随机动力学模型.首先,利用拟不可积Hamilton系统的随机平均法,将系统的广义能量表示为一
为研究方钢管混凝土柱与钢梁受拉翼缘连接的结构性能,基于隔板贯通节点承载力理论,对11个十字形节点试件进行了静力拉伸试验.研究结果表明,圆弧倒角型隔板贯通节点具有较好的
从近底水流结构和泥沙颗粒位置的随机性两方面研究非均匀沙起动的2个关键问题,提出遮掩度的概念细化了颗粒受力.运用概率论与力学相结合的方法,采用滚动模式建立了非均匀泥沙
为了设计燃气机热泵的变容量控制器,利用建立的仿真模型,通过仿真实验对串级模糊控制和串级PID控制系统的响应过程进行了研究.串级控制系统的主回路分别采用模糊控制和PID控
基于震后城市给水管网水力分析模型和给水管网系统服务性能准则,引入模糊数学的理论与方法,以管网节点水压和流量为评判指标,建立了震后给水管网系统服务性能的二级模糊综合
采用海藻酸钙凝胶包埋固定,对人工污水进行静态模拟净化试验,研究了在pH值为4、5、6、7和8下,铜的质量浓度为0mg/L、0.05mg/L、0.5mg/L和5mg/L时,固定和悬浮状态下栅藻和鱼腥藻对污水中
为了研究箍筋约束混凝土L形截面柱的轴心受压性能,进行了7根箍筋约束混凝土柱的轴心受压试验,并采用有限元软件分析了箍筋对L形截面柱的核心混凝土的约束作用,建立了箍筋横向约
运用亚射流过渡自适应控制思想进行了铝脉冲MIG焊工艺试验,研究了焊接参数对铝脉冲MIG焊亚射流过渡的影响.通过工艺试验对焊接电流与电压的时基瞬时波形、相平面图和熔滴过渡的