【摘 要】
:
ID3算法作为数据挖掘分类技术中的核心算法,有着构造简单、学习能力强、分类速度快等优点。但由于其沿用的是机器学习算法,处理的数据集规模小且与数据库集成性较差,影响了其
【基金项目】
:
国家部委预研基金资助项目(the Pre-Research Foundation of China Ministries and Commissions)
论文部分内容阅读
ID3算法作为数据挖掘分类技术中的核心算法,有着构造简单、学习能力强、分类速度快等优点。但由于其沿用的是机器学习算法,处理的数据集规模小且与数据库集成性较差,影响了其实用性。在继承原有算法思路的基础上,对其核心部分进行了改进,通过使用嵌入式SQL,直接对目标数据库进行查询操作并处理,最终得到分类决策表并保存于数据库。实验证明,改进的ID3算法结合了SQL的高效性和C语言的灵活性,高效无缝地实现了大量数据的分类且大大提高了算法的执行效率。
其他文献
为了解鸡源葡萄球菌中多药耐药基因cfr的流行及耐药情况,采用提取细菌基因组DNA、PCR检测、药物敏感性检测、质粒提取、电转化试验、全质粒测序及分析等方法进行了研究。分离
并行I/O系统是高性能计算机系统的一个重要组成部分,其可用性水平对整机系统性能的发挥具有重要作用。采用SANs(Stochastic Activity Networks,随机行为网)模型及其支持工具Mobius
如果不出现变化,艰难度日的快递企业将要缴纳史上最师出无名的"苛捐杂税"。而这样的负担,最终将由消费者"买单"日子刚跨进2013年,邮政国家队即来势汹汹地准备对快递杂牌军实行"巧
通过对2000—2009年期间矿山酸性废水处理相关论文的检索和统计分析,结果表明,我国矿山酸性废水处理的相关研究处于稳定增长阶段,高校是主要的研究力量,一直主要从事中和法和
中国制造在世界市场的地位和作用正悄然变化,以鸿海为代表的代工企业日渐感受到制造业的寒意,转型升级之势已不可逆转
<正>一、课题研究的背景我们发现,小学生都是充满期待并且愉快的进入小学校园的,可以说学生在诸多方面的基础和条件都相差甚微,但经过一年或者更长时间的学校生活之后,他们在