一种客户端短信过滤的样本特征库生成方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:adward006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前中文短雷过滤研究缺乏样本库的现状,提出一种客户端样本特征库生成方法。设计客户端短雷过滤样本特征数据库,将客户端接收到的短雷进行预处理和中文分词,考虑高雷息量的低频词和带有较强类别特性的特征词,改进互雷息评价函数提取样本特征,需成特征数据。采用Naive Bayes算法测试特征数目对过滤器性能的影陞,实验结果表明,当特征数目为10时,测试准确率达到最大值,当样本特征库中短雷数目达到2000条时,数据库文件的大雓约为714.28 KB,可在普通手机平台上运行,验证了特征库生成方法的可行性。
其他文献
为全面了解马铃薯新品种黔芋6号的生产特性,采用Shukla和C.S.Lin分析方法,利用2008-2009年贵州省马铃薯区域试验的数据,对马铃薯新品种黔芋6号丰产稳产及适应性进行了分析.结
图书馆核心竞争力管理就是对图书馆核心能力要素的管理,它是一个持续、循环、动态发展与提高的过程,我们应该用动态的管理方法与理念来管理它.图书馆核心竞争力的动态管理是
目的 明确护士长的领导能力与护士工作满意度之间的关系.方法 对5所医院的护士进行调查统计分析,要求护士对护士长领导能力的5个因素与其工作满意度之间的关系进行评分,并对
介绍了上海市某儿科医院发展战略研究的背景、内容、方法及主要结果,制定了该院未来10年的战略发展目标和未来5年的战略发展方案.认为内在的逻辑性、政府和主管部门的支持以
为探究新疆罗布卓尔人后裔9项头面部遗传学指标,运用群体抽样方法,对新疆尉犁县罗布村102名罗布卓尔人后裔(男68名,女34名)9项人类群体遗传学指标(内眦褶、上眼睑皱褶、门齿类型、
简要介绍了我国农村饮水安全的现状及存在的问题,借鉴国外解决农村饮,水安全问题的经验,提出了解决我国农村饮水安全问题的具体措施.
采用完整土块法,以千年桐(Aleurites montana)人工林为研究对象,测定了1~5级细根的形态、生物量和组织碳(C)、氮(N)含量,分析了不同径级和序级与细根形态指标的差异性,对序级
采用连续侧线出料精馏法对原料进行预处理,切取正丁醇-异丁醇富集液.采用色谱法在汽液平衡釜上探索正丁醇-异丁醇在溶剂中的分配效果,选择甘油为最适合的萃取溶剂.运用Aspen
以农乐988和扬糯1号两个品种的玉米颖果为材料,利用树脂半薄切片、组织化学染色及生理测定等方法研究胚乳组织和细胞的发育过程。结果表明,两个玉米品种粒重及淀粉含量的变化
目的:研究黄鳍金枪鱼胰脏酶解液控制链脲佐菌素(STZ)诱导的糖尿病大鼠血糖和血脂异常的作用,为进一步开发利用金枪鱼胰脏,研制新型辅助降血糖保健食品提供理论依据。方法:用S