基于统计的中文文本分类研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:laohe5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
其他文献
【正】六十年代末,苏联作家瓦西里耶夫发表了著名的被誉为苏联军事文学“第三个浪潮”代表作之一的《这里的黎明静悄悄……》《以下简称《静悄悄》)。八十年代初,我国作家徐怀
采用瑞典pharmacia UniCAP100变应原检测系统,对57例儿童和51例成人哮喘患者的血清进行吸入性过敏原过筛实验、食物过敏原过筛实验和总IgE(TigE)的检测。儿童患者对食物过敏19例
目前众多外卖软件普及,改变了人们的日常饮食习惯。但是现有订餐软件多数是针对个人用户开发的,企业或多人团体订餐极不方便。针对上述问题,使用开源SSM框架,基于协同过滤推
本文建立了一个考虑参数时变性的Fama-French三因子模型,介绍了一种非参数估计的方法能逐期估计出因子模型中的因子载荷,并且提出一种可以检验因子载荷是否随时间变化的假设检验方法。研究表明,在Fama-French三因子模型中,可以利用该方法估计并检验因子载荷的时变性,并且利用估计均值构建多个多因子模型的联合显著性检验。我国上证50指数及创300指数各成分股的参数在单独检验中显著,表示个股参数随
沙门菌(Salmonella)和大肠杆菌O157:H7(Escherichia coli O157:H7,E.coli O157:H7)是对人类健康有严重危害的重要食源性致病菌,建立其高效、快速检测方法具有重要意义。动态
来华留学是我国教育事业的重要组成部分。近年来,贵州省来华留学教育工作取得了显著成效,但也存在规模较小,层次较低,生源国别欠丰富等不足。本文基于实地调研结果,对贵州省
随着我国城市化水平的不断提高,城市道路网络结构日趋完善,快速路在城市路网体系中发挥了关键作用,快速路的运行效率不仅影响路网整体的运行质量,更影响着城市的正常运转。智能交通系统以交通管控和诱导技术为核心,是提升城市快速路服务水平的重要工具。深入挖掘海量的交通数据资源,对快速路交通流进行实时、精确的预测是提升管控和诱导能力的基础。本文针对快速路交通流微波数据采样缺失与交通流非线性特性,利用张量理论和深
目前国内外对功利主义道德判断的研究主要集中在身体伤害领域,运用道德两难困境得出功利主义道德判断的影响因素为意图和个人力量。然而在日常生活中,除了身体侵犯,还有言语
图书馆信息资源数字化是数字图书馆建设的前提和条件。近些年来,全球范围内的数字图书馆建设如火如荼,图书馆馆藏资源的数字化也随着快速发展。发达国家(尤其美国)是这个领域的
玉女煎作为治疗胃热炽盛证的传统中药方剂,被广泛应用于治疗消渴疾病,然其作用机制尚未得到系统阐述,该文结合中医整体治疗的观念,从分子水平、细胞水平、临床表现三个角度分