基于WEB的文本计算系统的研究与设计

被引量 : 0次 | 上传用户:vcnewer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅猛发展以及网络的普及,信息爆炸的时代已经到来,然而我们在享受网络带来的丰富信息及便捷生活的同时,也在忍受着信息轰炸的困扰。面对网络上丰富的无穷无尽的信息资料,人们如何从中获取有利信息,便成了当前研究的主要课题。目前,针对信息处理的研究主要处于理论研究阶段,有效的信息筛选系统并不成熟。因此,不同领域的研究人员、公司企业均迫切的要求一个能够针对不同需求的可以提供文本特征分析的文本计算系统。该系统主要根据调研的实际需求,在数据库中创建存储过程,为不同的用户创建独立的数据资料库,实现基于云平台的系统设计。该系统采用最大正向匹配算法对文本进行切词操作,提取TF特征、TF-IDF特征、信息熵、词频分布熵、文本分布熵、Pearson相关系数等特征值,并采用多特征值和功率谱图匹配的方法对文本特征进行分析与计算,相对于通过单特征值对文本进行分析,更加准确与直观。该系统采用B/S架构模式,使用SQL Server 2012数据库对数据进行存储,利用SSH开源框架进行系统开发,通过COM对象访问方式在Java中调用MATLAB,同时使用JFreeChart技术绘制功率谱图,并在在浏览器上显示。本文对系统需求进行了简单的分析,并根据软件开发的过程对系统进行了概要设计、详细设计等,最后对系统进行了简单的测试与维护。该系统综合了文本挖掘的多种算法实现了通过多特征值的计算实现文本相似性的判断、基于公有云和私有云的文本计算、功率谱图的分析绘制及匹配等都是该课题的创新之处。
其他文献
<正>据美国宇航局官方网站报道,美国和欧洲在火星拥有正在运行的卫星以及在火星地面工作的漫游车,这些太空探测器一直和地面控制中心之间保持着通讯联系。然而4月,地球和火星
在分析长三角与珠三角文化贸易模式现状和特点的基础上,探讨其文化贸易模式创新的必要性:随着经济发展及对外开放水平的不断提高,传统的贸易模式制约着两大都市圈对外文化贸
舌翼义齿的临床应用及体会南京医科大学第一附属医院(210005)徐颂成徐州矿务局职工第二医院张立君笔者自90年起为无牙颌患者和肯氏Ⅰ类、Ⅱ类缺失的患者,以“闭口印模”法所形成的组织面
目的对骨刺灵汤在腰椎骨质增生症疾病治疗中的临床效果进行探讨。方法选取2014年1月—2015年1月所收治的70例腰椎骨质增生症患者作为观察的对象,按就诊前后顺序分成观察组与
为体外培养纯化出稳定的奶牛乳腺上皮细胞和成纤维细胞,试验通过外科手术的方法取妊娠后期或泌乳期的荷斯坦奶牛乳腺组织,分离乳腺腺泡,用组织块法体外培养奶牛乳腺细胞,应用
全反射棱镜式激光陀螺是一种新型惯性敏感仪表。本文针对某型号棱镜式激光陀螺,根据半经典Lamb理论对其工作特性和稳频伺服控制进行了全面、深入的分析,并对关键技术及装配工
毫米波雷达在民用和军用近程探测上的使用越来越广泛。在民用领域,主要有交通监测、汽车防撞、自适应巡航控制与小区周界安全防范等;在军用领域,主要有各种智能引信、导弹导
目的:探索医院药品不良反应(ADR)报告和监测工作规律和新模式。方法:回顾2009—2011年ADR报告共224例,从不同角度分析比较各年度ADR报告特点。结果:报告数量逐年增加;医生是