一种网络非规范汉语词汇的识别方法

被引量 : 0次 | 上传用户：zhangwenjiekao1

【摘要】

：

随着即时通信软件的普及,网络非规范词汇广泛出现在各种主观性文本中。在传统的文本挖掘中,这种非规范词汇都被视为噪音。事实上,这些非规范词汇经常存在于用户表达个人意愿

【作者】

：

姚天昉张霄凯

【机构】

：

上海交通大学计算机科学与工程系;

【发表日期】

：

2004年期

【关键词】

：

非规范汉语词汇网络评论预处理意见挖掘

【基金项目】

：

国家自然科学基金项目(60773087);萨尔州大学-上海交通大学语言技术联合实验室的资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着即时通信软件的普及,网络非规范词汇广泛出现在各种主观性文本中。在传统的文本挖掘中,这种非规范词汇都被视为噪音。事实上,这些非规范词汇经常存在于用户表达个人意愿的句子中。如果我们能够正确识别这类词汇,就能为意见挖掘提供新的意见元素信息。本文的工作把来自网络的非规范汉语词汇分为典型非规范汉语词汇和歧义非规范汉语词汇。对于典型非规范汉语词汇,我们采用了基于序列覆盖算法的模式匹配方法对其进行识别。而对于歧义非规范汉语词汇,我们则采用了基于特征抽取的分类方法进行识别。实验结果表明:上述两种方法对于识别网络非规范汉语词汇是可行和有效的。

其他文献

高中数学课堂教学中的师生互动技巧

高中生受应试教育的影响，学习压力较大.在中学教学当中，数学是其核心科目，在其中占据相当重要的地位.因此，教师以及学生必须在充分认识数学重要性的基础上提高对数学这一学科的重

期刊

高中数学课堂教学师生互动技巧

媒体融合时代期刊编辑继续教育模式探究

媒体融合时代期刊编辑角色由传统单一身份向多重身份转变,这就要求从业人员知识面更加宽广、技能更加纯熟,要求期刊编辑人员从纯粹的文字编辑向多领域学术编辑转变。为更好适

期刊

媒体融合全面融合编辑继续教育

新时代大型晚会主持人语言风格特征及审美体验

作为大型晚会的重要串联及主旨呈现人物，主持人的语言风格、业务素养及审美品味关系到晚会的整个艺术价值，同时也影响着晚会的传播与精神气质。本文将以新时代晚会主持人语言风

期刊

新时代主持人语言审美体验文化传播

芬顿(FENTON)高级氧化技术处理造纸废水工程应用研究

造纸行业作为废水排放量大，水污染严重的行业一直为人所诟病。本文介绍了一种新型的造纸废水深度处理技术，为造纸废水的高标准排放提供借鉴和参考。

期刊

芬顿高级氧化技术造纸废水

柏林大学精神与特征之探析

一流大学的出现和形成有其必然因素，柏林大学之所以成为现代大学的典范，有其深刻原因。本文通过对柏林大学的研究分析，揭示了一流大学所体现出的精神气质和应具备的办学特征。

期刊

柏林大学大学精神德国大学洪堡思想

一种聚氨酯改性环氧树脂胶黏剂的制备与性能表征

以甲苯二异氰酸和聚丙二醇等为原料对普通的环氧树脂进行改性研究,考察了PU含量对环氧树脂耐热性、韧性等的影响。通过红外光谱、SEM、热重分析和流变性等方式对合成的聚氨酯

期刊

聚氨酯改性环氧树脂韧性热稳定性

采用这种方式开展PPP项目不再难

现在开展PPP遇到的难题，不再是PPP项目怎么做，方案怎样写，合同怎么签，因为这些问题只要认真去做，还是能够做好的。而是有许多基础设施和环境治理项目可以用PPP模式去做，但限于本地

报纸

浅析铁路工程中轨道铺设技术的应用

轨道铺设施工技术作为铁路工程施工的重要技术之一,其技术水平的高低将直接影响到铁路工程的整体质量。为此,施工单位必须重视铁路施工中轨道铺设技术的应用,提高技术水平,规

期刊

铁路工程轨道铺设技术应用施工准备施工流程整道

高校毕业生就业信息化建设研究

随着时代的前进，科学技术飞速发展，“互联网+”时代来临，网络信息技术在各行各业迅速普及。高校毕业生就业面临着前所未有的机遇与挑战。在大数据的时代背景下，信息化建设是高校

期刊

高校毕业生就业信息化建设

PIM1对老年食管癌患者癌细胞增殖和凋亡的影响

目的探讨PIM1对老年食管癌患者癌细胞增殖和凋亡的影响。方法将RNAi重组质粒（PIM1-shRNA-3）经脂质体介导转染食管癌ECA-109细胞株。PIM1基因沉默（PPIM1-shRNA-3）稳定转染的ECA-10

期刊

食管癌PIM1基因沉默细胞增殖细胞凋亡

一种网络非规范汉语词汇的识别方法

其他学术论文