【摘 要】
:
随着通讯技术的发展,各种网络平台不断涌现,网络语言作为一种特殊的语言形式开始普及应用,对网络语言的研究具有传播学、社会学、舆情监测等多方面的意义。本文研究的网络语言指的是狭义的网络语言,即互联网用户的沟通用语。随着互联网用户的不断递增,网络语言内容呈指数级别增长,针对网络语言的研究主要在传播学和社会学方面,缺乏对网络语言文本的有效技术分析。基于以上背景,本文利用文本可视化技术及可视分析方法,主要进
论文部分内容阅读
随着通讯技术的发展,各种网络平台不断涌现,网络语言作为一种特殊的语言形式开始普及应用,对网络语言的研究具有传播学、社会学、舆情监测等多方面的意义。本文研究的网络语言指的是狭义的网络语言,即互联网用户的沟通用语。随着互联网用户的不断递增,网络语言内容呈指数级别增长,针对网络语言的研究主要在传播学和社会学方面,缺乏对网络语言文本的有效技术分析。基于以上背景,本文利用文本可视化技术及可视分析方法,主要进行了四个方面的研究工作:1.获取了大规模的网络语言文本数据。利用爬虫工具,基于意见领袖思想获取了天涯社区娱乐、股市、经济、国际观察、旅游五个论坛的主题帖内容,为方便对比不同平台的网络语言文本,获取了新浪新闻、网易新闻的部分新闻数据,完成了30多万条的网络语言文本语料处理与分析工作。2.提出了一种易读性强的词云生成方法。结合传统关键词筛选算法,通过词向量对比,提出了更加符合网络语言特点的关键词筛选方法。以网络语言文本为基础,将词语在文本中的位置和共现特征编辑到词云的布局中,提出了以双椭圆布局为基础的词云布局算法,提升了词云的易读性。3.提出了关键词加权的交互式主题河流可视化方法。在主题可视化方面,将关键词作为特征融合到文档主题权重中,利用积极词和消极词的权重参数提出了可以修正主题河流波动的关键词加权的主题河流可视化方法,并结合三维可视化工具,提出了能够更好对比主题趋势演变的三维交互式主题河流方法。4.基于本文的可视化方法完成了网络语言文本多维度可视分析。结合以上可视化方法,分别从关键词、主题趋势对比、跨平台用户的发言倾向、疫情影响等方面对网络语言进行分析,其中利用网络语言词云对天涯社区娱乐论坛进行了关键词分析,利用交互式主题河流对天涯社区五个论坛的数据进行了主题对比分析,综合利用多种方法完成了跨平台的网络语言发言倾向分析和疫情对网络语言的影响分析。通过对真实文本数据的可视分析,提升了网络语言文本的分析效果,验证了本文提出的文本可视方法的有效性。
其他文献
随着我国经济的不断发展,虽然国家近年来一直出台相关的政策来减小城乡之间的差异,也取得了一定的成果,但是在教育公共服务方面城乡之间已然有着较大的差距,在我国的农村地区,教育公共服务的对象一般以幼儿园、小学以及中学基础教育为主,在我国教育体系中占有着重要的地位,因而农村教育的发展直接影响到我国教育事业的发展。在公共服务中,教育公共服务是其重要的组成部分,由于城乡之间的差异,教育资源分配以及教育公共服务
随着我国人口年龄结构变化,老龄化正在逐渐变得普遍和常见,而随着我国经济结构的不断转变和经济水准的不断提升,老龄化群体对于生活质量的追求也在不断的升高,对于养老服务的标准也在不断增加,这在一定程度上加大了传统养老模式的发展压力。在这一背景下,对传统的养老模式融入新型的医疗技术逐渐成为现代化的养老服务方法,并在社会上得到了大量的认可和使用。为积极应对泸州市人口老龄化发展趋势,满足老年人日益增长的美好生
近年来,由于登记离婚程序过于简便,我国的离婚案件呈现出登记离婚数量增加以及轻率离婚现象频发等特征。而轻率离婚行为会破坏家庭和社会的稳定,损害未成年子女的利益,对当代年轻人的婚恋观产生负面影响。在此背景之下,《民法典》于1077条确立了离婚冷静期制度。该制度旨在减少轻率离婚,确保离婚案件中家庭成员的利益以及稳定社会秩序。但通过分析离婚冷静期的立法条文,并对离婚冷静期实施的具体案例与调查数据进行评估,
对于疾病预防医疗行为,医学界一直未能给出准确的定性,而在法学界也对疾病预防医疗损害的一些特性未能给予应有的注意,这便导致在司法实践过程中难以恰配地适用现有的法律法规,并且在案件审理过程中也不能很好的兼顾疾病预防医疗行为及疾病预防医疗损害的的特殊性。导致了在疾病预防医疗损害案件的处理过程中,容易出现同案不同判、审判结果无规律、裁判依据不明确、权利救济难预测等情况,大大打击了我国司法机关的公信力以及法
十九大以来,中共中央坚持完善中国特色社会主义制度,对推进国家治理能力和治理体系现代化做出了详细部署,其中,建设政府服务中心是加强政务服务、提高行政效能,为人民群众提供优质便捷高效服务的重要尝试。乡镇政务服务处于整个政务服务体系的最低层,直接作用于群众,没有任何中间层级,是提供社会公共服务的重要主体之一,乡镇政务服务的好坏很大程度上直接决定了群众对政府提供的公共服务的满意度。不断完善和加强乡镇政务服
2020年新冠肺炎疫情的爆发,对政府应急信息管理能力提出考验。健康码的应用为政府疫情防控提供了技术支撑,是我国电子政务发展的一次成功实践。健康码对提升政府应急信息管理的便捷性、准确性和时效性具有重要影响。随着健康码的广泛应用,政府应急信息管理出现了一些问题,主要是基于健康码的政府应急信息质量较低、政府应急信息管理后台水平较为粗放、政府应急信息管理受到地域限制。形成问题的原因,一是健康码信息采集无法
重视差异、尊重个性、开展个性化教学已成为教育发展的趋势。如何对学生学习中存在的问题进行针对性补救是实施个性化教学的关键环节之一。目前认知诊断应用于教学能够对学生的知识状态进行精确评估,提高了教学的个性化程度。但后续因缺乏科学的复习巩固方法,随着时间的推移,学习者不再对已补救知识进行巩固与强化,使得记忆保持率下降,尤其容易遗忘掌握不够牢固的知识。从而导致问题积累,对后续知识的学习造成障碍,影响学习效
个性化学习教育理念强调在教学中尊重和关注学生的个性差异,帮助学生摆脱繁重的学业负担,促进其全面发展。目前,随着信息技术的发展,将认知诊断技术应用于实际教学过程中在很大程度上提高了教学的个性化程度。认知诊断是对传统测验与评价的一种改进和完善,可以在测试过程中实时诊断学生的知识状态,从而实现个性化教学。但目前认知诊断测验尚无法对测试题目的难度和学习者能力进行精确的标定,这一问题在很大程度上影响着诊断结
数字时代,人人都是数据创造的主体,不同的数据主体通过科学算法和技术手段对数据进行搜集和处理,得出针对个人或者群体的信息内容,侵犯个人隐私。数据不仅关系到个人隐私和数据资产,同样关系到言论自由、网络自由以及虚拟化的人格发展,这是社会发展所带来的人的延伸发展。数据本身的普遍性、独立性、独特的利益指向性、公共性等特征要求我们对数据有更深刻和全面的认识,数据权利的定位以及保护问题研究亟待进行有效的理论建设
致谢在学位论文中具有举足轻重的地位,它是毕业生顺利完成学位论文过程的真实记录;它是毕业生对在完成学位论文的过程中以及在学业进程中得到的帮助表达的正式感谢;它为毕业生提供一个展现自己学术能力和社会身份的平台。然而,纵使如此重要,致谢作为一种学术英语体裁长期受到忽视。在毕业生的学位论文中频频发现致谢格式混乱,或仅对他人致谢稍作修改便搬到自己的论文中来的情况。致谢抄袭也是屡见不鲜。针对上述问题,本文对比