论文部分内容阅读
协作社区作为一种有效的协同建构知识的技术支持环境,近年来开始受到越来越多的E-learning和CSCL(计算机支持的协作学习)研究者的关注。与协作社区的交互分析成为了目前的研究热点。然而传统的内容分析方法多以手工分析为主,即通过对言论的类型进行人工编码与统计得出分析的相关结论。大量的编码工作使得这种方法难以对大量的数据进行处理。此外,由于处理的数据量过小,使得编码体系本身也难以得到推广。因此近年来,越来越多的研究学者开始关注计算机对交互分析的支持。
基于此,笔者在硕士求学期间,重点关注计算语言学、文本数据挖掘等方法的研究。本文首先分析了协作社区中交互文本的特点后得出如下结论:交互文本属于口语化强的短文本,交互文本存在上下文回复关系的线索信息,交互文本带有交互语气的特点。本文随后进一步指出了已有的计算机辅助内容分析的不足,包括对定性文本分析而言手工编码的低效性以及分析手段的单一性、字串分析软件的简单性、语境层面分析的难操作性。基于以上分析,本文最后通过对规则匹配方法、频繁模式挖掘算法、概念相似度计算方法的研究,尝试提出语义理解模型,并将模型用于在线交互文本的自动编码研究,期望本研究对交互分析提供新的思路。本论文取得的成果有:
1.提出了协作社区中计算机支持的内容分析框架:即在线交互文本语义理解模型,从符号信息,句式规则,上下文回复关系三种不同的角度对在线交互文本进行分析,提出自动编码的方法。
2.改进频繁模式挖掘算法,解决原有算法耗时长的问题,并将算法利用到句式规则库中常用短语和句子结构的优化过程中。
3.借用中文常识知识库知网,并结合形式概念分析方法改进概念相似度计算方法,并将其利用到句式规则库的关键词生成过程中。
论文的二三四章分别对上述内容进行了详细的阐述,每一个部分都包括了相关研究背景的进一步调研、解决方法、具体技术实现。