论文部分内容阅读
语言风格数据挖掘尚没有较完整的基础理论支持,为此,给出了半群的通用性质的一个语言问题型表述,建立了语言交流模型。给出“语言风格”的定义,用抽象代数方法分析了语言交流模型结构及语言交流理解行为β与语言知识同余关系ρ之间的包含关系,抛弃了β、确定ρ为语言风格中更为基本的因素,同时分析ρ具有稳定性、底层性——即“无可替代性”,从而证明ρ为语言风格特征、ρ将是语言风格机器识别的对象。最后预测该机器学习方法可应用于刑侦中的语言风格识别,比如网上匿名身份识别、手机短信SMI、网上虚拟主持人等。