论文部分内容阅读
使用Python语言中的正则表达式,进行了文本的模式匹配,根据匹配结果修改文本内容;讨论了ASCII、ANSI和Unicode等文字编码的原理,识别了带BOM标志的各种Unicode编码的TXT文件,对不带BOM标志的TXT文件区分UTF-8和ANSI编码进行了详细的讨论,并给出了具体实现。