论文部分内容阅读
摘要:该文主要介绍正则表达式的最基础的快速入门,以便从未了解过正则表达式的人对它初步了解及简单使用。关键词:正则表达式;快速入门
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2019)29-0269-02
该文主要涉及正则表达式的最基础的快速入门。在读完-本文后可能还是无法熟练有效的使用正则表达式,因为本文旨在让从未了解过正则表达式的人初步了解以及簡单地使用它,在进行深入的学习的时候轻松一些,想要熟练掌握正则表达式还需要你去更深入地去学习和使用它。
1正则表达式
正则表达式是描述一定匹配规则的特殊文本字符或字符串,用于判断字符串格式或者提取字符串内容。它最基本的模式,只是匹配文字。例如“\b[A ZO-9._% -] @[A-ZO-9.-] \.[A-Z]{2,}\b”,这是一个较复杂的模式。它描述了一系列字母,数字,点,下划线,百分号和连字符,后跟一个@符号,后跟另一系列字母,数字和连字符,最后是一个点和两个或多个字母。如果仔细看就会发现,此模式描述了一个电子邮件地址。使用上述正则表达式模式,您可以搜索文本文件以查找电子邮件地址,或验证给定字符串是否与电子邮件地址相似。下面讲的就是上述正则表达式所用到的一些知识。
2文字字符
最基本的正则表达式是由单个文字字符组成。例如“a”,它匹配字符串中首次出现的该字符;在字符串“Java”中,他就匹配“J”后面的那个“a”。
另外,还有一些特殊字符——“元字符”的存在。元字符在单独使用时大多数是错误的,因为元字符在正则表达式中具有特殊含义,所以要将元字符用作正则表达式中的文字,则需要使用反斜杠“\”来转义它们。例如要匹配“1 1=2”,则正确的表达式为“1\ 1=2”,否则的话,加号具有特殊含义。请注意,省略反斜杠的1 1=2是有效的正则表达式。所以你不会收到错误信息。但它与1 1=2不匹配。它将匹配11l=2在123 111=234。
3字符类或字符集
“字符类(字符集)”仅匹配多个字符中的一个字符。例如你想匹配某个元音字母,你可以将“a、e、i、o、u”这几个字母用方括号“[]”括起来,这样你就可以匹配任一元音字符,但是如果是“ae”或“ai”这样的两个字符同时出现就无法匹配,只能匹配前一个元音字符。你也可以在字符类中使用连字符来指定字符范围。例如“[0-9]”可以匹配0-9之间的任一数字,“[a-Z]”可以匹配任一小写字母。你还可以在开始方括号“[”后键入一个插入符号“∧”来匹配任一不在字符类中的字符。
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2019)29-0269-02
该文主要涉及正则表达式的最基础的快速入门。在读完-本文后可能还是无法熟练有效的使用正则表达式,因为本文旨在让从未了解过正则表达式的人初步了解以及簡单地使用它,在进行深入的学习的时候轻松一些,想要熟练掌握正则表达式还需要你去更深入地去学习和使用它。
1正则表达式
正则表达式是描述一定匹配规则的特殊文本字符或字符串,用于判断字符串格式或者提取字符串内容。它最基本的模式,只是匹配文字。例如“\b[A ZO-9._% -] @[A-ZO-9.-] \.[A-Z]{2,}\b”,这是一个较复杂的模式。它描述了一系列字母,数字,点,下划线,百分号和连字符,后跟一个@符号,后跟另一系列字母,数字和连字符,最后是一个点和两个或多个字母。如果仔细看就会发现,此模式描述了一个电子邮件地址。使用上述正则表达式模式,您可以搜索文本文件以查找电子邮件地址,或验证给定字符串是否与电子邮件地址相似。下面讲的就是上述正则表达式所用到的一些知识。
2文字字符
最基本的正则表达式是由单个文字字符组成。例如“a”,它匹配字符串中首次出现的该字符;在字符串“Java”中,他就匹配“J”后面的那个“a”。
另外,还有一些特殊字符——“元字符”的存在。元字符在单独使用时大多数是错误的,因为元字符在正则表达式中具有特殊含义,所以要将元字符用作正则表达式中的文字,则需要使用反斜杠“\”来转义它们。例如要匹配“1 1=2”,则正确的表达式为“1\ 1=2”,否则的话,加号具有特殊含义。请注意,省略反斜杠的1 1=2是有效的正则表达式。所以你不会收到错误信息。但它与1 1=2不匹配。它将匹配11l=2在123 111=234。
3字符类或字符集
“字符类(字符集)”仅匹配多个字符中的一个字符。例如你想匹配某个元音字母,你可以将“a、e、i、o、u”这几个字母用方括号“[]”括起来,这样你就可以匹配任一元音字符,但是如果是“ae”或“ai”这样的两个字符同时出现就无法匹配,只能匹配前一个元音字符。你也可以在字符类中使用连字符来指定字符范围。例如“[0-9]”可以匹配0-9之间的任一数字,“[a-Z]”可以匹配任一小写字母。你还可以在开始方括号“[”后键入一个插入符号“∧”来匹配任一不在字符类中的字符。