且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

python 包之 re 正则匹配教程

更新时间:2022-08-20 08:13:22

一、开头匹配

  • 从字符串开头开始匹配
  • 返回匹配对象;如果找不到匹配,则为None
import re

print(re.match('飞兔小哥', '飞兔小哥教你零基础学编程'))
print(re.match('学编程', '飞兔小哥教你零基础学编程'))


二、全匹配

  • 匹配字符串是否和给定的字符一模一样
  • 如果一模一样才返回匹配对象,如果找不到匹配,则为None
import re

print(re.fullmatch('飞兔小哥教你零基础学编程', '飞兔小哥教你零基础学编程'))
print(re.fullmatch('飞兔小哥', '飞兔小哥教你零基础学编程'))


三、部分匹配

  • 只要在字符串中找到字符存在即可
  • 找到返回匹配对象,如果找不到匹配,则为None
import re

print(re.search('autofelix', '飞兔小哥教你零基础学编程'))
print(re.search('飞兔小哥', '飞兔小哥教你零基础学编程'))


四、匹配替换

  • 用正则表达式去匹配原始字符串,并把匹配到的内容替换
import re

# 去掉电话号码中的-
num = re.sub(r'\D', '', '188-1926-8053')
print(num)
# 18819268053


五、匹配替换返回数量

  • 用正则表达式去匹配原始字符串,并把匹配到的内容替换
  • 并且返回被替换掉的数量
import re

# 去掉电话号码中的-
num = re.subn(r'\D', '', '188-1926-8053')
print(num)
# (18819268053, 2)


六、分割字符串

  • 按照正则表达式的规则来分割字符串,并返回列表
  • 可以规定分割的次数
import re

print(re.split('a*', 'hello world'))
# ['', 'h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', '']

print(re.split('a*', 'hello world', 1))
# ['', 'hello world']


七、匹配所有

  • 在字符串中匹配所有符合正则表达式的对象
  • 并把这些对象通过列表list的形式返回
import re

pattern = re.compile(r'\W+')
result1 = pattern.findall('hello world!') 
result2 = pattern.findall('hello world!', 0, 7)

print(result1)
# [' ', '!']

print(result2)
# [' ']


八、迭代器匹配

  • 在字符串中匹配所有符合正则表达式的对象
  • 并把这些对象通过迭代器的形式返回
import re

pattern = re.compile(r'\W+') 
result = pattern.finditer('hello world!')
for r in result:
    print(r)


九、编译对象

  • 把正则表达式编译成Pattern对象
import re

pattern = re.compile(r'\W+')


十、修饰符

  • re.I:忽略大小写
  • re.L:本地化识别匹配
  • re.M:多行匹配
  • re.S:使.匹配包括换行在内的所有字符
  • re.U:根据unicode字符解析字符
  • re.X:给予灵活的格式以便理解
import re

content = "Cats are smarter than dogs"
print(re.search(r'DOGS', content, re.M | re.I))