更新时间:2022-04-28 18:48:56
删除字符串中的指定符号
s = "abc123,123。"
# 删除逗号
s = s.replace(',', '')
print(s) # "abc123123。"
删除字符串中的空格
s = " 123abc "
# 删除开头的空格
print(s.lstrip()) # "123 abc "
# 删除结尾的空格
print(s.rstrip()) # " 123 abc"
# 删除开头和结尾的空格
print(s.strip()) # "123 abc"
# 删除字符串中所有的空格
print(s.replace(' ', '')) # "123abc"
删除字符串中的所有符号,只保留数字和英文字母
import re
s = "123,abc .?/&?》^_^dddA。"
# 把所有编码非\u0030-\u0039(数字)、\u0041-\u007a(英文字母)的字符替换为空字符串
rs = re.sub("([^\u0030-\u0039\u0041-\u007a])", '', s)
print(rs) # "123abcdddA"
只字符串中的保留汉字
import re
s = "我爱中国????????,I love China。"
# 把所有编码非\u4e00-\u9fa5(汉字)的字符替换为空字符串
rs = re.sub("([^\u4e00-\u9fa5])", '', s)
print(rs) # "我爱中国"
对应的unicode编码范围
说明 | unicode范围 |
---|---|
数字 | \u0030-\u0039 |
汉字 | \u4e00-\u9fa5 |
大写字母 | \u0041-\u005a |
小写字母 | \u0061-\u007a |
英文字母 | \u0041-\u007a |
韩文 | \uAC00-\uD7AF |
日文 | \u3040-\u31FF |