删除未知的特殊字符

Delete unknown special character

删除特殊字符

 s="____Ç_apple___   _______new A_____"

 print(re.sub('[^0-9a-zA-Z]\s+$', '', s))

result = ____Ç_______________apple___ _______new A_____

 s="____Ç_apple___   _______new A_____"

 print(re.sub('[^0-9a-zA-Z]', '', s))

结果= applenewA

决赛 结果 = 苹果新 A

但是我看不懂

我想删除 Ç 和 _ 并保留 space 和英语

由于您想将多个 space 合并为一个 space,然后删除不是单词或 space 的字符,您应该在两个单独的正则表达式替换中进行:

print(re.sub(r'[^0-9a-zA-Z ]+', '', re.sub(r'\s+', ' ', s)))

这输出:

apple new A

你想要 'apple new A' 作为结果,对吗?

s="____Ç_apple___   _______new A_____"

result = re.sub('[^a-zA-Z|\s]+', '', s)  # apple   new A
result = ' '.join(result.split())  # apple new A
print(result)