删除文本文件中的转义 unicode 序列

Removing escaped unicode sequence in a text file

例如,我有一个包含大量 unicode 转义序列(顺便说一下表情符号)的文本文件 blablabla \uD83D\uDC4D\uD83C blablabla \uDFFC\uD83D\uDC4F\uD83C\uDFFD 我想把它全部删除,然后得到 blablabla blablabla

考虑到我使用 Notepad++,是否有任何正则表达式可以清除这些内容?

谢谢。

我建议:\u[0-9A-F]{4}\s?.

\u 转义斜杠并将其与 u 文字匹配。 [0-9A-F]{4} 正好匹配其中的 4 个字符。也许您应该根据实际文本更新它以匹配长度为 2 个字符:\u([0-9A-F]{4}|[0-9A-F]{2})\s?

\s? 匹配零个或多个空格,因此您不会以多个连续的空格字符结尾。