删除文本文件中的转义 unicode 序列

Removing escaped unicode sequence in a text file

例如，我有一个包含大量 unicode 转义序列（顺便说一下表情符号）的文本文件 blablabla \uD83D\uDC4D\uD83C blablabla \uDFFC\uD83D\uDC4F\uD83C\uDFFD 我想把它全部删除，然后得到 blablabla blablabla

考虑到我使用 Notepad++，是否有任何正则表达式可以清除这些内容？

谢谢。

我建议：\u[0-9A-F]{4}\s?.

\u 转义斜杠并将其与 u 文字匹配。 [0-9A-F]{4} 正好匹配其中的 4 个字符。也许您应该根据实际文本更新它以匹配长度为 2 个字符：\u([0-9A-F]{4}|[0-9A-F]{2})\s?

\s? 匹配零个或多个空格，因此您不会以多个连续的空格字符结尾。