删除文本文件中的转义 unicode 序列
Removing escaped unicode sequence in a text file
例如,我有一个包含大量 unicode 转义序列(顺便说一下表情符号)的文本文件
blablabla \uD83D\uDC4D\uD83C blablabla \uDFFC\uD83D\uDC4F\uD83C\uDFFD
我想把它全部删除,然后得到
blablabla blablabla
考虑到我使用 Notepad++,是否有任何正则表达式可以清除这些内容?
谢谢。
我建议:\u[0-9A-F]{4}\s?
.
\u
转义斜杠并将其与 u
文字匹配。 [0-9A-F]{4}
正好匹配其中的 4 个字符。也许您应该根据实际文本更新它以匹配长度为 2 个字符:\u([0-9A-F]{4}|[0-9A-F]{2})\s?
\s?
匹配零个或多个空格,因此您不会以多个连续的空格字符结尾。
例如,我有一个包含大量 unicode 转义序列(顺便说一下表情符号)的文本文件
blablabla \uD83D\uDC4D\uD83C blablabla \uDFFC\uD83D\uDC4F\uD83C\uDFFD
我想把它全部删除,然后得到
blablabla blablabla
考虑到我使用 Notepad++,是否有任何正则表达式可以清除这些内容?
谢谢。
我建议:\u[0-9A-F]{4}\s?
.
\u
转义斜杠并将其与 u
文字匹配。 [0-9A-F]{4}
正好匹配其中的 4 个字符。也许您应该根据实际文本更新它以匹配长度为 2 个字符:\u([0-9A-F]{4}|[0-9A-F]{2})\s?
\s?
匹配零个或多个空格,因此您不会以多个连续的空格字符结尾。