如何比较 Javascript 中完全相同但字符代码不同的字符串

How to compare exact same string but with different charCodes in Javascript

我有一个问题,Sharepoint API returns 我从 table 中得到一个字符串,它看起来与我要比较的字符串完全相同。但是比较总是失败。

at
"people lookbook+"
lt
"peo​ple lookboo​k+​​"
at == lt
false
at === lt
false

当我遍历字符串并打印出字符代码时,我可以看出区别。

那么我该如何比较它们或者我应该如何解码呢?

这里是字符代码:

for (index = 0; index < at.length; ++index) {
    console.log("char " + index + ": " + at.charCodeAt(index));
}
VM1116:2 char 0: 112
VM1116:2 char 1: 101
VM1116:2 char 2: 111
VM1116:2 char 3: 112
VM1116:2 char 4: 108
VM1116:2 char 5: 101
VM1116:2 char 6: 32
VM1116:2 char 7: 108
VM1116:2 char 8: 111
VM1116:2 char 9: 111
VM1116:2 char 10: 107
VM1116:2 char 11: 98
VM1116:2 char 12: 111
VM1116:2 char 13: 111
VM1116:2 char 14: 107
VM1116:2 char 15: 43

for (index = 0; index < lt.length; ++index) {
    console.log("char " + index + ": " + lt.charCodeAt(index));
}
VM1118:2 char 0: 112
VM1118:2 char 1: 101
VM1118:2 char 2: 111
VM1118:2 char 3: 8203
VM1118:2 char 4: 112
VM1118:2 char 5: 108
VM1118:2 char 6: 101
VM1118:2 char 7: 32
VM1118:2 char 8: 108
VM1118:2 char 9: 111
VM1118:2 char 10: 111
VM1118:2 char 11: 107
VM1118:2 char 12: 98
VM1118:2 char 13: 111
VM1118:2 char 14: 111
VM1118:2 char 15: 8203
VM1118:2 char 16: 107
VM1118:2 char 17: 43
VM1118:2 char 18: 8203
VM1118:2 char 19: 8203

8203 是 Zero width space。它可能不是真的需要。可以这样去掉

lt = lt.replace( /\u8203/g, '' );

比较将起作用。问题是如果插入了一些其他字符,在这种情况下您需要将其他字符添加到正则表达式中。这可能不是一个非常优雅的解决方案。

在 Wa Kai 和 nomve 的帮助下,我发现有 8203 个字符代码可以使用以下代码删除:

lt.replace(/\u200B/g,'')

为了确保安全,您也可以使用这个:

lt.replace(/[\u200B-\u200D\uFEFF]/g, '');

这将删除:

  • U+200B 零宽度space
  • U+200C 零宽度非连接器 Unicode 代码点
  • U+200D 零宽度连接符 Unicode 代码点
  • U+FEFF 零宽度不间断space Unicode 代码点