比较文本但字符不同

Comparing text but character is different

我正在尝试比较这两个字符串 Cpt. Awesome â\u0084¢Cpt. Awesome ™ 它们本质上是相同的,尽管在一个字符串中商标字符的编码不同。我想知道如何对它们进行编码,使它们变得相等。

我尝试用相同的编码对它们重新编码,但结果还是一样。

byte[] bytes = Encoding.Default.GetBytes(myString);
myString = Encoding.UTF8.GetString(bytes);

编辑

删除非 ASCII 字符

s1 = Regex.Replace(s1, @"[^\u0000-\u007F]", string.Empty);
s2 = Regex.Replace(s2, @"[^\u0000-\u007F]", string.Empty);

首先,this可能是post值得一看的。正如 Jon Skeet 所说,字符串没有编码,编码仅在进出字节数组时起作用。如果这两个字符串实际上代表可用数据,您可能需要考虑在存储字典的地方进行查找以将 â\u0084¢ 映射到 ,因为仅编码和解码不会给您您想要的正在寻找。