比较文本但字符不同
Comparing text but character is different
我正在尝试比较这两个字符串 Cpt. Awesome â\u0084¢
和 Cpt. Awesome ™
它们本质上是相同的,尽管在一个字符串中商标字符的编码不同。我想知道如何对它们进行编码,使它们变得相等。
我尝试用相同的编码对它们重新编码,但结果还是一样。
byte[] bytes = Encoding.Default.GetBytes(myString);
myString = Encoding.UTF8.GetString(bytes);
编辑
删除非 ASCII 字符
s1 = Regex.Replace(s1, @"[^\u0000-\u007F]", string.Empty);
s2 = Regex.Replace(s2, @"[^\u0000-\u007F]", string.Empty);
首先,this可能是post值得一看的。正如 Jon Skeet 所说,字符串没有编码,编码仅在进出字节数组时起作用。如果这两个字符串实际上代表可用数据,您可能需要考虑在存储字典的地方进行查找以将 â\u0084¢
映射到 ™
,因为仅编码和解码不会给您您想要的正在寻找。
我正在尝试比较这两个字符串 Cpt. Awesome â\u0084¢
和 Cpt. Awesome ™
它们本质上是相同的,尽管在一个字符串中商标字符的编码不同。我想知道如何对它们进行编码,使它们变得相等。
我尝试用相同的编码对它们重新编码,但结果还是一样。
byte[] bytes = Encoding.Default.GetBytes(myString);
myString = Encoding.UTF8.GetString(bytes);
编辑
删除非 ASCII 字符
s1 = Regex.Replace(s1, @"[^\u0000-\u007F]", string.Empty);
s2 = Regex.Replace(s2, @"[^\u0000-\u007F]", string.Empty);
首先,this可能是post值得一看的。正如 Jon Skeet 所说,字符串没有编码,编码仅在进出字节数组时起作用。如果这两个字符串实际上代表可用数据,您可能需要考虑在存储字典的地方进行查找以将 â\u0084¢
映射到 ™
,因为仅编码和解码不会给您您想要的正在寻找。