编码和解码多语言字符串 c#
Encode and Decode multilingual string c#
我想编码然后解码一个包含多语言字符的字符串,其中的语言、长度和字符定位(例如,索引 8-10 上的汉字)是未知的。
甚至可以使用 "universal" 编码器吗?或者一些知道如何解码的算法?
在网上搜索得到的解决方案只涉及知道特殊字符在哪里,是什么语言,我什至不知道语言本身。
有什么想法吗?
编辑:
示例:由多种语言组成的字符串,例如:
"Hello {CHINESE} my {LATIN} is rusted"
其中包括英文、中文和拉丁文。
但是当我这样做的时候
var test = ASCIIEncoding.ASCII.GetBytes(someStr);
然后是
ASCIIEncoding.ASCII.GetString(test)
将"special characters"(IE,非英文字符)转换为问号
不要使用 ASCII 编码,因为它不能处理同一字符串中的多个语言字符。
改为使用 Unicode:
var test = UnicodeEncoding.Unicode.GetBytes(someStr);
var test1 = UnicodeEncoding.Unicode.GetString(test);
我想编码然后解码一个包含多语言字符的字符串,其中的语言、长度和字符定位(例如,索引 8-10 上的汉字)是未知的。
甚至可以使用 "universal" 编码器吗?或者一些知道如何解码的算法?
在网上搜索得到的解决方案只涉及知道特殊字符在哪里,是什么语言,我什至不知道语言本身。
有什么想法吗?
编辑: 示例:由多种语言组成的字符串,例如:
"Hello {CHINESE} my {LATIN} is rusted"
其中包括英文、中文和拉丁文。
但是当我这样做的时候
var test = ASCIIEncoding.ASCII.GetBytes(someStr);
然后是
ASCIIEncoding.ASCII.GetString(test)
将"special characters"(IE,非英文字符)转换为问号
不要使用 ASCII 编码,因为它不能处理同一字符串中的多个语言字符。
改为使用 Unicode:
var test = UnicodeEncoding.Unicode.GetBytes(someStr);
var test1 = UnicodeEncoding.Unicode.GetString(test);