编码和解码多语言字符串 c#

Encode and Decode multilingual string c#

我想编码然后解码一个包含多语言字符的字符串,其中的语言、长度和字符定位(例如,索引 8-10 上的汉字)是未知的。

甚至可以使用 "universal" 编码器吗?或者一些知道如何解码的算法?

在网上搜索得到的解决方案只涉及知道特殊字符在哪里,是什么语言,我什至不知道语言本身。

有什么想法吗?

编辑: 示例:由多种语言组成的字符串,例如:

"Hello {CHINESE} my {LATIN} is rusted"

其中包括英文、中文和拉丁文。

但是当我这样做的时候

var test = ASCIIEncoding.ASCII.GetBytes(someStr);

然后是

ASCIIEncoding.ASCII.GetString(test)

将"special characters"(IE,非英文字符)转换为问号

不要使用 ASCII 编码,因为它不能处理同一字符串中的多个语言字符。

改为使用 Unicode:

var test = UnicodeEncoding.Unicode.GetBytes(someStr);
var test1 = UnicodeEncoding.Unicode.GetString(test);