System.Text.Json 序列化 Unicode 字符(如表情符号)的问题

Issues with System.Text.Json serializing Unicode characters (like emojis)

我正在将应用程序从 .NET Core 2.2 升级到 .NET Core 3.0,新的 System.Text.Json 序列化程序的行为与 Newtonsoft 在 2.2 中的行为不同。对于不间断的 space (\u00A0) 或表情符号字符,Newtonsoft(甚至 Utf8Json)将它们序列化为实际字符,而不是 Unicode 代码。

我创建了一个简单的 .NET Fiddle 来展示这一点。

var input = new Foo { Bar = "\u00A0 Test !@#$%^&*() \uD83D\uDCAF 你好" };
var newtonsoft = Newtonsoft.Json.JsonConvert.SerializeObject(input);
var system = System.Text.Json.JsonSerializer.Serialize(input, new System.Text.Json.JsonSerializerOptions
    {
        Encoder = System.Text.Encodings.Web.JavaScriptEncoder.UnsafeRelaxedJsonEscaping, 
    });
var utf8Json = Utf8Json.JsonSerializer.ToJsonString(input);

Console.WriteLine($"Original: {input.Bar} - {input.Bar.Contains('\u00A0')}"); // Original
Console.WriteLine($"Newtonsoft: {newtonsoft} - {newtonsoft.Contains('\u00A0')}"); // Works
Console.WriteLine($"System.Text.Json: {system} - {system.Contains('\u00A0')}"); // Does not work
Console.WriteLine($"Utf8Json: {utf8Json} - {utf8Json.Contains('\u00A0')}"); // Works

https://dotnetfiddle.net/erCaZl

是否有编码器或 JsonSerializerOptions 属性 可以像 Newtonsoft 那样进行序列化?

这是设计使然。我们的目标是交付安全的默认值,这就是为什么我们逃避任何我们不知道的事实是安全的。出于实际原因,我们无法检测到所有安全字符,因为这意味着我们要运送大型表格并执行可能非常重要的查找。

如果实在坚持,可以扩展JavaScriptEncoder class,自己选择编码字符。我建议不要这样做,因为如果你不小心,人们可能会潜入可能改变 JSON.

语义的有效载荷。