当我编写相同的 UTF-8 时，为什么两个系统上的 Log4J2 输出不同？

Question

我正在将 Unicode 字符写入 Log4J2 日志。在一台机器上 (Windows 8) 我在日志中看到了这个：

2016-08-30 16:44:00.958|English:  The quick brown fox jumped over the lazy dog.
2016-08-30 16:44:00.960|German:  Falsches Üben von Xylophonmusik quält jeden größeren Zwerg.
2016-08-30 16:44:00.960|Russian 1:  В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!
2016-08-30 16:44:00.960|Russian 2:  Съешь же ещё этих мягких французских булок да выпей чаю.
2016-08-30 16:44:00.960|Chinese:  中国智造，慧及全球
2016-08-30 16:44:00.960|Japanese:  いろはにほへと ちりぬるを わかよたれそ つねならむ うゐのおくやま けふこえて あさきゆめみし ゑひもせす
2016-08-30 16:44:00.960|Korean:  다람쥐 헌 쳇바퀴에 타고파

在另一台机器上（Windows Server 2012R2）我看到了这个：

2016-08-30 16:50:41.676|English:  The quick brown fox jumped over the lazy dog.
2016-08-30 16:50:41.676|German:  Falsches Üben von Xylophonmusik quält jeden größeren Zwerg.
2016-08-30 16:50:41.676|Russian 1:  ? ????? ??? ??? ?? ??????? ??, ?? ????????? ?????????!
2016-08-30 16:50:41.676|Russian 2:  ????? ?? ??? ???? ?????? ??????????? ????? ?? ????? ???.
2016-08-30 16:50:41.676|Chinese:  ?????????
2016-08-30 16:50:41.676|Japanese:  ??????? ????? ?????? ????? ??????? ????? ??????? ?????
2016-08-30 16:50:41.676|Korean:  ??? ? ???? ???

如果Log4J2默认写UTF-8，为什么2号系统的日志文件只有问号？也就是说，第二个系统可能（可能是）缺少字体，但是第二个系统上的日志文件本身包含实际的问号，使用 hexdump 工具，我希望至少能看到文件中 UTF-8 字符的二进制文件。换句话说，我能理解为什么未知字符可能渲染不正确，我只是不明白为什么没有将正确的 Unicode 写入文件，如果进行写入的过程是JVM，对字符使用 Unicode。

Answer 1

您是否尝试在 Log4j 配置文件中为您的 Log4j 布局强制使用 UTF-8 字符集？例如，使用 PatternLayout:

<Configuration ...>
    ...
    <PatternLayout pattern="..." charset="UTF-8"/>
    ...
</Configuration>

有关 Log4j 编码问题的详细信息，请参阅 https://logging.apache.org/log4j/2.x/manual/layouts.html。

Answer 2

Log4j 2 中模式布局的默认字符集是系统默认字符集，而不是 UTF8。其他布局可能有不同的默认字符集，这在每个布局的 manual page 中都有记录。

如其他答案所示，您可以在布局配置中指定字符集。

当我编写相同的 UTF-8 时，为什么两个系统上的 Log4J2 输出不同？

Why does Log4J2 output differ on two systems when I am writing the same UTF-8?

java

logging

utf-8

log4j2

windows-server-2012-r2