URL 带有奇怪的 UTF8 符号
URL with strange UTF8 symbol
在 nginx 上,我有一个文件 / URL 包含德语单词“frühling”。
当从 Mac + Safari 访问 URL 时出现问题。
我复制/粘贴了两个 URL - 正确的一个和来自 Mac 的一个,结果如下:
[nmmm@zenbook ~]$ cat > a
frühling
^C
[nmmm@zenbook ~]$ cat > b
frühling
^C
[nmmm@zenbook ~]$ xxd a
0000000: 66 72 75 cc 88 68 6c 69 6e 67 0a fru..hling.
[nmmm@zenbook ~]$ xxd b
0000000: 66 72 c3 bc 68 6c 69 6e 67 0a fr..hling.
"a"是正确的,"b"是错误的。似乎区别就在变音符号“ü”之后,还有额外的正常“u”。变音符号“ü”也有所不同。
这个符号是从哪里来的?
我的客户有时会使用 MsWord 或 LibreOffice 来准备这些东西。
nginx 有没有办法以某种方式处理(重建)它?
搜索 Google 我发现以下内容:
https://coderwall.com/p/gc079w/debugging-encodings-and-character-sets
似乎有两种方法可以变音:
Correct utf8 encoding is (you would see c3 bc in the hexdump):
U+00FC ü c3 bc LATIN SMALL LETTER U WITH DIA.
A valid UTF-8 character sequence that displays identically, but is not
a "ü" (again, 75 cc 88 in the hexdump):
U+0075 u 75 LATIN SMALL LETTER U
U+0308 ̈ cc 88 COMBINING DIAERESIS
更新:
使用 find 你可以找到所有带有正确或错误变音符号的文件,工作方式 "normal":
find . -name '*ü*'
但是您需要 copy/paste 更正元音变音 "way" 或创建一个 bash 文件。
我正在寻求的可能解决方案是创建符号链接,这可以通过查找的输出来完成。
(仍在寻找如何从 nginx 级别修复此问题)
在 nginx 上,我有一个文件 / URL 包含德语单词“frühling”。
当从 Mac + Safari 访问 URL 时出现问题。
我复制/粘贴了两个 URL - 正确的一个和来自 Mac 的一个,结果如下:
[nmmm@zenbook ~]$ cat > a
frühling
^C
[nmmm@zenbook ~]$ cat > b
frühling
^C
[nmmm@zenbook ~]$ xxd a
0000000: 66 72 75 cc 88 68 6c 69 6e 67 0a fru..hling.
[nmmm@zenbook ~]$ xxd b
0000000: 66 72 c3 bc 68 6c 69 6e 67 0a fr..hling.
"a"是正确的,"b"是错误的。似乎区别就在变音符号“ü”之后,还有额外的正常“u”。变音符号“ü”也有所不同。
这个符号是从哪里来的? 我的客户有时会使用 MsWord 或 LibreOffice 来准备这些东西。 nginx 有没有办法以某种方式处理(重建)它?
搜索 Google 我发现以下内容: https://coderwall.com/p/gc079w/debugging-encodings-and-character-sets
似乎有两种方法可以变音:
Correct utf8 encoding is (you would see c3 bc in the hexdump):
U+00FC ü c3 bc LATIN SMALL LETTER U WITH DIA.
A valid UTF-8 character sequence that displays identically, but is not a "ü" (again, 75 cc 88 in the hexdump):
U+0075 u 75 LATIN SMALL LETTER U U+0308 ̈ cc 88 COMBINING DIAERESIS
更新:
使用 find 你可以找到所有带有正确或错误变音符号的文件,工作方式 "normal":
find . -name '*ü*'
但是您需要 copy/paste 更正元音变音 "way" 或创建一个 bash 文件。
我正在寻求的可能解决方案是创建符号链接,这可以通过查找的输出来完成。
(仍在寻找如何从 nginx 级别修复此问题)