如何使用 unicode 检索/解码 html utf-8 字符?
How can retrieve / decode html utf-8 character with unicode?
当我尝试访问任何与 unicode हिंदी 文本集成的网站时,浏览器显示包含类似...
¤ªto¤•to¥�to¤ to¥€ to¤•to¥‡ toªªto¤¾to¤¸ to¤µto¥‹ to¤¸to¤¾to¤°to¥€to¤¦to¥�to¤ – to¤¸to¥�to¤µto¤¦to¤¿to¤§to¤¾to¤�to¤� to¤¹to¥^to¤‚, to¤œto¥‹ to¤‰to¤¨to¦•to¥‡ to¤ œto
如何解码这个字符并将其转换为纯unicode?
这是 UTF-8 编码的梵文,错误地显示为 Windows-1252。如果你反转方向,例如
piconv -f utf-8 -t windows-1252 -s '¤ªà¤•à¥�षी के पास वोसारी सà¥�ख सà¥�विधाà¤�à¤� हैं, जो उनके जà'
然后你得到部分原文:
��क��?षी के पास वोसारी स��?ख स��?विधा��?��? हैं, जो उनके ज�
您的复制粘贴操作使此处的解码有损。将输入重定向到文件而不是复制粘贴,这样您就不会引入任何缺陷。
piconv 附带 Perl。
当我尝试访问任何与 unicode हिंदी 文本集成的网站时,浏览器显示包含类似... ¤ªto¤•to¥�to¤ to¥€ to¤•to¥‡ toªªto¤¾to¤¸ to¤µto¥‹ to¤¸to¤¾to¤°to¥€to¤¦to¥�to¤ – to¤¸to¥�to¤µto¤¦to¤¿to¤§to¤¾to¤�to¤� to¤¹to¥^to¤‚, to¤œto¥‹ to¤‰to¤¨to¦•to¥‡ to¤ œto
如何解码这个字符并将其转换为纯unicode?
这是 UTF-8 编码的梵文,错误地显示为 Windows-1252。如果你反转方向,例如
piconv -f utf-8 -t windows-1252 -s '¤ªà¤•à¥�षी के पास वोसारी सà¥�ख सà¥�विधाà¤�à¤� हैं, जो उनके जà'
然后你得到部分原文:
��क��?षी के पास वोसारी स��?ख स��?विधा��?��? हैं, जो उनके ज�
您的复制粘贴操作使此处的解码有损。将输入重定向到文件而不是复制粘贴,这样您就不会引入任何缺陷。
piconv 附带 Perl。