字符编码

Character Encoding

我刚看了一个页面,上面列出了所有 facebook 表情符号 (http://www.symbols-n-emoticons.com/p/facebook-emoticons-list.html)。

现在表情的下方是需要输入的字符才能显示相应的表情。现在有像这样的文本字符:⛽ 或这样的:

我想知道的是:这些字符是在哪个字符集中定义的?我以前从未见过这样的角色。

谢谢,

恩恩

所有这些字符都在 Unicode 字符集中(实际页面以 UTF-8 编码,这只是将 Unicode 序列化为字节序列的一种方式)。

至于它们最初来自哪里——那要看情况。早期版本的 Unicode 有一小部分标志符号和表情符号,主要来自 IBM 437 代码页和 Adob​​e Zapf Dingbats 字符集。 2010 年 10 月,发布了 Unicode 6.0,其中包括来自各种来源的大量表情符号。 2014年6月,Unicode 7.0加入了大量来自日本各种专有字符集的符号(包括一些表情符号)。

Original Unicode dingbats.

Original Unicode Miscellaneous symbols.

Unicode 6.0 emoticons.

Unicode 7.0 Miscellaneous symbols.

Unicode 7.0 Ornamental Dingbats.

Unicode. You may not have seen them before because emoticons are not officially added to the Unicode Set (yet -- January 2015), and are still in Draft status: http://www.unicode.org/reports/tr51/index.html

您还需要 (1) 支持这些字符的字体,以及 (2) 知道在哪里找到它们的浏览器或其他查看机制。

从技术上讲,它们不是 'emoticons',而是 'emoji':Q: Are emoji the same thing as emoticons?