获取仅包含 _all unicode emojis_ 的字符串的最简单和最可靠的方法是什么?
What's the simplest and most reliable way to get a string containing nothing but _all unicode emojis_?
使用命令行、脚本等
"Unicode symbols" 没有干净的 "plane of Unicode blocks"(参见 Wikipedia: Unicode symbols),更糟糕的是,不存在可以考虑的 Unicode 符号的明确子集 "proper emojis"(据我所知)。
例如Twitter 涵盖的表情符号并未涵盖所有 Unicode 符号,而是分散在各处(尽管特别集中在某些区域而不是其他区域,例如杂项符号、表情符号、杂项符号和象形文字、运输和地图符号以及标志符号).
但是一旦你确定了你想要的 Unicode 块范围,你就可以轻松地将它们打印出来,我将使用 "Emoticons (U+1F600–U+1F64F)" 范围作为示例,因为它们是 "the most universally considered emojis" .
var emojis = "";
var code = parseInt("1F600", 16);
while(code <= parseInt("1F64F", 16)) {
emojis += String.fromCodePoint("0x"+code.toString(16));
code += 1;
}
console.log(emojis);
使用命令行、脚本等
"Unicode symbols" 没有干净的 "plane of Unicode blocks"(参见 Wikipedia: Unicode symbols),更糟糕的是,不存在可以考虑的 Unicode 符号的明确子集 "proper emojis"(据我所知)。
例如Twitter 涵盖的表情符号并未涵盖所有 Unicode 符号,而是分散在各处(尽管特别集中在某些区域而不是其他区域,例如杂项符号、表情符号、杂项符号和象形文字、运输和地图符号以及标志符号).
但是一旦你确定了你想要的 Unicode 块范围,你就可以轻松地将它们打印出来,我将使用 "Emoticons (U+1F600–U+1F64F)" 范围作为示例,因为它们是 "the most universally considered emojis" .
var emojis = "";
var code = parseInt("1F600", 16);
while(code <= parseInt("1F64F", 16)) {
emojis += String.fromCodePoint("0x"+code.toString(16));
code += 1;
}
console.log(emojis);