自己实现的使用c++解析文本中的emoji表情

您所在的位置:网站首页 识别颜文字 自己实现的使用c++解析文本中的emoji表情

自己实现的使用c++解析文本中的emoji表情

2023-08-10 19:51| 来源: 网络整理| 查看: 265

程序要求实现文本内容的emoji表情显示,通过多方资料查询,以及官网emoji表情和Unicode的对照表,自己实现了一套解析emoji的方法,目前基本满足程序的需求。

具体实现逻辑是将string转成wstring,然后遍历每个字符,判断是否是emoji表情,将文本拆分成若干块,然后界面再去处理,其中最主要的就是emoji表情的判断,通过实际发送emoji表情,总结出以下几种表情类型:

1、基本的表情,这类表情的对应utf-8编码又分为两种,例如 哈哈 这个表情的编码是\ud83d\ude04 占了两个字节长度,心 这个表情的编码为\u2764 只占了一个字节长度,这是因为emoji在Unicode中的编码范围不同,有一定的规律可循。

2、组合表情,这类表情是通过连接符\u200d连接,可能是多个基本表情组成的一个,也可能是一个表情加上颜色等样式,这样就会出现接收到很长一个字符串,最后解析出来只有一个表情符号的情况。

3、特殊的数字表情,常见的就是0-9带一个框的,这种的编码又有所不同,例如 1 是1\ufe0f\u20e3,2 是 2\ufe0f\u20e3,规律相同,都是数字后跟\ufe0f\u20e3。

4、一些旗帜表情,多数以\ud83c开始,但是\ud83c在组合表情中又用来连接表情的样式的,由于我的程序需求只需要处理100多个基本表情,没有涉及到旗子这块,所以没有处理,直接用缺省表情表示了

以上是我自己通过手机发送表情总结出来的,如果有哪些不对的地方,请大佬指正。

下边是部分具体实现的代码。

bool isEmoji(int value, int &count) { //0x200d -- 连接符 0xd83c----好像是颜色分割符 或者是旗帜? 0xfe0f ---好像是表情结束符 0xfe0f0x20e3--特殊符号的表情 if ((value >= 0xd800 && value


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3