2021
11/20
5:05
你的位置:首页 > 数据库 > 数据中有emoji,导致插入不了数据库

数据中有emoji,导致插入不了数据库

发布时间:2021-11-20 05:05:38

原标题:数据中有emoji,导致插入不了数据库

前言

前两天负责的系统,因为需要获取用户的昵称并进行入库,但是有个别用户的昵称中存在emoji表情,导致入库时报错。

报错内容:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94‘ for column


问题原因

Q:为什么我们设置表的的字符类型为utf8却不能存放emoji呢?

A:因为我们UTF-8编码可能是2或3或4个字节,但mysql中的utf8是3个字节,存放一个emoji是需要4个字节的,自然不够。

Mysql数据库在5.5.3之后开始支持utf8mb4字符集,所以mysql版本是5.5.3+的都可以设置让数据库存储Emoji表情

所以如果你的应用有移动端的,最好一开始设计数据库的时候就使用utf8mb4字符集

解决方案:

方案一: 过滤字符串中的emoji

方案二: 转译emoji后入库。获取时反转译成emoji使用

//转译emojiURLEncoder.encode(含有emoji的数据, "UTF-8");//反转译成emoji<br/>URLDecoder.decode(经过转义的数据, "UTF-8");

另外再推荐一款emoji转义工具

注意点:emoji转译后可以入库。但当用户就是输入的内容本身就是【转译后的内容】

此时从库中反转译时就变成了emoji。这就造成跟用户输入不一致的情况

方案三: 修改数据库配置,实现可存储emoji

目前网上给的解决方案普遍都是:修改该字段或者该张表的编码方式为utf8mb4

但仅这么处理是并不起作用。

还需要执行SET NAMES utf8mb4; 将整个库的 character_set_client,character_set_connection,character_set_results等值修改为utf8mb4才会起作用

修改已经建立表的字符集alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;

注意点:新建数据库时可以进行初始化设置,但是已有的线上生产库进行此操作有风险,因此建议使用相关类库转义后进行存储和显示

使用下列SQL语句可以查看MySQL中character_set相关变量:
SHOW VARIABLES LIKE '%char%';


------The End------

感谢大家看到最后,文章持续更新!欢迎大家指出我的文章的不足之处,也欢迎大家关注,收藏+分享

如果这个办法对您有用,或者您希望持续关注,也可以扫描下方二维码或者在微信公众号中搜索【码路无涯】





原标题:数据中有emoji,导致插入不了数据库

关键词:SQL

转载请保留本文网址: http://www.www.d5897.com/a/1256398.html
SQL
*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#www.d5897.com (#换成@)。
Baidu