问题现象:
当创建 字符集类型为 utf8mb4、字段可以为 NULL 值、只有 1 个 varchar 字段的表 t1 时,报错 Column length too big for column 'name' (max = 16383)
。
CREATE TABLE t1 (name varchar(65535) NULL) CHARSET=utf8mb4;

原因分析:
VARCHAR 字段类型最多能存储的数据长度,和 字符集类型、字段是否为 NULL 值、字段数量 有关。
情况一:
当创建 字符集类型为 utf8mb4
、字段可以为 NULL 值
、只有 1 个 varchar 字段
的表时:
VARCHAR 字段类型最多能存储的数据长度
= 一行记录最大的数据大小(字节)
/ 字符集表示一个字符时的最大大小(字节)
= (最大行记录大小(65535 字节)
- 真实数据的最大长度(2 字节)
- NULL 值(1 字节)
) / (utf8mb4 表示一个字符时的最大大小 (4 字节)
)
即
VARCHAR 字段类型最多能存储的数据长度 = (65535 - 2 - 1) / 4 = 16383 。
CREATE TABLE t1 (name varchar(16383) NULL) CHARSET=utf8mb4;

解析如下:
一行记录最大的数据大小(字节):
如果该 VARCHAR 类型的列没有 NOT NULL 属性,那最多只能存储 65532个 字节的数据,因为真实数据的长度(varchar 是可变长字段类型,所以会记录字段的数据的真实长度,存储在 变长字段长度列表)可能占用 2 个字节,NULL 值标识需要占用 1 个字节,但不计算隐藏列和记录头信息占用的字节 。

字符集表示一个字符时的最大大小(字节):
字符集类型为 utf8mb4 时,一个字符最大能占用 4 个字节
SHOW CHARSET LIKE '%utf8mb4%';

情况二:
当创建 字符集类型为 utf8mb4
、字段不可以为 NULL 值
、只有 1 个 varchar 字段
的表时:
CREATE TABLE t2 (name varchar(65535) NOT NULL) CHARSET=utf8mb4;

VARCHAR 字段类型最多能存储的数据长度
= 一行记录最大的数据大小(字节)
/ 字符集表示一个字符时的最大大小(字节)
= (最大行记录大小(65535 字节)
- 真实数据的最大长度(2 字节)
) / (utf8mb4 表示一个字符时的最大大小 (4 字节)
)
即
VARCHAR 字段类型最多能存储的数据长度 = (65535 - 2 ) / 4 = 16383.25 ,约为 16383 。
CREATE TABLE t2 (name varchar(16383) NOT NULL) CHARSET=utf8mb4;

情况三:
当创建 字符集类型为 utf8mb4
、字段不可以为 NULL 值
、只有 1 个 varchar 字段
、加上 1 个 int 字段
的表时,情况又不一样了。
CREATE TABLE t3 (name varchar(16383) NULL, age int) CHARSET=utf8mb4;

VARCHAR 字段类型最多能存储的数据长度
= 一行记录最大的数据大小(字节)
/ 字符集表示一个字符时的最大大小(字节)
= (最大行记录大小(65535 字节)
- 真实数据的最大长度(2 字节)
- NULL 值(1 字节)
- int 类型的大小( 4 字节)
) / (utf8mb4 表示一个字符时的最大大小 (4 字节)
)
即
VARCHAR 字段类型最多能存储的数据长度 = ( 65535 - 2 - 1 -4 ) / 4 = 16382 。
CREATE TABLE t3 (name varchar(16382) NULL, age int) CHARSET=utf8mb4;

参考:
网友评论