字符集是一套符合和编码,校验规则(collation)是在字符集内用于比较字符的一套规则,即字符集的排序规则。MySQL可以使用对种字符集和检验规则来组织字符。
MySQL服务器可以支持多种字符集,在同一台服务器,同一个数据库,甚至同一个表的不同字段都可以指定使用不同的字符集,相比oracle等其他数据库管理系统,在同一个数据库只能使用相同的字符集,MySQL明显存在更大的灵活性。
一、服务器级字符集
(1)、可以在my.cnf中设置
[mysqld]
default-character-set=gbk (5.1)
character-set-server=gbk (5.5)
(2)、可以在启动选项中设置
mysqld --default-character-set=gbk
(3)、可以在编译的时候设置
./configure --with-charset=gbk
或
cmake . -default-charset=gbk
如果没有指定服务器的字符集,默认使用latin1为服务器的字符集。
(4)、查看当前服务器的字符集
mysql> show variables like '%char%';
+--------------------------+-----------------------------------------+
| Variable_name | Value |
+--------------------------+-----------------------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql-5.6.28/share/charsets/ |
+--------------------------+-----------------------------------------+
二、数据库字符集
数据库的字符集在创建数据库的时候指定,也可以在创建完数据库之后通过alter database语句修改。如果数据库中已经存在数据,修改数据库字符集并不能将已有的数据按新字符集存放。所以无法通过修改数据库字符集修改数据的内容。
设置数据库字符集的规则:
(1)、如果指定了字符集和校对规则,则使用指定的规则;
(2)、如果仅指定字符集而没有指定校对规则,则使用指定的字符集和默认的校对规则;
(3)、如果没有指定字符集和校对规则,则使用服务器的字符集和校对规;
三、表字符集
表的字符集是在建表的时候指定的,可以通过alter table语句进行修改。同样,对于表中已经存在的数据,修改字符集不会影响原有的记录,仍将使用原有的字符集。
设置表的字符集的规则同设置数据库的字符集规则。
四、列字符集
列的字符集和校对规则可以在建表的时候指定,也可以在修改表的时候调整。(这个不常用,仅记录一下)
五、SET NAMES命令
除了上述的四种字符集外,对实际的应用访问来说,还存在客户端和服务端之间交互的字符集,如下:
(1)、character_set_client:客户端字符集 (2)、character_set_connection:连接字符集 (3)、character_set_resluts:结果字符集
通常情况下,这3个字符集都应该是相同的,才能保证用户写入的数据被正确的读出,特别是对于中文字符。
set names命令则用于同时修改这3个参数的值。
六、关于中文字符集插入的实验
字符集不一致是导致数据库内中文内容乱码的罪魁祸首。
实验环境:
Server version: 5.6.28 (在此说明实验环境是由于在学习过程中,从网上参考了部分资料,实验过程与资料描述稍有出入,未查出原因,只能暂归结为版本不同所致。)
实验对象:
mysql> show create table char_test\G
*************************** 1. row ***************************
Table: char_test
Create Table: CREATE TABLE `char_test` (
`id` smallint(6) NOT NULL AUTO_INCREMENT,
`name` char(20) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1
1 row in set (0.00 sec)
由上可知,char_test表的字符集是latin1,如果不设置正确的字符集,插入中文字符时,必然会出现如下错误:
mysql> insert into char_test (name) values ('小王');
ERROR 1366 (HY000): Incorrect string value: '\xE5\xB0\x8F\xE7\x8E\x8B' for column 'name' at row 1
解决方案
(1)、先set names latin1,然后再插入数据。
mysql> set names latin1;
Query OK, 0 rows affected (0.00 sec)
mysql> insert into char_test (name) values ('小王');
Query OK, 1 row affected (0.01 sec)
mysql> select * from char_test;
+----+--------+
| id | name |
+----+--------+
| 1 | Tom |
| 2 | 小明 |
| 3 | 小王 |
+----+--------+
3 rows in set (0.00 sec)
(2)、在data.sql文件中指定set names latin1,然后通过source命令导入data.sql。
# vi data.sql
set names latin1;
insert into char_test (name) values ('小李');
mysql> source data.sql
Query OK, 1 row affected (0.00 sec)
mysql> select * from char_test;
+----+--------+
| id | name |
+----+--------+
| 1 | Tom |
| 2 | 小明 |
| 3 | 小王 |
| 4 | 小李 |
+----+--------+
4 rows in set (0.00 sec)
(3)、在data.sql文件中指定set names latin1,然后通过mysql命令导入
# vi data.sql
set names latin1;
insert into char_test (name) values ('小张');
# mysql -uroot -p test1
# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
(4)、通过指定mysql命令的字符集参数实现 –default-charset-set=字符集
# vi data.sql
insert into char_test (name) values ('小张');
# 错误方法
# mysql -uroot -p test1
Enter password: ******
ERROR 1366 (HY000) at line 1: Incorrect string value: '\xE5\xB0\x8F\xE8\xB5\xB5' for column 'name' at row 1
# 正确方法
# mysql -uroot -p --default-character-set=latin1 test1
Enter password: ******
# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
Enter password: ******
+----+--------+
| id | name |
+----+--------+
| 1 | Tom |
| 2 | 小明 |
| 3 | 小王 |
| 4 | 小李 |
| 5 | 小张 |
| 6 | 小赵 |
+----+--------+
(5)、在配置文件中指定客户端的字符集
vi my.cnf
[client]
default-character-set=latin1
mysql> insert into char_test (name) values ('小马');
Query OK, 1 row affected (0.00 sec)
mysql> select * from char_test;
+----+--------+
| id | name |
+----+--------+
| 1 | Tom |
| 2 | 小明 |
| 3 | 小王 |
| 4 | 小李 |
| 5 | 小张 |
| 6 | 小赵 |
| 7 | 小马 |
+----+--------+
7 rows in set (0.00 sec)
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !