MySQL的字符集支持(Character Set Support)有兩個(gè)方面:
?
字符集(Character set)和排序方式(Collation)。
對(duì)于字符集的支持細(xì)化到四個(gè)層次:
服務(wù)器(server),數(shù)據(jù)庫(kù)(database),數(shù)據(jù)表(table)和連接(connection)。
?
1.MySQL默認(rèn)字符集
MySQL對(duì)于字符集的指定可以細(xì)化到一個(gè)數(shù)據(jù)庫(kù),一張表,一列,應(yīng)該用什么字符集。
?
但是,傳統(tǒng)的程序在創(chuàng)建數(shù)據(jù)庫(kù)和數(shù)據(jù)表時(shí)并沒(méi)有使用那么復(fù)雜的配置,它們用的是默認(rèn)的配置,那么,默認(rèn)的配置從何而來(lái)呢?
??? (1)編譯MySQL 時(shí),指定了一個(gè)默認(rèn)的字符集,這個(gè)字符集是 latin1;
??? (2)安裝MySQL 時(shí),可以在配置文件 (my.ini) 中指定一個(gè)默認(rèn)的的字符集,如果沒(méi)指定,這個(gè)值繼承自編譯時(shí)指定的;
??? (3)啟動(dòng)mysqld 時(shí),可以在命令行參數(shù)中指定一個(gè)默認(rèn)的的字符集,如果沒(méi)指定,這個(gè)值繼承自配置文件中的配置,此時(shí) character_set_server 被設(shè)定為這個(gè)默認(rèn)的字符集;
??? (4)當(dāng)創(chuàng)建一個(gè)新的數(shù)據(jù)庫(kù)時(shí),除非明確指定,這個(gè)數(shù)據(jù)庫(kù)的字符集被缺省設(shè)定為character_set_server;
??? (5)當(dāng)選定了一個(gè)數(shù)據(jù)庫(kù)時(shí),character_set_database 被設(shè)定為這個(gè)數(shù)據(jù)庫(kù)默認(rèn)的字符集;
??? (6)在這個(gè)數(shù)據(jù)庫(kù)里創(chuàng)建一張表時(shí),表默認(rèn)的字符集被設(shè)定為 character_set_database,也就是這個(gè)數(shù)據(jù)庫(kù)默認(rèn)的字符集;
??? (7)當(dāng)在表內(nèi)設(shè)置一欄時(shí),除非明確指定,否則此欄缺省的字符集就是表默認(rèn)的字符集;
簡(jiǎn)單的總結(jié)一下,如果什么地方都不修改,那么所有的數(shù)據(jù)庫(kù)的所有表的所有欄位的都用 latin1 存儲(chǔ),不過(guò)我們?nèi)绻惭b MySQL,一般都會(huì)選擇多語(yǔ)言支持,也就是說(shuō),安裝程序會(huì)自動(dòng)在配置文件中把 default_character_set 設(shè)置為 UTF-8,這保證了缺省情況下,所有的數(shù)據(jù)庫(kù)的所有表的所有欄位的都用 UTF-8 存儲(chǔ)。
2.查看默認(rèn)字符集(默認(rèn)情況下,mysql的字符集是latin1(ISO_8859_1)
?
通常,查看系統(tǒng)的字符集和排序方式的設(shè)定可以通過(guò)下面的兩條命令:
???? mysql> SHOW VARIABLES LIKE '%set%'
+--------------------------+---------------------------------+
| Variable_name??????????? | Value?????????????????????????? |
+--------------------------+---------------------------------+
| character_set_client???? | latin1????????????????????????? |
| character_set_connection | latin1????????????????????????? |
| character_set_database?? | latin1????????????????????????? |
| character_set_filesystem | binary????????? ????????? |
| character_set_results??? | latin1????????????????????????? |
| character_set_server ??? | latin1????????????????????????? |
| character_set_system ?? | utf8??????????????????????????? |
| character_sets_dir?????? | D:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+
mysql> SHOW VARIABLES LIKE '%collation%';
+----------------------+-----------------+
| Variable_name??????? | Value?????????? |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database?? | utf8_general_ci |
| collation_server???? | utf8_general_ci |
+----------------------+-----------------+
3.修改默認(rèn)字符集
?
(1) 最簡(jiǎn)單的修改方法,就是修改mysql的my.ini文件中的字符集鍵值,
如 ?? default-character-set = utf8
????? character_set_server = utf8
?? 修改完后,重啟mysql的服務(wù),service mysql restart
?? 使用 mysql> SHOW VARIABLES LIKE 'character%';查看,發(fā)現(xiàn)數(shù)據(jù)庫(kù)編碼均已改成utf8
+--------------------------+---------------------------------+
| Variable_name??????????? | Value?????????????????????????? |
+--------------------------+---------------------------------+
| character_set_client???? | utf8??????????????????????????? |
| character_set_connection | utf8??????????????????????????? |
| character_set_database?? | utf8??????????????????????????? |
| character_set_filesystem | binary????????????????????????? |
| character_set_results??? | utf8??????????????????????????? |
| character_set_server???? | utf8??????????????????????????? |
| character_set_system???? | utf8??????????????????????????? |
| character_sets_dir?????? | D:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+
?? (2) 還有一種修改字符集的方法,就是使用mysql的命令
?
?? mysql> SET character_set_client = utf8 ;
???? mysql> SET character_set_connection = utf8 ;
???? mysql> SET character_set_database = utf8 ;
???? mysql> SET character_set_results = utf8 ;
???? mysql> SET character_set_server = utf8 ;
???? mysql> SET collation_connection = utf8 ;
???? mysql> SET collation_database = utf8 ;
???? mysql> SET collation_server = utf8 ;
一般就算設(shè)置了表的默認(rèn)字符集為utf8并且通過(guò)UTF-8編碼發(fā)送查詢,你會(huì)發(fā)現(xiàn)存入數(shù)據(jù)庫(kù)的仍然是亂碼。問(wèn)題就出在這個(gè)connection連接層上。解決方法是在發(fā)送查詢前執(zhí)行一下下面這句:
SET NAMES 'utf8';
它相當(dāng)于下面的三句指令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
總結(jié):
因此,使用什么數(shù)據(jù)庫(kù)版本,不管是3.x,還是4.0.x還是4.1.x,其實(shí)對(duì)我們來(lái)說(shuō)不重要,重要的有二:
1) 正確的設(shè)定數(shù)據(jù)庫(kù)編碼.MySQL4.0以下版本的字符集總是默認(rèn)ISO8859-1,MySQL4.1在安裝的時(shí)候會(huì)讓你選擇。如果你準(zhǔn)備使用UTF- 8,那么在創(chuàng)建數(shù)據(jù)庫(kù)的時(shí)候就要指定好UTF-8(創(chuàng)建好以后也可以改,4.1以上版本還可以單獨(dú)指定表的字符集)
2) 正確的設(shè)定數(shù)據(jù)庫(kù)connection編碼.設(shè)置好數(shù)據(jù)庫(kù)的編碼后,在連接數(shù)據(jù)庫(kù)時(shí)候,應(yīng)該指定connection的編碼,比如使用jdbc連接時(shí),指定連接為utf8方式.