欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

<dfn id="rfwes"></dfn>

<object id="rfwes"></object>

<menu id="ju8p9"><acronym id="ju8p9"><th id="ju8p9"></th></acronym></menu>

<object id="ju8p9"></object>

當(dāng)前位置：站長(zhǎng)資訊網(wǎng) > 編程知識(shí) > 正文

詳解MYSQL中COLLATE的作用及各種COLLATE區(qū)別

2021-10-27 分類：編程知識(shí) 閱讀(3009) 評(píng)論(0)

MYSQL中的COLLATE是什么？

在mysql中執(zhí)行show create table <tablename>指令，可以看到一張表的建表語(yǔ)句，example如下：

CREATE TABLE `table1` (     `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,     `field1` text COLLATE utf8_unicode_ci NOT NULL COMMENT '字段1',     `field2` varchar(128) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT '字段2',     PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8_unicode_ci;

大部分字段我們都能看懂，但是今天要討論的是COLLATE關(guān)鍵字。這個(gè)值后面對(duì)應(yīng)的utf8_unicode_ci是什么意思呢？面試的時(shí)候用這個(gè)題目考一考DBA，應(yīng)該可以難倒一大部分人。

COLLATE是用來做什么的？

使用phpmyadmin的開發(fā)可能會(huì)非常眼熟，因?yàn)槠渲械闹形谋眍^已經(jīng)給出了答案：

詳解MYSQL中COLLATE的作用及各種COLLATE區(qū)別

phpmyadmin截圖

所謂utf8_unicode_ci，其實(shí)是用來排序的規(guī)則。對(duì)于mysql中那些字符類型的列，如VARCHAR，CHAR，TEXT類型的列，都需要有一個(gè)COLLATE類型來告知mysql如何對(duì)該列進(jìn)行排序和比較。簡(jiǎn)而言之，COLLATE會(huì)影響到ORDER BY語(yǔ)句的順序，會(huì)影響到WHERE條件中大于小于號(hào)篩選出來的結(jié)果，會(huì)影響**DISTINCT**、**GROUP BY**、**HAVING**語(yǔ)句的查詢結(jié)果。另外，mysql建索引的時(shí)候，如果索引列是字符類型，也會(huì)影響索引創(chuàng)建，只不過這種影響我們感知不到。總之，凡是涉及到字符類型比較或排序的地方，都會(huì)和COLLATE有關(guān)。

各種COLLATE的區(qū)別

COLLATE通常是和數(shù)據(jù)編碼（CHARSET）相關(guān)的，一般來說每種CHARSET都有多種它所支持的COLLATE，并且每種CHARSET都指定一種COLLATE為默認(rèn)值。例如Latin1編碼的默認(rèn)COLLATE為latin1_swedish_ci，GBK編碼的默認(rèn)COLLATE為gbk_chinese_ci，utf8mb4編碼的默認(rèn)值為utf8mb4_general_ci。

這里順便講個(gè)題外話，mysql中有utf8和utf8mb4兩種編碼，在mysql中請(qǐng)大家忘記**utf8**，永遠(yuǎn)使用**utf8mb4**。這是mysql的一個(gè)遺留問題，mysql中的utf8最多只能支持3bytes長(zhǎng)度的字符編碼，對(duì)于一些需要占據(jù)4bytes的文字，mysql的utf8就不支持了，要使用utf8mb4才行。

很多COLLATE都帶有_ci字樣，這是Case Insensitive的縮寫，即大小寫無關(guān)，也就是說"A"和"a"在排序和比較的時(shí)候是一視同仁的。selection * from table1 where field1="a"同樣可以把field1為"A"的值選出來。與此同時(shí)，對(duì)于那些_cs后綴的COLLATE，則是Case Sensitive，即大小寫敏感的。

在mysql中使用show collation指令可以查看到mysql所支持的所有COLLATE。以u(píng)tf8mb4為例，該編碼所支持的所有COLLATE如下圖所示。

詳解MYSQL中COLLATE的作用及各種COLLATE區(qū)別

mysql中和utf8mb4相關(guān)的所有COLLATE

圖中我們能看到很多國(guó)家的語(yǔ)言自己的排序規(guī)則。在國(guó)內(nèi)比較常用的是utf8mb4_general_ci（默認(rèn)）、utf8mb4_unicode_ci、utf8mb4_bin這三個(gè)。我們來探究一下這三個(gè)的區(qū)別：

首先utf8mb4_bin的比較方法其實(shí)就是直接將所有字符看作二進(jìn)制串，然后從最高位往最低位比對(duì)。所以很顯然它是區(qū)分大小寫的。

而utf8mb4_unicode_ci和utf8mb4_general_ci對(duì)于中文和英文來說，其實(shí)是沒有任何區(qū)別的。對(duì)于我們開發(fā)的國(guó)內(nèi)使用的系統(tǒng)來說，隨便選哪個(gè)都行。只是對(duì)于某些西方國(guó)家的字母來說，utf8mb4_unicode_ci會(huì)比utf8mb4_general_ci更符合他們的語(yǔ)言習(xí)慣一些，general是mysql一個(gè)比較老的標(biāo)準(zhǔn)了。例如，德語(yǔ)字母“?”，在utf8mb4_unicode_ci中是等價(jià)于"ss"兩個(gè)字母的（這是符合德國(guó)人習(xí)慣的做法），而在utf8mb4_general_ci中，它卻和字母“s”等價(jià)。不過，這兩種編碼的那些微小的區(qū)別，對(duì)于正常的開發(fā)來說，很難感知到。本身我們也很少直接用文字字段去排序，退一步說，即使這個(gè)字母排錯(cuò)了一兩個(gè)，真的能給系統(tǒng)帶來災(zāi)難性后果么？從網(wǎng)上找的各種帖子討論來說，

贊(1)

標(biāo)簽：php set UTF8 關(guān)鍵字

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號(hào)-2

滬公網(wǎng)安備31011702889846號(hào)