本篇文章主要給大家介紹mysql中列類型之字符串型的相關知識介紹,希望對需要的朋友有所幫助!
推薦參考教程:《mysql教程》
列類型(數據類型)
所謂的列類型,其實就是指數據類型,即對數據進行統一的分類,從系統的角度出發是為了能夠使用統一的方式進行管理,更好的利用有限的空間。
在 SQL 中,將數據類型分成了三大類,分別為:數值型、字符串型和日期時間型。
字符串型
在 SQL 中,將字符串類型分成了 6 類,分別為:char、varchar、text、blob、enum和set.
第 1 類:定長字符串
定長字符串:char,即磁盤(二維表)在定義結構的時候就已經確定了最終數據的存儲長度。
-
char(L):L 表示 Length,即可以存儲的長度,單位為字符,最大長度為 255;
-
char(4):表示在 UTF8 環境下,需要 4*3=12 個字節。
第 2 類:變長字符串
變長字符串:varchar,即在分配存儲空間的時候,按照最大的空間分配,但是實際用了多少,則是根據具體的數據來確定。
-
varchar(L):L 表示 Length,理論長度是 65536,但是會多出 1 到 2 個字節來確定存儲的實際長度;
-
varchar(10):例如存儲 10 個漢字,在 UTF8 環境下,需要 10*3+1=31 個字節。
實際上,如果存儲長度超過 255 個字符,則既不用定長字符串也不用變長字符串,而是用文本字符串text.
如何選擇定長字符串或者是變長字符串呢?
-
定長字符串對磁盤空間比較浪費,但是效率高:如果數據基本上確定長度都一樣,就使用定長字符串,例如身份證、電話號碼等;
-
變長字符串對磁盤空間比較節省,但是效率低:如果數據不能確定長度(不同的數據有變化),就使用變長字符串,例如地址、姓名等。
第 3 類:文本字符串
如果數據量非常大,通常說超過 255 個字符就會使用文本字符串。
文本字符串根據存儲的格式進行分類,可以分為:
-
text:存儲文字;
-
blob:存儲二進制數據(其實際上都是存儲路徑),通常不用。
第 4 類:枚舉字符串
枚舉字符串:enum,需要事先將所有可能出現的結果都設計好,實際上存儲的數據必須是規定好的數據中的一個。
枚舉字符串的使用方式:
-
定義:enum(‘元素1′,’元素2’,’元素3’…),例如enum(‘男’,’女’,’保密’);
-
使用:存儲的數據,只能是事先定義好的數據。
執行如下 SQL 語句創建枚舉表,進行測試:
--?創建枚舉表create?table?my_enum( ????gender?enum('男','女','保密') )charset?utf8;
再執行如下 SQL 語句,向表my_enum中插入測試數據:
--?插入測試數據insert?into?my_enum?values?('男'),('女'),('保密');insert?into?my_enum?values?('male');
通過上面的測試,咱們可以發現使用枚舉字符串有一個好處,那就是:規范數據格式,插入表中的數據只能是事先定義好的某個數據。
此外,枚舉字符串還有一個作用,那就是:節省存儲空間(枚舉數據通常都有一個別名),枚舉實際上存儲的是數值而不是字符串本身。
在 MySQL 中,系統是有自動轉換數據格式的功能的。在這里,咱們可以證明枚舉字段存儲的是數值,具體方法為:將數據取出來+0,如果是字符串最終結果永遠為0,否則就是其他值。
--?驗證枚舉字段實際存儲的格式select?gender?+?0,gender?from?my_enum;
觀察上述結果,咱們可以找出枚舉元素的實際規律,即按照元素出現的順序,從1開始編號。接下來,咱們再來了解枚舉的原理:
-
枚舉在進行數據規范(定義)的時候,系統會自動建立一個數字與枚舉元素的對應關系(放在日志中);在進行數據插入的時候,系統自動將字符串轉換為對應的數值進行存儲;在進行數據提取的時候,系統自動將數值轉換成對應的字符串進行顯示。
通過閱讀以上枚舉的原理,咱們可以知道:使用枚舉的效率并不高(低于其他類型的數據),但能規范數據和節省存儲空間。
第 5 類:集合字符串
集合字符串:set,跟枚舉類似,實際存儲的是數值而不是字符串。
集合字符串的使用方式:
-
定義:set,元素列表;
-
使用:可以使用元素列表中的多個元素,用逗號分隔。
執行如下 SQL 語句創建枚舉表,進行測試:
--?創建集合表create?table?my_set( ????hobby?set('音樂','電影','旅行','美食','攝影','運動','寵物') )charset?utf8;
再執行如下 SQL 語句,向表my_set中插入測試數據:
--?插入測試數據insert?into?my_set?values?('電影,美食,寵物');insert?into?my_set?values?(3);
再執行如下 SQL 語句,查看表my_set中的數據:
--?查看數據select?hobby?+?0,hobby?from?my_set;
觀察上面的結果,相信大部分童鞋也懵啦!對于3還好理解,3=2+1,對應于集合中數據的編號,也正是音樂和電影;但是74是什么鬼?。吭诖耍蹅儾环翆⒓希?#8217;音樂’,’電影’,’旅行’,’美食’,’攝影’,’運動’,’寵物’)中的元素選中的記為1,沒有選中的記為0,表示成二進制,也就是:
-
0101001
再將上面的二進制反過來:
-
1001010
不妨算算,上述二進制對應的十進制數,即為74.
到這里,相信大家已經恍然大悟啦,原來:集合字符串中每一個元素都對應一個二進制位,其中被選中的為1,未選中的為0,最后在反過來,這個二進制數對應的十進制數即為其數據庫中實際存儲的是數值。
此外,集合字符串中插入元素的順序并沒有影響,最終系統都會自動去匹配集合的順序,即:
--?插入測試數據insert?into?my_set?values?('電影,美食,旅行');insert?into?my_set?values?('旅行,電影,美食');
上述兩個 SQL 語句會產生相同的結果:
如上圖所示,顯然咱們的結論得到了驗證。
最后,集合的原理同枚舉類似,因此可以的到相同的結論,即:使用集合的效率并不高(低于其他類型的數據),但能規范數據和節省存儲空間。