索引是什么?
數(shù)據(jù)庫(kù)中查找操作非常普遍,索引就是提升查找速度的一種手段。
索引分類
-
B+樹索引
它就是傳統(tǒng)意義上的索引,它是最常用、最有效的索引。 -
哈希索引
哈希索引是一種自適應(yīng)的索引,數(shù)據(jù)庫(kù)會(huì)根據(jù)表的使用情況自動(dòng)生成哈希索引,我們?nèi)藶槭菦]辦法干預(yù)的。 -
全文索引
用于實(shí)現(xiàn)關(guān)鍵詞搜索。但它只能根據(jù)空格分詞,因此不支持中文。
若要實(shí)現(xiàn)搜索功能,可選擇lucene。 -
RTree索引
在mysql很少使用,僅支持geometry數(shù)據(jù)類型;相對(duì)于BTREE,RTREE的優(yōu)勢(shì)在于范圍查找。
B+樹索引
數(shù)據(jù)庫(kù)以頁為存儲(chǔ)單元,一個(gè)頁是8K(8192Byte),一頁可以存放N條記錄。
頁在B+樹中分為:數(shù)據(jù)頁和索引頁。
B+樹的高一般為2-4層,因此查找某一鍵值的行記錄只需2-4次IO,效率較高。
聚集索引 和 非聚集索引
不管是聚集索引還是非聚集索引,它們的邏輯結(jié)構(gòu)都一棵是B+樹,它們的唯一區(qū)別在于:
-
聚集索引的數(shù)據(jù)頁存放的是完整的記錄;也就是說,聚集索引決定了表的物理存儲(chǔ)順序;
-
非聚集索引的數(shù)據(jù)頁只存指向記錄的地址信息,它真正的數(shù)據(jù)已經(jīng)在聚集索引中存儲(chǔ)了。
聯(lián)合索引 和 覆蓋索引
-
聯(lián)合索引
當(dāng)查詢條件涉及多列時(shí),可以使用聯(lián)合索引。 -
覆蓋索引
只需通過輔助索引就能獲取要查詢的信息,而無需再次通過聚集索引查詢具體的記錄信息。
由于覆蓋索引并不包含整行的記錄,因此它的大小遠(yuǎn)遠(yuǎn)小于聚集索引。
它比較適合做一些統(tǒng)計(jì)操作。
MyISAM索引實(shí)現(xiàn)
-
主鍵索引
在主鍵索引中,索引頁中存放的是主鍵和指向數(shù)據(jù)頁的偏移量;數(shù)據(jù)頁中存放的是主鍵和該主鍵所屬行記錄的地址空間。 -
輔助索引
在MyISAM中,主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別,只是主索引要求key是唯一的,而輔助索引的key可以重復(fù)。
綜上所述,在MyISAM中,索引文件和數(shù)據(jù)文件分開存放,不管是主鍵索引還是輔助索引,都屬于非聚集索引。
InnoDB索引實(shí)現(xiàn)
-
主鍵索引
索引頁仍然存放主鍵和和指向數(shù)據(jù)頁的偏移量,但數(shù)據(jù)頁存放的是完整的記錄。
也就是在InnoDB中,數(shù)據(jù)和主鍵索引是存放在一起的。 -
輔助索引
索引節(jié)點(diǎn)存放的內(nèi)容一樣,仍然是鍵值信息和指向數(shù)據(jù)頁的偏移量;但數(shù)據(jù)頁中存放的是鍵值信息和該鍵值對(duì)應(yīng)的主鍵。然后通過主鍵查詢主鍵索引就能找到該條記錄。
綜上所述:
-
聚集索引這種實(shí)現(xiàn)方式使得按主鍵的搜索十分高效,但是輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄。
-
InnoDB的輔助索引也會(huì)包含主鍵列,所以,如果主鍵定義的比較大,其他索引也將很大。如果想在表上定義 、很多索引,則爭(zhēng)取盡量把主鍵定義得小一些。InnoDB 不會(huì)壓縮索引。
索引的優(yōu)點(diǎn)
-
第一,通過創(chuàng)建唯一性索引,可以保證數(shù)據(jù)庫(kù)表中每一行數(shù)據(jù)的唯一性。
-
第二,可以大大加快數(shù)據(jù)的檢索速度,這也是創(chuàng)建索引的最主要的原因。
-
第三,可以加速表和表之間的連接,特別是在實(shí)現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義。
-
第四,在使用分組和排序子句進(jìn)行數(shù)據(jù)檢索時(shí),同樣可以顯著減少查詢中分組和排序的時(shí)間。
-
第五,通過使用索引,可以在查詢的過程中,使用優(yōu)化隱藏器,提高系統(tǒng)的性能。
索引的缺點(diǎn)
-
第一,創(chuàng)建索引和維護(hù)索引要耗費(fèi)時(shí)間,這種時(shí)間隨著數(shù)據(jù)量的增加而增加。
-
第二,索引需要占物理空間,除了數(shù)據(jù)表占數(shù)據(jù)空間之外,每一個(gè)索引還要占一定的物理空間,如果要建立聚簇索引,那么需要的空間就會(huì)更大。
-
第三,當(dāng)對(duì)表中的數(shù)據(jù)進(jìn)行增加、刪除和修改的時(shí)候,索引也要?jiǎng)討B(tài)的維護(hù),這樣就降低了數(shù)據(jù)的維護(hù)速度。
哪些情況需要加索引?
-
在經(jīng)常需要搜索的列上,可以加快搜索的速度;
-
在作為主鍵的列上,強(qiáng)制該列的唯一性和組織表中數(shù)據(jù)的排列結(jié)構(gòu);
-
在經(jīng)常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;
-
在經(jīng)常需要根據(jù)范圍進(jìn)行搜索的列上創(chuàng)建索引,因?yàn)樗饕呀?jīng)排序,其指定的范圍是連續(xù)的;
-
在經(jīng)常需要排序的列上創(chuàng)建索引,因?yàn)樗饕呀?jīng)排序,這樣查詢可以利用索引的排序,加快排序查詢時(shí)間;
-
在經(jīng)常使用在WHERE子句中的列上面創(chuàng)建索引,加快條件的判斷速度。
哪些情況不需要加索引?
-
第一,對(duì)于那些在查詢中很少使用或者參考的列不應(yīng)該創(chuàng)建索引。這是因?yàn)椋热贿@些列很少使用到,因此有索引或者無索引,并不能提高查詢速度。相反,由于增加了索引,反而降低了系統(tǒng)的維護(hù)速度和增大了空間需求。
-
第二,對(duì)于那些只有很少數(shù)據(jù)值的列也不應(yīng)該增加索引。這是因?yàn)椋捎谶@些列的取值很少,例如人事表的性別列,在查詢的結(jié)果中,結(jié)果集的數(shù)據(jù)行占了表中數(shù)據(jù)行的很大比例,即需要在表中搜索的數(shù)據(jù)行的比例很大。增加索引,并不能明顯加快檢索速度。
-
第三,對(duì)于那些定義為text, image和bit數(shù)據(jù)類型的列不應(yīng)該增加索引。這是因?yàn)椋@些列的數(shù)據(jù)量要么相當(dāng)大,要么取值很少。
第四,當(dāng)修改性能遠(yuǎn)遠(yuǎn)大于檢索性能時(shí),不應(yīng)該創(chuàng)建索引。這是因?yàn)椋薷男阅芎蜋z索性能是互相矛盾的。當(dāng)增加索引時(shí),會(huì)提高檢索性能,但是會(huì)降低修改性能。當(dāng)減少索引時(shí),會(huì)提高修改性能,降低檢索性能。因此,當(dāng)修改性能遠(yuǎn)遠(yuǎn)大于檢索性能時(shí),不應(yīng)該創(chuàng)建索引。