范式定義
范式:Normal format,是一種離散數學中的知識,是為了解決數據的存儲與優化的問題:保存數據的存儲之后,凡是能夠通過關系尋找出來的數據,堅決不再重復存儲,終極目標是為了減少數據的冗余。
范式背景:
1、是為了解決數據冗余
2、是為了數據的優化與存儲
3、保存數據之后,可以通過關系得到的數據,不再存儲
范式概念:
1、是一種分層結構的規范,分為6層
2、每一層都比上一層更嚴格
3、若要滿足下一層范式,前提是滿足上一層
4、范式在數據庫中具有指導意義,但是不強制規范
5、數據庫不僅要考慮空間問題,還要考慮效率問題,一般用前第三層
6、六層范式, 1NF是最底層,要求最低;6NF最高層,最嚴格.
目前關系數據庫有六種范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又稱完美范式)。一般說來,數據庫只需滿足第三范式(3NF)就行了。
第一范式:確保每一列不可再分
要求
1、在設計表存儲數據時候,如果表中設計的字段存儲的數據,在取出來使用之前還需要額外的處理(拆分),那么表的設計不滿足第一范式
2、第一范式要求字段具有原子性、不可再分割
例如:
講師代課表
上表設計不存在問題: 但是如果需求是將數據查出來之后,要求顯示一個老師從什么時候開始上課,到什么時候結課:, 則需要將代課時間進行拆分: 不符合1NF, 數據不具有原子性, 可以再拆分.
解決方案
解決方案: 將代課時間拆分成兩個字段就解決問題.
第二范式:確保表中每一列都和主鍵有關
要求
1、在數據表設計過程中,如果有復合主鍵(多字段主鍵),且表中有字段并不是由整個主鍵來確定,而是依賴于主鍵中的某個字段(主鍵的部分)
2、存在字段依賴主鍵的部分的問題,稱之為部分依賴
3、第二范式就是解決表設計不允許出現部分依賴
講師帶課表
復合主鍵: 講師+班級
以上表中: 代課時間,開始和結束字段都與當前的主鍵(講師和班級)有關系, 但是性別并不依賴班級, 教室不依賴講師, 性別只依賴講師, 教室只依賴班級, 出現了性別和教室依賴主鍵中的一部分: 部分依賴.不符合第二范式.
解決方案
解決方案1: 可以將性別與講師單獨成表, 班級與教室也單獨成表.
解決方案2: 取消復合主鍵, 使用邏輯主鍵
邏輯主鍵:沒有業務含義,比如自增主鍵
業務主鍵:有業務含義,比如person表用身份證號當主鍵
第三范式:確保每一列都和主鍵列直接相關,而不是間接相關
要求
1、要滿足第三范式、必須滿足第二范式
2、理論上講,應該一張表中的所有字段都應該直接依賴于主鍵,如果表設計中存在一個字段,并不直接依賴主鍵,而是通過某個非關鍵字段依賴,最終實現依賴主鍵,把這種不是直接依賴主鍵,而是依賴非主鍵字段的依賴關系稱之為傳遞依賴
3、第三范式就是解決傳遞依賴的問題
講師帶課表
主鍵: ID
以上設計方案中: 性別依賴講師存在, 講師依賴主鍵; 教室依賴班級,班級依賴主鍵: 性別和教室都存在傳遞依賴.
解決方案
將存在傳遞依賴的字段,以及依賴的字段本身單獨取出,形成一個單獨的表, 然后在需要對應的信息的時候, 使用對應的實體表的主鍵加進來.
講師帶課表
講師表
教室表
反范式
有時候,在設計表的時候,如果一張表中有幾個字段需要從另外的表中去獲取信息,理論上講,的確可以獲得想要的數據,但是效率低一點,會刻意的在某些表中,不去保存另外表的主鍵,而是直接保存想要的數據信息,這樣一來,在查詢數據的時候,一張表可以直接提供數據,而不需要多表查詢((效率低),但是冗余會增加