本篇文章講給出關于全文本搜索的某些重要的說明。
1.在索引全文本數據時,短詞被忽略且從索引中排除。短詞定義為那些具有3個或3個以下字符的詞(如果需要,這個數目可以更改)。
2.mysql帶有一個內建的非用詞(stopword)列表,這些詞在索引全文本數據時總是被忽略。如果需要,可以覆蓋這個列表(請參閱MySQL文檔以了解如何完成此工作)。
1.許多詞出現的頻率很高,搜索它們沒有用處(返回太多的結果)。因此,MySQL規定了一條50%規則,如果一個詞出現在50%以上的行中,則將它作為一個非用詞忽略。50%規則不用于 IN BOOLEANMODE 。
2.如果表中的行數少于3行,則全文本搜索不返回結果(因為每個詞或者不出現,或者至少出現在50%的行中)。
3.忽略詞中的單引號。例如, don’t 索引為 dont 。
4.不具有詞分隔符(包括日語和漢語)的語言不能恰當地返回全文本搜索結果。
5.如前所述,僅在 MyISAM 數據庫引擎中支持全文本搜索。
沒有鄰近操作符 鄰近搜索是許多全文本搜索支持的一個特性,它能搜索相鄰的詞(在相同的句子中、相同的段落中或者在特定數目的詞的部分中,等等)。MySQL全文本搜索現在還不支持鄰近操作符,不過未來的版本有支持這種操作符的計劃。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
THE END