織夢(mèng)cms如何通過(guò)正則批量查找替換數(shù)據(jù)庫(kù)的自定義內(nèi)容?
正則的表達(dá)式在MY SQL中也有應(yīng)用,但是在具體將查找的東西直接進(jìn)行Replace的時(shí)候目前還不能解決,幸好后臺(tái)中有個(gè)dede利用正則,利用dede正則批量替換數(shù)據(jù)庫(kù)中內(nèi)容,這樣我們完全減小了自己的工作量了
推薦學(xué)習(xí):織夢(mèng)cms
??
例如網(wǎng)站的一個(gè)例子
是替換一個(gè)div中的內(nèi)容,摘抄實(shí)踐下,關(guān)鍵還是自己去體會(huì),多用下正則,還是不錯(cuò)的、正則相關(guān)的文章我在我的博客中也多次提到了他的多種運(yùn)用途徑。如果你都掌握好它的話,你的工作效率就會(huì)成倍的提高了。
下面這個(gè)正則的用途是查找數(shù)據(jù)庫(kù)的中自定義的DIV層中運(yùn)用,一般這種用法你在采集,或者,用word直接添加內(nèi)容后會(huì)用到。
看看這個(gè)是如何去除的。
例子一,去除簡(jiǎn)單自定義內(nèi)容內(nèi)容
選擇數(shù)據(jù)表與字段:dede_addonarticle
替換方式:選擇正則表達(dá)式
主鍵字段:aid
被替換內(nèi)容:MM[d]*GG
選擇字段:body(這表是存儲(chǔ)文章內(nèi)容的),選擇單選框:正則表達(dá)式,主鍵字段填寫(xiě)”aid”,被替換內(nèi)容為上面的正則:
例:MM[d]*GG
替換為:可為空,也可填寫(xiě)你想置換為的內(nèi)容。
替換條件:如果是全部,就不填寫(xiě)。開(kāi)始測(cè)試時(shí),先備份了數(shù)據(jù)庫(kù),然后僅替換一篇文章,條件中填寫(xiě):aid=888,如果是分類(lèi),就填寫(xiě):typeid=18,這樣縮小替換范圍,避免出錯(cuò)。
填寫(xiě)安全確認(rèn)碼,替換就ok了,
例子二,去除
內(nèi)容
<div> <font>文章地址址:<br>//www.jb51.net/<br></font>?</div>
上述代碼,是一個(gè)不錯(cuò)的style,大家可以顯示下,調(diào)試效果不錯(cuò)。
可以利用以下正則來(lái)替換:
在dede后臺(tái),選擇:核心–數(shù)據(jù)庫(kù)內(nèi)容替換–選擇表:?
選擇數(shù)據(jù)表與字段:dede_addonarticle
替換方式:選擇正則表達(dá)式
主鍵字段:aid
被替換內(nèi)容:
選擇字段:body(這表是存儲(chǔ)文章內(nèi)容的),選擇單選框:正則表達(dá)式,主鍵字段填寫(xiě)”aid”,被替換內(nèi)容為上面的正則:
例:
替換為:可為空,也可填寫(xiě)你想置換為的內(nèi)容。
替換條件:如果是全部,就不填寫(xiě)。?
注意:開(kāi)始測(cè)試時(shí),先備份了數(shù)據(jù)庫(kù),然后僅替換一篇文章,條件中填寫(xiě):aid=8880,如果是分類(lèi),就填寫(xiě):typeid=18,這樣縮
小替換范圍,避免出錯(cuò)。
填寫(xiě)安全確認(rèn)碼,替換就ok了,注意這個(gè)安全確認(rèn)碼會(huì)有失效周期,但它自己不提示,也有這個(gè)可能,會(huì)選擇替換無(wú)反應(yīng),遇見(jiàn)
這情況,只有刷新當(dāng)前頁(yè)面了。
很完整了吧!其它正則參考:http://bbs.dedecms.com/214856.html,這個(gè)當(dāng)中的也不完整,也不太正確,需要對(duì)比來(lái)修改調(diào)試
,很費(fèi)時(shí)間。?
正則是個(gè)好技術(shù),有著很強(qiáng)大的應(yīng)用,花了點(diǎn)時(shí)間看,你的工作效果會(huì)大陪的提高!
這是我在處理文章時(shí)用到一些正則表達(dá)式,里面有你要的。在Editplus中使用。
在表:dede_addonarticle中,body字段即是文章內(nèi)容。
過(guò)濾Table相關(guān)的:
|
|
||
?
正則: width=”[0-9][0-9][0-9]”| width=[0-9][0-9][0-9]| height=”[0-9][0-9][0-9]”| height=[0-9][0-9][0-9],
說(shuō)明:過(guò)慮height、Width。?
正則:
|
正則: style=”[^”]*”| style=[^”]*,注意:匹配Style=”border:”?
正則:
,注意:匹配
正則:]*>|||]*>|| ,注意:匹配和
正則: border=”[0-9]”| border=[0-9],注意:匹配border=””
正則:]*>|| ,注意:匹配
正則: id=[^ ]*| id=”[^ ]*”,注意:匹配id=””
正則: title=[0-9][^ ]*| title=”[0-9][^ ]*”| alt=[0-9][^ ]*| alt=”[0-9][^ ]*”| alt=[a-z][^ ]*| alt=”[a
-z][^ ]*”,注意:匹配Title或者alt
正則:]*–>,說(shuō)明:匹配HTML注釋
正則:<script>]*)>(.*)</script>,說(shuō)明:匹配<script></script>之間的全部?jī)?nèi)容
正則: class=[a-z][^ |^>]*| class=”[a-z][^ |^>]*”,說(shuō)明:清理class=””,經(jīng)過(guò)充分測(cè)試
正則:
|
|
||
正則:
]*>|
|
| align=left|||
正則表達(dá)式是一種通用的標(biāo)準(zhǔn),大部分計(jì)算機(jī)語(yǔ)言都支持正則表達(dá)式,包括as3,這里轉(zhuǎn)摘出了一些常用的正則表達(dá)式語(yǔ)句,大家用到的時(shí)候就不用自己寫(xiě)了
^[0-9]*[1-9][0-9]*$ //匹配正整數(shù)?
^-[0-9]*[1-9][0-9]*$ //匹配負(fù)整數(shù)?
^-?d+$ //匹配整數(shù)?
^d+(.d+)?$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)?
^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮點(diǎn)數(shù)?
^((-d+(.d+)?)|(0+(.0+)?))$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)?
^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配負(fù)浮點(diǎn)數(shù)?
^(-?d+)(.d+)?$ //匹配浮點(diǎn)數(shù)?
^[A-Za-z]+$ //匹配由26個(gè)英文字母組成的字符串?
^[A-Z]+$ //匹配由26個(gè)英文字母的大寫(xiě)組成的字符串?
^[a-z]+$ //匹配由26個(gè)英文字母的小寫(xiě)組成的字符串?
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個(gè)英文字母組成的字符串?
^w+$ //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串?
^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$ //匹配email地址?
^[a-zA-z]+://匹配(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$ //匹配url?
匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]?
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]?
匹配空行的正則表達(dá)式:n[s| ]*r?
匹配HTML標(biāo)記的正則表達(dá)式:/.*|/?
匹配首尾空格的正則表達(dá)式:(^s*)|(s*$)?
匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*?
匹配網(wǎng)址URL的正則表達(dá)式:^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$?
匹配帳號(hào)是否合法(字母開(kāi)頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$?
匹配國(guó)內(nèi)電話號(hào)碼:(d{3}-|d{4}-)?(d{8}|d{7})??
匹配騰訊QQ號(hào):^[1-9]*[1-9][0-9]*$?
下表是元字符及其在正則表達(dá)式上下文中的行為的一個(gè)完整列表:?
將下一個(gè)字符標(biāo)記為一個(gè)特殊字符、或一個(gè)原義字符、或一個(gè)后向引用、或一個(gè)八進(jìn)制轉(zhuǎn)義符。?
^ 匹配輸入字符串的開(kāi)始位置。如果設(shè)置了 RegExp 對(duì)象的Multiline 屬性,^ 也匹配 ‘n’ 或 ‘r’ 之后的位置。?
$ 匹配輸入字符串的結(jié)束位置。如果設(shè)置了 RegExp 對(duì)象的Multiline 屬性,$ 也匹配 ‘n’ 或 ‘r’ 之前的位置。?
* 匹配前面的子表達(dá)式零次或多次。?
+ 匹配前面的子表達(dá)式一次或多次。+ 等價(jià)于 {1,}。?
? 匹配前面的子表達(dá)式零次或一次。? 等價(jià)于 {0,1}。?
{n} n 是一個(gè)非負(fù)整數(shù),匹配確定的n 次。?
{n,} n 是一個(gè)非負(fù)整數(shù),至少匹配n 次。?
{n,m} m 和 n 均為非負(fù)整數(shù),其中n
? 當(dāng)該字符緊跟在任何一個(gè)其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時(shí),匹配模式是非貪婪的。非貪婪模式盡可能少的匹
配所搜索的字符串,而默認(rèn)的貪婪模式則盡可能多的匹配所搜索的字符串。?
. 匹配除 “n” 之外的任何單個(gè)字符。要匹配包括 ‘n’ 在內(nèi)的任何字符,請(qǐng)使用象 ‘[.n]’ 的模式。?
(pattern) 匹配pattern 并獲取這一匹配。?
(?:pattern) 匹配pattern 但不獲取匹配結(jié)果,也就是說(shuō)這是一個(gè)非獲取匹配,不進(jìn)行存儲(chǔ)供以后使用。
(?=pattern) 正向預(yù)查,在任何匹配 pattern 的字符串開(kāi)始處匹配查找字符串。這是一個(gè)非獲取匹配,也就是說(shuō),該匹配不需要
獲取供以后使用。?
(?!pattern) 負(fù)向預(yù)查,與(?=pattern)作用相反?
x|y 匹配 x 或 y。?
[xyz] 字符集合。?
[^xyz] 負(fù)值字符集合。?
[a-z] 字符范圍,匹配指定范圍內(nèi)的任意字符。?
[^a-z] 負(fù)值字符范圍,匹配任何不在指定范圍內(nèi)的任意字符。?
b 匹配一個(gè)單詞邊界,也就是指單詞和空格間的位置。?
B 匹配非單詞邊界。?
cx 匹配由x指明的控制字符。?
d 匹配一個(gè)數(shù)字字符。等價(jià)于 [0-9]。?
D 匹配一個(gè)非數(shù)字字符。等價(jià)于 [^0-9]。?
f 匹配一個(gè)換頁(yè)符。等價(jià)于 x0c 和 cL。?
n 匹配一個(gè)換行符。等價(jià)于 x0a 和 cJ。?
r 匹配一個(gè)回車(chē)符。等價(jià)于 x0d 和 cM。?
s 匹配任何空白字符,包括空格、制表符、換頁(yè)符等等。等價(jià)于[ fnrtv]。?
S 匹配任何非空白字符。等價(jià)于 [^ fnrtv]。?
t 匹配一個(gè)制表符。等價(jià)于 x09 和 cI。?
v 匹配一個(gè)垂直制表符。等價(jià)于 x0b 和 cK。?
w 匹配包括下劃線的任何單詞字符。等價(jià)于'[A-Za-z0-9_]’。?
W 匹配任何非單詞字符。等價(jià)于 ‘[^A-Za-z0-9_]’。?
xn 匹配 n,其中 n 為十六進(jìn)制轉(zhuǎn)義值。十六進(jìn)制轉(zhuǎn)義值必須為確定的兩個(gè)數(shù)字長(zhǎng)。?
num 匹配 num,其中num是一個(gè)正整數(shù)。對(duì)所獲取的匹配的引用。?
n 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)后向引用。如果 n 之前至少 n 個(gè)獲取的子表達(dá)式,則 n 為后向引用。否則,如果 n 為八進(jìn)
制數(shù)字 (0-7),則 n 為一個(gè)八進(jìn)制轉(zhuǎn)義值。?
nm 標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)后向引用。如果 nm 之前至少有is preceded by at least nm 個(gè)獲取得子表達(dá)式,則 nm 為
后向引用。如果 nm 之前至少有 n 個(gè)獲取,則 n 為一個(gè)后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為
八進(jìn)制數(shù)字 (0-7),則 nm 將匹配八進(jìn)制轉(zhuǎn)義值 nm。?
nml 如果 n 為八進(jìn)制數(shù)字 (0-3),且 m 和 l 均為八進(jìn)制數(shù)字 (0-7),則匹配八
關(guān)于批量替換 正則表達(dá)式
這是我在處理文章時(shí)用到一些正則表達(dá)式,里面有你要的。在Editplus中使用。
在表:dede_addonarticle中,body字段即是文章內(nèi)容。
過(guò)濾Table相關(guān)的:
|
|
||
還有一些,可供你參考,我加了一些注釋?zhuān)l(fā)個(gè)貼太累了,哎~~~自己摸索吧:
正則: width=”[0-9][0-9][0-9]”| width=[0-9][0-9][0-9]| height=”[0-9][0-9][0-9]”| height=[0-9][0-9][0-9],說(shuō)明:過(guò)慮height、Width。
——————————————————
正則:
|
——————————————————
正則: style=”[^”]*”| style=[^”]*,注意:匹配Style=”border:”
——————————————————
正則:
,注意:匹配
——————————————————
正則:]*>|||]*>|| ,注意:匹配和
——————————————————
正則: border=”[0-9]”| border=[0-9],注意:匹配border=””
——————————————————
正則:]*>|| ,注意:匹配
——————————————————
正則: id=[^ ]*| id=”[^ ]*”,注意:匹配id=“”?
——————————————————
正則: title=[0-9][^ ]*| title=”[0-9][^ ]*”| alt=[0-9][^ ]*| alt=”[0-9][^ ]*”| alt=[a-z][^ ]*| alt=”[a-z][^ ]*”,注意:匹配Title或者alt
——————————————————
正則:,說(shuō)明:匹配HTML注釋
——————————————————
正則:<script>]*)>(.*)</script>,說(shuō)明:匹配<script></script>之間的全部?jī)?nèi)容
——————————————————
正則: class=[a-z][^ |^>]*| class=”[a-z][^ |^>]*”,說(shuō)明:清理class=””,經(jīng)過(guò)充分測(cè)試
——————————————————
正則:
|
|
||
——————————————————
正則:
]*>|
|
| align=left|||