抓取wordpress文章可以使用抓取插件來完成,如使用wp-autopost插件。
啟用WP-AutoPost插件然后創建新的任務,然后對插件進行設置即可。
文章抓取設置
在該選項卡下, 我們需要設置文章標題和文章內容的匹配規則,提供兩種方式進行設置,推薦使用css選擇器方式,使用該方式更為簡單,精確。
我們只需要設置文章標題CSS選擇器和文章內容CSS選擇器,即可準確抓取文章標題和文章內容。
在文章來源設置里,我們以采集”新浪互聯網新聞“為例,這里還是以該例子講解,通過查看列表網址http://roll.tech.sina.com.cn/internet_worldlist/index.shtml下某一篇文章的源代碼即可輕松設置,例如,我們通過查看某篇具體文章http://tech.sina.com.cn/i/2013-10-18/22298831229.shtml的源代碼,如下所示:
可以看到,文章標題在id為“artibodyTitle”的標簽內部,因此文章標題CSS選擇器只需要設置為??#artibodyTitle? 即可;
同樣的,找到文章內容的相關代碼:
可以看到,文章內容在id為“artibody”的標簽內部,因此文章內容CSS選擇器只需要設置為??#artibody? 即可;如下所示:
設置完成之后,可點擊測試按鈕,輸入測試地址,如果設置正確,將顯示出文章標題和文章內容,方便檢查設置是否正確。
更多wordpress相關技術文章,請訪問wordpress教程欄目進行學習!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
THE END