如何抓取WordPress文章

如何抓取WordPress文章

抓取wordpress文章可以使用抓取插件來完成,如使用wp-autopost插件。

啟用WP-AutoPost插件然后創建新的任務,然后對插件進行設置即可。

文章抓取設置

在該選項卡下, 我們需要設置文章標題和文章內容的匹配規則,提供兩種方式進行設置,推薦使用css選擇器方式,使用該方式更為簡單,精確。

我們只需要設置文章標題CSS選擇器和文章內容CSS選擇器,即可準確抓取文章標題和文章內容。

在文章來源設置里,我們以采集”新浪互聯網新聞“為例,這里還是以該例子講解,通過查看列表網址http://roll.tech.sina.com.cn/internet_worldlist/index.shtml下某一篇文章的源代碼即可輕松設置,例如,我們通過查看某篇具體文章http://tech.sina.com.cn/i/2013-10-18/22298831229.shtml的源代碼,如下所示:

如何抓取WordPress文章

可以看到,文章標題在id為“artibodyTitle”的標簽內部,因此文章標題CSS選擇器只需要設置為??#artibodyTitle? 即可;

同樣的,找到文章內容的相關代碼:

如何抓取WordPress文章

可以看到,文章內容在id為“artibody”的標簽內部,因此文章內容CSS選擇器只需要設置為??#artibody? 即可;如下所示:

如何抓取WordPress文章

設置完成之后,可點擊測試按鈕,輸入測試地址,如果設置正確,將顯示出文章標題和文章內容,方便檢查設置是否正確。

更多wordpress相關技術文章,請訪問wordpress教程欄目進行學習!

? 版權聲明
THE END
喜歡就支持一下吧
點贊11 分享