集搜客GooSeeker采集規(guī)則圖文教學(xué)
時(shí)間:2021-05-23 12:09:30 作者:無名 瀏覽量:54
集搜客GooSeeker是一款功能非常強(qiáng)大的網(wǎng)頁數(shù)
采集工具,能夠幫助用戶輕松采集網(wǎng)頁中的超鏈接,表格,圖片信息,文字內(nèi)容等等,致力于將互聯(lián)網(wǎng)中的所有內(nèi)容轉(zhuǎn)化為
數(shù)據(jù)庫和表格,界面簡(jiǎn)潔,功能列表信息排布,大大方便了用戶的使用,用戶可以對(duì)網(wǎng)頁內(nèi)容的結(jié)構(gòu)進(jìn)行轉(zhuǎn)換,并且對(duì)收集到的內(nèi)容進(jìn)行標(biāo)注用戶可以自定義采集規(guī)則,幫助大家能夠從更廣的角度和深度去采取網(wǎng)頁數(shù)據(jù)。
使用幫助
第一步:打開網(wǎng)頁
1.1, 加載網(wǎng)頁,看到要采集的內(nèi)容
打開數(shù)據(jù)管家用戶需要輸入網(wǎng)址,并點(diǎn)擊鍵盤中的回車按鈕,等待王者加載完成之后,用戶請(qǐng)查看當(dāng)前的網(wǎng)頁內(nèi)容是否完整,用戶如果需要采集網(wǎng)頁下方的各種內(nèi)容,就需要哪種網(wǎng)頁側(cè)邊的滾動(dòng)條,讓網(wǎng)頁能夠得到充分的加載,然后才可以創(chuàng)建新的采集任務(wù)。
1.2 ,創(chuàng)建采集任務(wù)
用戶如果需要?jiǎng)?chuàng)建新的采集任務(wù),只需要在頁面的左上角點(diǎn)擊添加按鈕,也就是加號(hào),然后在彈出的菜單欄中輸入當(dāng)前采集的任務(wù)名稱,任務(wù)名稱是唯一的,如果有相同的財(cái)經(jīng),明天就需要進(jìn)行更改,直到能夠?yàn)橄到y(tǒng)接受為止。
第二步:標(biāo)注需要采集的信息
2.1,在網(wǎng)頁上做標(biāo)注
用戶如果需要采集當(dāng)前網(wǎng)頁第一個(gè)商品的標(biāo)題信息,就使用
鼠標(biāo)點(diǎn)擊標(biāo)題,然后雙擊在彈出的菜單欄窗口中輸入內(nèi)容編輯一個(gè)字段名稱,對(duì)應(yīng)到
Excel中的字段,輸入商品標(biāo)題,創(chuàng)建輸出Excel表格,填寫表格名稱。
集搜客GooSeeker采集規(guī)則圖文教學(xué)圖2
2.2,標(biāo)注更多內(nèi)容
接下來用戶需要重復(fù)上一個(gè)操作步驟來填寫店鋪名稱評(píng)論數(shù)量以及標(biāo)注的價(jià)格信息。
第三步:保存規(guī)則,采數(shù)據(jù)
3.1,測(cè)試采集是否符合預(yù)期
點(diǎn)擊“測(cè)試”按鈕,檢查信息完整性。很有可能采集到的內(nèi)容是空的,或者是包含了很多不需要的內(nèi)容,或者錯(cuò)位了,采集到了相鄰的內(nèi)容。那么就需要重新調(diào)整映射關(guān)系,如果直觀標(biāo)注不精確,可以去下面的DOM窗口做內(nèi)容映射。
集搜客GooSeeker采集規(guī)則圖文教學(xué)圖3
3.2,點(diǎn)擊“保存”
只有保存了規(guī)則,爬蟲才能執(zhí)行規(guī)則,采集數(shù)據(jù)。未來還可以修改規(guī)則。
集搜客GooSeeker采集規(guī)則圖文教學(xué)圖4
- 軟件性質(zhì):國(guó)產(chǎn)軟件
- 授權(quán)方式:免費(fèi)版
- 軟件語言:簡(jiǎn)體中文
- 軟件大小:30931 KB
- 下載次數(shù):314 次
- 更新時(shí)間:2021/5/16 10:49:09
- 運(yùn)行平臺(tái):WinAll...
- 軟件描述:集搜客GooSeeker是一款功能齊全的網(wǎng)頁數(shù)據(jù)采集軟件,你可以把它看成一條網(wǎng)絡(luò)... [立即下載]
相關(guān)資訊
相關(guān)軟件