火車采集器是一款非常優(yōu)秀的專業(yè)網(wǎng)絡(luò)爬蟲軟件工具,火車采集器采用Visual C#編寫通過靈活的配置,您可以很輕松的從網(wǎng)頁上抓取文字、圖片、文件等任何資源,火車頭采集器旨在提供一站式高效采集服務(wù),采用多線程采集方式,其強(qiáng)大的識(shí)別系統(tǒng),能夠準(zhǔn)確識(shí)別各種編碼文字,支持多類型
數(shù)據(jù)庫,滿足不同的數(shù)據(jù)處理需求,強(qiáng)大的php和c#插件支持,讓您可以通過二次開發(fā)實(shí)現(xiàn)您所想要的任何更強(qiáng)大的功能。
軟件特色:
1、分布式高速采集
任務(wù)分配至多個(gè)客戶端。同時(shí)運(yùn)行采集,效率倍增。
2、多識(shí)別系統(tǒng)
配備了多種識(shí)別系統(tǒng),例如文本識(shí)別,中文分詞識(shí)別和任意代碼識(shí)別。 智能識(shí)別操作更容易。
3、可選驗(yàn)證方式
可選擇是否使用加密狗。隨時(shí)保障數(shù)據(jù)安全。
4、全自動(dòng)運(yùn)行
5、替換功能
同義,同義單詞替換,參數(shù)替換,偽原始必不可少的技能。
圖片、壓縮文件、
視頻等任意格式的文件都能輕松下載。
7、采集監(jiān)控系統(tǒng)
實(shí)時(shí)監(jiān)控和收集,確保數(shù)據(jù)的準(zhǔn)確性。
8、支持多數(shù)據(jù)庫
支持Access/MySQL/MsSQL/Sqlite/Oracle多種類型的數(shù)據(jù)庫保存及發(fā)布。
9、無限級(jí)多頁采集
支持包含ajax請求數(shù)據(jù)在內(nèi)的多個(gè)頁面信息的無限級(jí)采集。
10、支持?jǐn)U展
支持界面和插件擴(kuò)展,可滿足各種理發(fā)需求。
yunucms火車頭采集發(fā)布模塊操作步驟:
1、發(fā)布接口文件為“Tool.php”,請上傳到
網(wǎng)站目錄 “ \app\admin\controller ”
2、打開火車頭安裝目錄,將發(fā)布模塊放到Module里
火車采集器yunucms發(fā)布模塊操作圖2
3、全局變量需要輸入和tool.php文件里設(shè)置的密碼(注:請?jiān)O(shè)置復(fù)雜密碼,否則有可能被非法利用)
火車采集器yunucms發(fā)布模塊操作圖3
4、選擇不登錄模式,點(diǎn)擊“獲取列表”測試,成功即可看到網(wǎng)站所有欄目了
其余設(shè)置均為火車頭采集操作,需要自行解決,附一張采集成功截圖
火車采集器yunucms發(fā)布模塊操作圖4
- 軟件性質(zhì):國產(chǎn)軟件
- 授權(quán)方式:免費(fèi)版
- 軟件語言:簡體中文
- 軟件大小:23789 KB
- 下載次數(shù):4642 次
- 更新時(shí)間:2021/3/29 13:15:21
- 運(yùn)行平臺(tái):WinAll...
- 軟件描述:火車采集器是使用人數(shù)比較多的互聯(lián)網(wǎng)數(shù)據(jù)挖掘軟件。能采集99%的網(wǎng)頁,就算網(wǎng)頁需要... [立即下載]