您的位置:極速下載站 → 電腦軟件 → 網(wǎng)絡軟件 → 網(wǎng)絡其他 → 網(wǎng)絡神采
采集過網(wǎng)頁數(shù)據(jù)的用戶都知道,要配規(guī)則,錯一個符號和錯一個字母都匹配失敗無法采集。今天極速小編為你介紹一款全新的網(wǎng)頁數(shù)據(jù)采集工具(網(wǎng)絡神采),它可以采集任意網(wǎng)頁上的數(shù)據(jù),采用智能采集模式,不用匹配規(guī)則,還支持二次開發(fā),需要的網(wǎng)友可以下載使用。
登陸界面
神采主界面
基本簡介
《網(wǎng)絡神采》是一款輕量級的采集軟件,用于快速采集、下載網(wǎng)頁數(shù)據(jù)。軟件速度快、好用、免費。支持智能采集(不用配規(guī)則)、可視化采集(不用看源文件),支持二次開發(fā)、分布式部署。為用戶的大數(shù)據(jù)分析、信息化平臺,提供穩(wěn)定、持續(xù)、準確的數(shù)據(jù)資源。
功能介紹
1、采集強度
支持JS解析、POST分頁、登錄采集、跨層采集。對于疑難采集頁面,有成熟的解決方案。
2、速度快
支持多任務同時運行,每個任務又可以設置多線程,確保運行效率。
3、規(guī);
支持任務多級分類、批量管理。支持云服務器分布式部署,管理員團隊協(xié)合。
4、流程化
支持定時采集,任務定時自動啟動。通過二次開發(fā),實現(xiàn)流程化的信息采集、信息處理。
5、運行穩(wěn)定
系統(tǒng)運行穩(wěn)定,要求“0 bug”。目標網(wǎng)頁改版后,自動通知管理員。
6、準確性
定制好任務后,采集準確率可達100%,即一條不漏。
神采在線發(fā)布器
神采正則式測試器
神采網(wǎng)址編碼器
更新日志
1、增加定期重啟軟件功能。
2、修復bug:定時采集啟動任務時會進隊列2次。
3、增加設置:特殊結果設置 -> 記錄任務名稱。
4、修復bug:Win7下啟動服務IO異常。
5、按任務統(tǒng)計插件。
6、修復bug:文本查看器切換到空白單元格會出錯。
7、如果不下載文件,不要再生成子目錄(即使選中設置)。
8、F9運行文件夾下所有任務后,子文件夾的任務狀態(tài)沒有改變。
9、修復bug:訪問休息間隔設置為“0-1秒”時失效。
10、處理JS中的相對地址時,可識別“'”前面的轉義符“\”。
11、發(fā)生 Worker Thread Error 的異常時,可記錄異常的詳細內容。
12、讀取網(wǎng)址時出錯后,可暫停任務。
13、發(fā)生 Worker Thread Error 的異常時,任務可暫停;若暫停失敗,則停止任務。
14、修復bug:繼續(xù)任務時,如果任務進入任務隊列,則會重新開始任務。
15、停止任務,同樣要寫日志。
16、改進了任務隊列的查詢算法。
17、改進了機器碼的可讀性。
18、Worker Thread Error: 引發(fā)類型為“System.OutOfMemoryException”的異常。該異常發(fā)生后,可暫停任務。
19、保存“提取網(wǎng)址”時如果出錯,可恢復。
20、增加設置:如果“使用插件處理采集結果數(shù)據(jù)行”失。捶祷“false”),仍顯示采集結果。
21、廢棄設置:關閉軟件時,如果有軟件正在運行,強制停止所有任務。
22、改進“源文件查看器”用戶體驗3處:Cookie變化、粘貼POST參數(shù)時自動分離、菜單快捷鍵。
23、捕獲地址時,如果某個參數(shù)有變化,文本框背景色則變紅。
24、將檢查“關鍵規(guī)則”調整到“采集結果篩選”之前。
25、更新插件接口(IBget 3.4),更新內容:CheckSchedule、Create 新增參數(shù):lastTaskState、lastPausingReason。
26、請求休息間隔,支持隨機數(shù)。
27、請求重試可以設置為無限次數(shù),同時增加“重試休息間隔”、“重試錯誤范圍”設置。
28、任務增加設置:動作失敗后不暫停任務。
29、下載文件時,只請求一次。
30、運行整個文件夾的任務時,增加快捷鍵:F9。
31、修復bug:批量暫停正在啟動的任務時,會有“運行中”狀態(tài)閃過。
32、解決:運行信息窗口資源釋放問題。
33、使用插件處理結果數(shù)據(jù)行后,如果返回false,則數(shù)據(jù)行不再顯示。
34、循環(huán)采集拆分字符串數(shù)組時,保留空值。
35、修復內存bug一處。
36、修復bug:查看等待區(qū)出錯:集合已修改;可能無法執(zhí)行枚舉操作。
37、修復bug:由于插件日志回調事件,會引發(fā)異常:遠程對象已斷開。
38、修復bug:設置窗口如果不操作,2分鐘后會拋異常:遠程對象已斷開。
39、更新插件接口(IBget 3.3),更新內容:ExtractResult 新增參數(shù):rowIndex;Create 新增參數(shù):supportAsyncCall。
40、創(chuàng)建插件時如果出錯,任務不再提示連接數(shù)據(jù)庫。
41、特殊結果 -》 記錄當前網(wǎng)址,如果有POST參數(shù),則包含在其中。
42、修復bug:任務完成后取消定時采集,在選中“使用插件檢查定時采集”時仍起作用。
43、修復bug:源文件查看器預覽功能,不能預覽框架頁。
44、增加復制采集規(guī)則功能。
45、提取下一網(wǎng)址時,如果與網(wǎng)址隊列重復,則提示:提取 n 條,已去重.
46、連續(xù)提取下一層網(wǎng)址失敗已達到 n 次后,不再提取下一頁網(wǎng)址,不然下次請求時會重復提取。
47、修復幾處內存溢出問題。
48、修復bug:文本查看器 html 方式查看,關閉窗口后,再打開出錯“未將對象引用設置到實例”。
49、改進定時采集檢查思路:取當前時間并緩存,這樣就沒有了定時偏差。
文件信息
文件大。1511424 字節(jié)
文件說明:網(wǎng)絡神采 6.2.16 共享版
文件版本:6.2.16.26114
MD5:FD84A690A093DE84F16C623FD9A77CE3
SHA1:8C7394436EC9B31B635AB0024FFBC91CE03115A6
CRC32:2F2B1941
包含文件
bget.exe
htmlview.exe
poster.exe
RegexTester.exe
Updater.exe
官方網(wǎng)站:http://www.sensite.cn/
相關搜索:采集
網(wǎng)絡神采是一款好用的網(wǎng)頁信息采集軟件。使用網(wǎng)絡神采可以輕松選擇網(wǎng)站中的網(wǎng)站信息進行采集;
極速小編這一次就給大家演示一下怎么使用網(wǎng)絡神采來采集58同城中的租房信息吧。點擊選中網(wǎng)絡神采主界面中的任務列表中的58同城-租房,然后點擊軟軟件工具欄中的運行按鈕,開始執(zhí)行采集58同城租房網(wǎng)頁信息;
網(wǎng)絡神采正在采集58同城上面的租房信息。目前網(wǎng)絡神采已經(jīng)提取了32個網(wǎng)址,完成提取6個網(wǎng)址。當前采集了5個網(wǎng)頁,采集結果為464個網(wǎng)頁;
網(wǎng)頁信息采集成功,這時候我們可以看到網(wǎng)絡神采提示已完成。58同城-租房的采集任務完成提取64個網(wǎng)址,從522個結果中采集了63個結果;
接下來我們就可以將采集結果導出到電腦文件夾中。點擊網(wǎng)絡神采任務列表中的任務,然后點擊右鍵菜單中的導出,就可以將網(wǎng)頁采集任務導出到電腦中;
在文件另存為窗口中,點擊打開想要用來保存采集結果XML文件的文件夾。網(wǎng)絡神采會自動對XML文檔進行命名,點擊保存就可以將XML文件保存到選中的文件夾中;
XML文檔成功保存到指定的文件夾中,我們可以雙擊打開XML文檔,查看網(wǎng)絡神采的網(wǎng)頁采集結果;