快捷登錄,享 免費下載
首頁 > 軟件列表 > 火車采集器
火車采集器

火車采集器

軟件語言:簡體中文
軟件授權(quán):免費軟件
適用系統(tǒng):Windows
創(chuàng)建時間:2020-12-11
軟件廠商/開發(fā)者信息:獨立開發(fā)者

產(chǎn)品特性

1、通用性強

無論新聞、論壇、視頻、黃頁、圖片、下載類網(wǎng)站,只要通過瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。

2、穩(wěn)定、高效

七年磨一劍,軟件不斷更新進步,采集速度快,性能穩(wěn)定,占用資源少。

3、擴展性強、適用范圍廣

自定義web發(fā)布,自定義主流的數(shù)據(jù)庫的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都 能為你所用。

無限級采集

無限級深度,分頁采集,無限級多頁采集

任意文件格式下載

圖片、壓縮文件、FLV電影等都能輕松下載

中文分詞、中英文翻譯

中文分詞、中英文翻譯

關(guān)鍵詞、鏈接替換

近義詞替換,參數(shù)替換

全自動運行

自動運行更新、自動關(guān)機

支持多數(shù)據(jù)庫

Access/MySQL/MsSQL/Sqlite/Oracle保存及發(fā)布

任意編碼,Gzip,Deflate壓縮采集

編碼自動識別,采集多國語言網(wǎng)頁

可選驗證方式

可選加密狗,隨時隨地的移動

XPath可視化提取功能

鼠標可視化點選內(nèi)容采集

正文識別

無需規(guī)則自動識別標題,內(nèi)容,時間等。

Ocr識別

內(nèi)置簡易通用圖片識別系統(tǒng)

HTTP接口管理

內(nèi)置HTTP服務(wù)器,管理軟件運行

應(yīng)用范圍

垂直搜索(或稱為專業(yè)搜索)服務(wù)

信息匯聚和門戶服務(wù)

企業(yè)網(wǎng)信息匯聚

商業(yè)情報采集

論壇或博客遷移

智能信息代理

個人信息檢索

信息挖

適用群體

1、公司集團

2、政府機關(guān)與軍隊

3、門戶網(wǎng)站

4、新聞媒體

5、廣告與市場研究機構(gòu)

6、金融機構(gòu)

7、電信移動聯(lián)通

8、科學(xué)與技術(shù)研究單位

9、網(wǎng)站站長

10、電子商務(wù)(如淘寶店長等)

版本列表