造數(shù)是一個(gè)基于云端爬取的智能云爬蟲服務(wù)站點(diǎn),通過一套網(wǎng)頁(yè)分析的算法,分析出網(wǎng)頁(yè)中結(jié)構(gòu)化的數(shù)據(jù),然后再爬取頁(yè)面中的數(shù)據(jù),無需編程基礎(chǔ),只需輸入網(wǎng)址,選取所需的數(shù)據(jù),就可輕松獲取互聯(lián)網(wǎng)的公開數(shù)據(jù),并以 Excel 表格等形式下載,或使用 API 與企業(yè)內(nèi)部系統(tǒng)深度整合。
造數(shù)功能特色:
1.分布式爬?。涸鞌?shù)的采集節(jié)點(diǎn)遍布全國(guó) 7 個(gè)機(jī)房上百萬個(gè) IP,輕松繞過各類網(wǎng)站的 IP 訪問頻率限制。
2.云端保存:普通用戶可以保留每個(gè)爬蟲 30 天內(nèi)的最新 9 次爬取結(jié)果。
3.定時(shí)執(zhí)行:可以設(shè)置以日/周/月為周期定時(shí)執(zhí)行,無需人工點(diǎn)擊,一切自動(dòng)完成。提升業(yè)務(wù)流水線效率。
4.執(zhí)行結(jié)果直達(dá)郵箱:將定時(shí)執(zhí)行或監(jiān)控更新的結(jié)果以附件的形式發(fā)送到你的郵箱。
5.深度爬?。涸谂廊×艘幌盗芯W(wǎng)址后以它們?yōu)槟繕?biāo)網(wǎng)址二次爬取,挖掘出藏在鏈接背后的更多信息。
6.監(jiān)控更新:以一定的頻率監(jiān)控指定網(wǎng)頁(yè)上的內(nèi)容更新,每次發(fā)現(xiàn)更新后都將新增內(nèi)容作為執(zhí)行結(jié)果。
7.API:為用戶提供 API 來幫助開發(fā)者將造數(shù)提供的爬蟲服務(wù)整合進(jìn)自動(dòng)化的業(yè)務(wù)邏輯中。
8.WebHook:每當(dāng)該爬蟲執(zhí)行完成時(shí),向用戶指定的地址以 POST 方法發(fā)送一個(gè)通知。
造數(shù)是一家技術(shù)驅(qū)動(dòng)的產(chǎn)品型公司,借助機(jī)器學(xué)習(xí)等人工智能前沿技術(shù),致力于挖掘互聯(lián)網(wǎng)數(shù)據(jù)的深度價(jià)值,為各個(gè)行業(yè)提供可利用的數(shù)據(jù)價(jià)值。目前造數(shù)已服務(wù)超過 4000 家企業(yè)客戶,包括鏈家、贊那度、音悅臺(tái)、尚德機(jī)構(gòu)等;累計(jì)爬取網(wǎng)頁(yè)數(shù)量已達(dá)千萬級(jí)。