1.寫在前面
5G可以說是2019年上半年十分閃耀的那顆“星”了,美方還不惜代價地試圖封鎖中國的5G技術(shù)出海。5G之所以重要,是因為其將和AI技術(shù),大數(shù)據(jù)技術(shù)一道顛覆我們現(xiàn)有的生活模式,讓智能化成為現(xiàn)實。
在智能化的世界,5G技術(shù)提供高速率(>1 Gbps),低延時(1ms)的基礎(chǔ)網(wǎng)絡(luò)服務(wù),組建物聯(lián)網(wǎng)(IoT,Internet of Things),大數(shù)據(jù)技術(shù)提供對萬物互聯(lián)產(chǎn)生的海量數(shù)據(jù)的整合能力,而AI技術(shù)則提供整個智能生態(tài)的計算與決策能力,深度學(xué)習(xí)技術(shù)是非常高效的實現(xiàn)方式,在過去10年,已被學(xué)術(shù)界和工業(yè)界反復(fù)證實,能夠依靠各種模型算法達(dá)成比人類判斷更精準(zhǔn),更快速的“靈丹妙藥”。

Figure 1 智能時代
技術(shù)需要高效的實現(xiàn)模式來進(jìn)行應(yīng)用,深度學(xué)習(xí)框架就是那個實現(xiàn)“靈藥“的“煉丹爐”,能夠通過深度學(xué)習(xí)算法模塊化的封裝,快速搭建模型,輸入數(shù)據(jù),進(jìn)行各種模型的訓(xùn)練,調(diào)優(yōu),測試和部署,為整個智能生態(tài)提供預(yù)測,決策等核心推斷能力。
2.深度學(xué)習(xí)框架排行榜
得益于深度學(xué)習(xí)框架發(fā)展初期各家為更好的推動技術(shù)發(fā)展而造就的開源生態(tài)模式,如今,各式各樣的框架百花齊放,百家爭鳴,快速推動了深度技術(shù)在工業(yè)界的落地應(yīng)用。當(dāng)然,好“藥”也得有好“爐”煉,下面我們就介紹下目前主流的深度學(xué)習(xí)框架的發(fā)展?fàn)顩r,各自的特點以及適合的場景等,找到合適的“爐“。
從業(yè)界影響、資源投入、開發(fā)生態(tài)、文檔體系、模型全面性、工業(yè)實踐和開源熱度(github)等七個方面評估各框架的發(fā)展?fàn)顩r,結(jié)果如下圖(供參考)。

Figure 2 十大深度學(xué)習(xí)框架發(fā)展程度(caffe,caffe2分開統(tǒng)計)
再來看一下GitHub對應(yīng)的一些數(shù)據(jù)情況,Pytorch,TensorFlow,PaddlePaddle過去兩年保持了較快的發(fā)展速度,尤其Pytorch的星數(shù)有3倍增長,博得了眾多人的眼球。而Caffe&Caffe2,Theano,CNTK等,雖然已經(jīng)停止迭代,但在AI啟航的時間點仍然有一定的增長。

Figure 3 十大深度學(xué)習(xí)框架github概覽(caffe,caffe2分開統(tǒng)計)

Figure 4 十大深度學(xué)習(xí)框架增長率(caffe,caffe2分開統(tǒng)計)
上圖中,前三個(Pytorch,TensorFlow,PaddlePaddle)是個人認(rèn)為目前發(fā)展快,并且比較完善的框架,末端的四個是已經(jīng)官宣不再更新的,而其他的是發(fā)展到平穩(wěn)期或資源有限的一些框架。
3.十大深度學(xué)習(xí)框架詳解

Google的TensorFlow,可以說是當(dāng)今十分流行的深度學(xué)習(xí)框架。Airbnb, DeepMind,Intel,Nvidia,Twitter以及許多其他著名公司都在使用它。
Google自開源TensorFlow起,投入大量的人力,物力,財力逐步構(gòu)建了一個AI生態(tài),從基礎(chǔ)研究、AI教育、再到應(yīng)用實現(xiàn),而這個生態(tài)的核心就是TensorFlow。如前所說,深度學(xué)習(xí)是AIoT時代的基石,毫無疑問,Google依然走在時代轉(zhuǎn)折點的前列。
TensorFlow提供全面的服務(wù),無論是Python,C++,JAVA,Go,甚至是Javascript,Julia,C#,幾乎所有開發(fā)者都可以從熟悉的語言入手開始深度學(xué)習(xí)的旅程。TensorFlow構(gòu)建了活躍的社區(qū),完善的文檔體系,大大降低了我們的學(xué)習(xí)成本,不過社區(qū)和文檔主要以英文為主,中文支持有待加強(qiáng)。另外,TensorFlow有很直觀的計算圖可視化呈現(xiàn)。模型能夠快速的部署在各種硬件機(jī)器上,從高性能的計算機(jī)到移動設(shè)備,再到更小的更輕量的智能終端。
TensorFlow的缺點已經(jīng)被詬病多年,相比Pytorch,Caffe等框架,TensorFlow的計算速度可以說是“牛拉車“。而且通過它構(gòu)建一個深度學(xué)習(xí)框架需要更復(fù)雜的代碼,還要忍受重復(fù)的多次構(gòu)建靜態(tài)圖。
綜合來說,對于英文閱讀和英文交流毫無障礙的同學(xué),TensorFlow依然是深度學(xué)習(xí)框架的優(yōu)選方案,畢竟可以和人流暢交流是學(xué)習(xí)和工作的重點。

Pytorch是基于用Lua編寫的Torch庫的Python實現(xiàn)的深度學(xué)習(xí)庫,它由Facebook創(chuàng)建,目前被廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界,隨著Caffe2項目并入Pytorch,也穩(wěn)固了Pytorch緊追并迫近TensorFlow在深度學(xué)習(xí)應(yīng)用框架領(lǐng)域的地位。
Pytorch官網(wǎng)的標(biāo)題語簡明的描述了目前Pytorch的特點以及將要發(fā)力的方向。Pytorch在學(xué)術(shù)界優(yōu)勢很大,關(guān)于用到深度學(xué)習(xí)模型的文章,除了Google家的,其他大部分都是通過Pytorch進(jìn)行實驗的,究其原因一是Pytorch庫足夠簡單,跟NumPy,SciPy等可以無縫連接,而且基于tensor的GPU加速非常給力,二是訓(xùn)練網(wǎng)絡(luò)迭代的核心-梯度的計算,Autograd架構(gòu)(借鑒于Chainer),在Pytorch,我們可以動態(tài)的設(shè)計網(wǎng)絡(luò),而無需笨拙的定義靜態(tài)網(wǎng)絡(luò)圖,才能去進(jìn)行計算,想要對網(wǎng)絡(luò)有任務(wù)修改,都要從頭開始構(gòu)建靜態(tài)圖?;诤唵?,靈活的設(shè)計,Pytorch快速成為了學(xué)術(shù)界的主流深度學(xué)習(xí)框架。
Pytorch的劣勢在于模型部署,由于對其部署難度早有耳聞,我沒嘗試過部署Pytorch的模型,一般是在Pytorch快速的試驗新的模型,確認(rèn)好的效果再去找“現(xiàn)成的”的TensorFlow模型做簡單的優(yōu)化。
不過現(xiàn)在,如果稍微深入的了解TensorFlow和Pytorch,就會發(fā)現(xiàn)他們越來越像,TF加入了動態(tài)圖架構(gòu),Pytorch致力于其在工業(yè)界更加易用。打開各自的官網(wǎng),你也會發(fā)現(xiàn)文檔風(fēng)格也越發(fā)的相似。

PaddlePaddle是由百度自主開發(fā)的開源深度學(xué)習(xí)框架,近期發(fā)現(xiàn)有了中文名字,飛槳。官網(wǎng)截圖也很有意思,很多小人在劃槳。飛槳剛發(fā)布的時候,并不被看好,感覺更像是Google有,百度也要有的腔調(diào),但是近來在做一個關(guān)于語義識別的項目,其他框架支持中文的模型實在是少的可憐,時間緊張也沒有時間大規(guī)模訓(xùn)練,于是就來試試飛槳,其中基于BERT的ERNIE模型取得了較好的效果,部署也不折騰。個人認(rèn)為可以將模型庫中的經(jīng)典模型套在自己的問題上,作為baseline模型快速試驗,而后慢慢調(diào)優(yōu)追求更好的效果。
從模型庫找到適合自己的模型,按照實踐教程一步步進(jìn)行就行了,過程還是比較簡單的,遇到的問題在github的issues中都有找到,雖然不像TF那么活躍,但是支持也是很及時的。我是從官網(wǎng)找模型,發(fā)現(xiàn)官網(wǎng)又更新了,盜張圖過來感受下支持的模型。

Figure 5 PaddlePaddle模型庫
功能上,飛槳同時支持動態(tài)圖和靜態(tài)圖,能方便的調(diào)試模型,方便的部署,非常適合業(yè)務(wù)應(yīng)用的落地實現(xiàn)。飛槳也已經(jīng)支持?jǐn)?shù)百個節(jié)點的高效并行訓(xùn)練??梢哉f在過去2年的時間里,深度學(xué)習(xí)領(lǐng)域在大規(guī)模的落地應(yīng)用,各家框架也都在快速的發(fā)展,但是百度的PaddlePaddle看來是這個階段發(fā)展更快的框架,甚至是發(fā)展更快的AI開發(fā)生態(tài)。
以上三個框架可以說是目前發(fā)展比較快的,并且在穩(wěn)定更新,維護(hù)的。功能上來說,各框架已經(jīng)“越長越像”了,三個框架還是會有各自的特點,如何選擇還是要根據(jù)自己的目標(biāo)來看。
下面來簡單介紹下其他的一些主要框架。



4.如何選擇?
那么如何在眾多的框架中選擇呢,我的建議有3個框架:TensorFlow,Pytorch,飛槳。其他的不是投入資源有限,就是已經(jīng)不再維護(hù)了。實際上,我們或多或少應(yīng)該都了解下這3個框架,針對不同的目的可以快速選型。
如果是剛剛接觸深度學(xué)習(xí),以學(xué)習(xí)為目的的,我建議從TensorFlow和飛槳開始,至少目前來看,Google和百度是傾全力打造這兩個平臺的,他們已經(jīng)不只是一個深度學(xué)習(xí)框架了,更是一個AI開發(fā)的生態(tài),從基礎(chǔ)的視頻課程,完善的文檔體系到項目的開放落地提供的是統(tǒng)一的服務(wù)。多說一句,百度飛槳的基礎(chǔ)文檔相當(dāng)詳細(xì),不只有代碼實現(xiàn),數(shù)據(jù)流過程的教程,同時也包含了詳細(xì)的算法原理,這點對于還不是那么了解相應(yīng)模型的同學(xué)來說是極大的方便。對于學(xué)有余力的同學(xué),還是建議對這3個框架都了解下。
如果是出于學(xué)術(shù)目的的,建議從Pytorch開始,畢竟學(xué)術(shù)研究要緊盯著前沿,看文章,復(fù)現(xiàn)文章中模型的效果,選大家都用的可以節(jié)省不必要的時間成本,把重點放在優(yōu)化模型提升模型效果上。
如果是想要開箱即用,想即刻將深度學(xué)習(xí)技術(shù)應(yīng)用到自己的場景中嘗試,我會建議選擇飛槳,飛槳中有大量的實戰(zhàn)案例,基本套到相應(yīng)的場景就能迭代起來了。而且在NLP領(lǐng)域,需要對各種語言進(jìn)行預(yù)處理,毫無疑問對中文支持更好的是飛槳,比如ERNIE,其挖掘海量的中文數(shù)據(jù),對先驗語義知識進(jìn)行建模,增強(qiáng)了語義表達(dá)能力,可以作為NLP,NLU應(yīng)用的基礎(chǔ)服務(wù)不同的場景。
隨手貼幾個招聘網(wǎng)站上的JD,也可以幫大家明確一下方向,供參考。



5.未來
我們處在更好的時代。
感謝互聯(lián)網(wǎng)文化,感謝開源文化,讓技術(shù)可以以指數(shù)級的速度發(fā)展,我們更要感謝在時代轉(zhuǎn)折點的那些引路人,沒有Google,百度等企業(yè)不遺余力地嘗試將新技術(shù)應(yīng)用于各產(chǎn)業(yè),就沒有技術(shù)的飛速發(fā)展,就沒有美好的生活模式的變遷。
AI技術(shù)的平民化是智能時代發(fā)展的催化劑,我們應(yīng)用深度學(xué)習(xí)技術(shù),從原理到框架,再到應(yīng)用平臺化工具將其落地到所有的場景,這是未來的發(fā)展趨勢。得益于5G技術(shù)的發(fā)展,相信在不久的將來,我們將實現(xiàn)萬物互聯(lián)。深度學(xué)習(xí)是AIoT時代的關(guān)鍵,各平臺已有的實踐落地項目給我們提供了產(chǎn)業(yè)落地的實現(xiàn)路徑??芍^星星之火,已成燎原之勢,另外,發(fā)展我國自己的AI開發(fā)生態(tài)也同樣重要,考慮到近期的“華為事件”,有備無患。
結(jié)尾想說,框架、平臺都只是為我們提供了工具,明確我們的目標(biāo)并找到合適的場景,推進(jìn)應(yīng)用在業(yè)務(wù)上的落地,實現(xiàn)商業(yè)價值才是核心競爭力。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。
相關(guān)推薦
- RAKsmart防護(hù)配置實戰(zhàn):10Gbps套餐部署指南
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 自媒體推廣實時監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- 站長必讀:從“流量思維”到“IP思維”的品牌升級之路
- 從流量變現(xiàn)到信任變現(xiàn):個人站長的私域運(yùn)營方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時代,個人站長如何用AI工具實現(xiàn)“一人公司”