近日,科大訊飛憑借在道路目標(biāo)檢測(cè)領(lǐng)域多年的技術(shù)探索,刷新了Cityscapes 3D目標(biāo)檢測(cè)任務(wù)的全球最好成績(jī),得到檢測(cè)分?jǐn)?shù)(DS)42.9,取得了該項(xiàng)評(píng)測(cè)的第一名。這也是,科大訊飛繼2017年、2018年參與測(cè)評(píng)之后,再一次刷新Cityscapes的世界紀(jì)錄。

此次評(píng)測(cè),科大訊飛借鑒了已在城市交通出行場(chǎng)景下應(yīng)用的Anchor-Free車輛檢測(cè)技術(shù),將2D目標(biāo)檢測(cè)技術(shù)升級(jí)至3D,并結(jié)合3D到2D重投影的特殊先驗(yàn)信息進(jìn)行算法遷移,通過結(jié)合語(yǔ)義、上下文信息、位置先驗(yàn)信息以及目標(biāo)形狀先驗(yàn)信息等,提取精確的3D目標(biāo)檢測(cè)框,構(gòu)建形成一套具有豐富上下文信息的多層次單目3D目標(biāo)檢測(cè)方案
什么是Cityscapes和3D目標(biāo)檢測(cè)任務(wù)?
我們知道,在深度學(xué)習(xí)圖像語(yǔ)意分割的訓(xùn)練過程中,需要有數(shù)據(jù)集及分好類的標(biāo)簽,這樣才可以讓你的神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),進(jìn)而訓(xùn)練出模型。Cityscapes便是包含城市大量街道圖片、視頻用來(lái)訓(xùn)練識(shí)別的數(shù)據(jù)集,由戴姆勒(DAIMLER)等在內(nèi)的三家德國(guó)單位聯(lián)合提供,吸引了華為、阿里、微軟、北大、中科院、MIT等上百個(gè)國(guó)內(nèi)外著名AI實(shí)驗(yàn)室和頂尖學(xué)術(shù)研究機(jī)構(gòu)積極參與,是CVPR、ECCV等國(guó)際頂級(jí)會(huì)議中實(shí)例分割任務(wù)常用的權(quán)威測(cè)試數(shù)據(jù)集。
2020年,在CVPR workshop上,Cityscapes公開了新的單目圖像3D目標(biāo)檢測(cè)評(píng)測(cè)集,包含car, truck, bus, train, bicycle, motorcycle共6種類別目標(biāo)。每種目標(biāo)需要檢測(cè)出其在空間中的三維坐標(biāo)位置,目標(biāo)的長(zhǎng)、寬、高以及目標(biāo)在空間中的旋轉(zhuǎn)姿態(tài)?;谝曈X的3D目標(biāo)檢測(cè),是圖像處理和計(jì)算機(jī)視覺領(lǐng)域的重要研究方向之一。

基于視覺的3D目標(biāo)檢測(cè)有什么重要意義?
基于科大訊飛在AI+3D視覺技術(shù)的結(jié)合探索之下,未來(lái)3D目標(biāo)檢測(cè)將能在城市治理、工業(yè)智能、機(jī)器智能、智能駕駛等多方面發(fā)揮廣泛的作用。
【提供參考】
通過三維目標(biāo)檢測(cè)技術(shù),可以感知目標(biāo)的三維尺寸信息、空間位置。
【精準(zhǔn)判斷】
通過空間位置感知,可以更精準(zhǔn)地判斷目標(biāo)和參照物之間的位置關(guān)系。
比如在城市交通管理場(chǎng)景中,當(dāng)前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺盲區(qū)。若將3D目標(biāo)檢測(cè)技術(shù)接入公安交警現(xiàn)有的交通視頻智能分析平臺(tái),與AI巡檢相結(jié)合,可以進(jìn)一步精確判定車輛車型,基于空間位置感知和連續(xù)軌跡跟蹤,計(jì)算出車輛的行駛速度、空間軌跡等,為越斑馬線停車、超速抓拍、擁堵感知等違法異常事件判斷提供更實(shí)時(shí)、更精準(zhǔn)的決策依據(jù)。這不僅能夠達(dá)到對(duì)已有設(shè)備資源的最大化利用,實(shí)現(xiàn)降本提效,還能夠提升城市數(shù)字化治理能力,助力文明出行、平安出行。
如下圖所示,右側(cè)黑色車輛2D檢測(cè)外邊框和右側(cè)交通線相交,此時(shí)通過二維平面相交關(guān)系判斷,會(huì)認(rèn)定車輛壓線行駛。但從三維的檢測(cè)結(jié)果分析,能夠判斷出車體并沒有越過交通線。

AI賦能,建設(shè)美好世界
如何讓機(jī)器變得更加“聰明”,具備足夠的學(xué)習(xí)能力,并更精準(zhǔn)地貼合現(xiàn)實(shí)使用需求,是所有人工智能研發(fā)團(tuán)隊(duì)所需解決的最大難題??拼笥嶏w直面檢測(cè)精細(xì)度更高、場(chǎng)景更為復(fù)雜、挑戰(zhàn)難度更大的3D目標(biāo)檢測(cè)任務(wù),并一舉刷新了世界紀(jì)錄,意味著科大訊飛已經(jīng)具備了強(qiáng)大的AI技術(shù)硬核實(shí)力。
多年來(lái),科大訊飛在人工智能領(lǐng)域百花齊放,在基于深度學(xué)習(xí)的通用核心技術(shù)上厚積薄發(fā)。不僅在智能語(yǔ)音、機(jī)器翻譯等大眾熟悉的領(lǐng)域上在多項(xiàng)國(guó)際權(quán)威賽事上取得第一,實(shí)際上,科大訊飛在教育圖文、人臉識(shí)別等計(jì)算機(jī)視覺領(lǐng)域也深耕多年,擁有豐富的經(jīng)驗(yàn)和國(guó)際領(lǐng)先的技術(shù),并已運(yùn)用在教育、醫(yī)療、金融等多個(gè)行業(yè),取得耀眼成績(jī),獲得良好口碑。
未來(lái),科大訊飛將繼續(xù)堅(jiān)持源頭技術(shù)創(chuàng)新路線,秉持“頂天立地”的理念,加快開放應(yīng)用場(chǎng)景,促進(jìn)AI技術(shù)和各種應(yīng)用場(chǎng)景相結(jié)合,加速人工智能技術(shù)落地,建設(shè)美好世界。(通訊員:科大訊飛集團(tuán) 李倩)
特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國(guó)內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 站長(zhǎng)必讀:從“流量思維”到“IP思維”的品牌升級(jí)之路
- 從流量變現(xiàn)到信任變現(xiàn):個(gè)人站長(zhǎng)的私域運(yùn)營(yíng)方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個(gè)人站長(zhǎng)如何用AI工具實(shí)現(xiàn)“一人公司”
- 個(gè)人站長(zhǎng)消亡論?從“消失”到“重生”的三大破局路徑
- raksmart法蘭克福云服務(wù)器延遲高嗎?