“我們想進(jìn)一步把人和計(jì)算機(jī)聯(lián)系起來,就要對(duì)人的自然語(yǔ)言進(jìn)行處理,所以我對(duì)自然語(yǔ)言處理產(chǎn)生了興趣。”“If we want to further connect human and the computer, we’ll have to deal with our natural language first. So I was interested in NLP.”在國(guó)際會(huì)議上,翻譯并不少見,然而如果說這個(gè)翻譯不是人類,而是一個(gè)機(jī)器人呢?在7月29日ACL(計(jì)算語(yǔ)言學(xué)國(guó)際年會(huì))上,來自百度的智能機(jī)器人“小度”擔(dān)任了ACL首位華人終身成就獎(jiǎng)獲獎(jiǎng)?wù)呃钌淌诘?ldquo;神秘嘉賓”,在上千位觀眾面前展現(xiàn)了擬真人同聲傳譯的翻譯能力。
ACL年會(huì)是自然語(yǔ)言處理領(lǐng)域最頂級(jí)的國(guó)際會(huì)議,今年首次亮相中國(guó)內(nèi)地,匯集了上千位自然語(yǔ)言處理領(lǐng)域的國(guó)內(nèi)外知名學(xué)者,以及百度、谷歌、微軟、三星等多個(gè)科技企業(yè),是一屆業(yè)界前沿技術(shù)交流研討的盛會(huì)。

在7月29日ACL年會(huì)上,中國(guó)中文信息學(xué)會(huì)理事長(zhǎng)李生教授憑借幾十年來在機(jī)器翻譯等方向上的杰出成就和貢獻(xiàn),獲ACL終生成就獎(jiǎng),成為了世界上首位獲得該獎(jiǎng)項(xiàng)的中國(guó)科學(xué)家。在李生教授與臺(tái)下嘉賓的問答環(huán)節(jié)里,小度機(jī)器人作為機(jī)器翻譯成果的展示,承擔(dān)了“同聲傳譯”的職責(zé),現(xiàn)場(chǎng)將李生教授的中文回答翻譯成英文。對(duì)語(yǔ)義的理解以及準(zhǔn)確流暢的翻譯,令小度機(jī)器人驚艷全場(chǎng)。

百度一直在機(jī)器翻譯、語(yǔ)音識(shí)別、深度問答等多個(gè)人工智能領(lǐng)域進(jìn)行探索和布局,而小度機(jī)器人則被視為百度在人工智能領(lǐng)域的探索先鋒。此前,在第十屆中國(guó)電子信息技術(shù)年會(huì)上,百度更將機(jī)器翻譯與語(yǔ)音識(shí)別完美結(jié)合,令小度機(jī)器人成功實(shí)現(xiàn)了中、英、日、韓多語(yǔ)實(shí)時(shí)翻譯,獲得多位人工智能、計(jì)算機(jī)翻譯領(lǐng)域海外知名學(xué)者的好評(píng)。
此番小度驚艷亮相的機(jī)器翻譯技術(shù),一直被公認(rèn)為是人工智能領(lǐng)域最難攻克的問題之一。機(jī)器翻譯顧名思義就是要讓機(jī)器實(shí)現(xiàn)跨語(yǔ)言翻譯的功能,人類語(yǔ)言自身的復(fù)雜性以及不同語(yǔ)言之間的差異性決定了機(jī)器翻譯問題的難度。據(jù)悉,今年百度機(jī)器翻譯項(xiàng)目在海量翻譯知識(shí)獲取、翻譯模型、多語(yǔ)種翻譯技術(shù)等方面取得最新突破,解決了傳統(tǒng)方法研發(fā)成本高、周期長(zhǎng)、質(zhì)量低的問題。通過海量自然語(yǔ)言語(yǔ)料庫(kù),讓機(jī)器自動(dòng)學(xué)習(xí)理解不同單詞、短語(yǔ)和句式,然后進(jìn)一步優(yōu)化自身系統(tǒng),并突破了“消歧”和“調(diào)序”等難題;基于互聯(lián)網(wǎng)大數(shù)據(jù)的翻譯模型,實(shí)時(shí)準(zhǔn)確地響應(yīng)多文體、多領(lǐng)域的復(fù)雜翻譯請(qǐng)求;基于樞軸語(yǔ)言的翻譯技術(shù),使得資源非常稀缺的小語(yǔ)種翻譯成為可能,且實(shí)現(xiàn)了多語(yǔ)種翻譯的快速部署。
此外,小度機(jī)器人的翻譯能力還依賴百度研發(fā)的基于深度學(xué)習(xí)的翻譯模型。百度利用海量網(wǎng)頁(yè)庫(kù)資源,挖掘了數(shù)以億計(jì)的雙語(yǔ)句對(duì),作為模型訓(xùn)練的數(shù)據(jù)。這個(gè)數(shù)據(jù)規(guī)模如果按照字?jǐn)?shù)換算成《大英百科全書》,翻譯系統(tǒng)在一周內(nèi)學(xué)習(xí)的內(nèi)容相當(dāng)于千萬(wàn)部《大英百科全書》。機(jī)器實(shí)現(xiàn)了類似人腦“理解語(yǔ)言,生成譯文”的思維過程,相比之前的翻譯技術(shù),如今的譯文更流暢,翻譯質(zhì)量有了“躍進(jìn)式”提升。
ACL首位華人主席、百度技術(shù)副總裁王海峰博士表示:“搜索的本質(zhì)就是連接人與信息、人與服務(wù)。機(jī)器翻譯能更好地把人和多語(yǔ)言的信息和服務(wù)連接起來,采用機(jī)器翻譯技術(shù)自動(dòng)實(shí)現(xiàn)語(yǔ)言之間翻譯是人工智能的終極目標(biāo)之一。過去幾年里,我們?nèi)〉昧艘幌盗谢诨ヂ?lián)網(wǎng)大數(shù)據(jù)的機(jī)器翻譯關(guān)鍵技術(shù)突破,相信不久的未來,機(jī)器翻譯產(chǎn)生巨大的產(chǎn)業(yè)價(jià)值,幫助人類破除語(yǔ)言壁壘,實(shí)現(xiàn)無障礙的信息獲取和交流。”而李生教授進(jìn)行獲獎(jiǎng)演講時(shí),也表示出對(duì)機(jī)器翻譯發(fā)展前景的堅(jiān)定信念:“我們一代人接著一代人的努力,相信機(jī)器翻譯的目標(biāo)、甚至讓計(jì)算機(jī)真正理解語(yǔ)言的夢(mèng)想就終究會(huì)實(shí)現(xiàn)。”
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國(guó)內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- 站長(zhǎng)必讀:從“流量思維”到“IP思維”的品牌升級(jí)之路
- 從流量變現(xiàn)到信任變現(xiàn):個(gè)人站長(zhǎng)的私域運(yùn)營(yíng)方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個(gè)人站長(zhǎng)如何用AI工具實(shí)現(xiàn)“一人公司”
- 個(gè)人站長(zhǎng)消亡論?從“消失”到“重生”的三大破局路徑