欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長(zhǎng)資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          距終極夢(mèng)想更近一步!百度全新PLATO-2展現(xiàn)開(kāi)放話題人機(jī)嗨聊新高度

           

            人與機(jī)器在開(kāi)放領(lǐng)域自由對(duì)話這一終極理想,又迎來(lái)重大進(jìn)展。近日,百度全新發(fā)布了超大規(guī)模模型PLATO-2,在承襲PLATO模型運(yùn)用隱變量進(jìn)行多樣化回復(fù)生成特性外,模型參數(shù)規(guī)模上升到16億!能夠就開(kāi)放話題和人類(lèi)流暢嗨聊。在對(duì)話演示中,PLATO不僅能深聊“去吧去吧,學(xué)會(huì)了游泳帶我一起”,還會(huì)小腹黑“你不怕我把你扔河里么?”,朱朝陽(yáng)看了都直呼專(zhuān)業(yè)。

            這樣的優(yōu)秀效果同樣反映在公開(kāi)數(shù)據(jù)集的測(cè)試中,評(píng)估結(jié)果顯示百度PLATO-2的對(duì)話效果全面超越了今年谷歌發(fā)布的26億參數(shù)模型Meena,以及Facebook發(fā)布的27億參數(shù)模型Blender,以更少樣本達(dá)成了更優(yōu)的效果。而在中文對(duì)話中,更是與微軟小冰拉開(kāi)了極大差距,這無(wú)疑意味著百度PLATO-2將對(duì)話智能提升到了全新高度。

          距終極夢(mèng)想更近一步!百度全新PLATO-2展現(xiàn)開(kāi)放話題人機(jī)嗨聊新高度

            左圖為PLATO-2中文對(duì)話演示,右圖為《隱秘的角落》劇照

            如今,智能對(duì)話正以肉眼可見(jiàn)的速度成為人們熱愛(ài)談?wù)摰脑掝},不管是《向往的生活》里的國(guó)民機(jī)靈鬼小度,或者是手機(jī)里隨叫隨到的“hi,siri!”,我們?cè)絹?lái)越習(xí)慣以語(yǔ)言來(lái)和機(jī)器進(jìn)行溝通。但不論是家庭、或是手機(jī)端,當(dāng)下有明確功能性的智能助手對(duì)比真正能與人類(lèi)在開(kāi)放話題中自由對(duì)話仍然有差距。

            針對(duì)這一問(wèn)題,近年來(lái),基于大量語(yǔ)料和超大規(guī)模預(yù)訓(xùn)練模型的對(duì)話生成技術(shù)取得了非常多喜人進(jìn)展,如谷歌Meena、Facebook Blender等模型依托數(shù)十億級(jí)的參數(shù)和語(yǔ)料,已能模擬生成與人類(lèi)非常相近的對(duì)話。

          距終極夢(mèng)想更近一步!百度全新PLATO-2展現(xiàn)開(kāi)放話題人機(jī)嗨聊新高度

            但是,龐大的對(duì)話語(yǔ)料下隱藏著豐富的信息,同樣的對(duì)話語(yǔ)境可以有多種不同的回復(fù),這樣“一對(duì)多”問(wèn)題是當(dāng)前對(duì)話系統(tǒng)面臨的一個(gè)重要難點(diǎn)。我們知道,人與人的對(duì)話不僅與上下文相關(guān),也和背景知識(shí)相關(guān),不論是個(gè)人屬性、知識(shí)背景、或是價(jià)值觀、情緒狀態(tài)等。但每段對(duì)話背后,對(duì)話者的背景知識(shí)是模型訓(xùn)練中難以獲取的,這就給訓(xùn)練帶來(lái)了很大噪音。如谷歌Meena、臉書(shū)B(niǎo)lender等一般的編碼-解碼神經(jīng)網(wǎng)絡(luò)不論結(jié)構(gòu)多復(fù)雜,仍然是一個(gè)“一對(duì)一”的函數(shù),直接應(yīng)用很容易產(chǎn)生大量“哈哈,不知道”這類(lèi)的安全回復(fù)。

            針對(duì)這一問(wèn)題,百度去年發(fā)布的PLATO模型和微軟近期發(fā)布的OPTIMUS模型中都提到了運(yùn)用隱變量來(lái)建模這種不可見(jiàn)多樣性的方法。百度PLATO更獨(dú)特地采用了離散隱變量建模,運(yùn)用多樣化生成 + 合適度判斷的方式,在三個(gè)不同各類(lèi)型的公開(kāi)數(shù)據(jù)集上均取得了SOTA效果。

            此次公布的PLATO-2, 是百度在PLATO工作基礎(chǔ)上的進(jìn)一步擴(kuò)展,通過(guò)擴(kuò)展網(wǎng)絡(luò)增加訓(xùn)練數(shù)據(jù)集,模型的參數(shù)規(guī)模擴(kuò)展到了16億。同時(shí),PLATO采取了課程學(xué)習(xí)的方法,解決大規(guī)模參數(shù)隱變量網(wǎng)絡(luò)訓(xùn)練的計(jì)算消耗問(wèn)題,逐步優(yōu)化參數(shù)、加快訓(xùn)練效率。

          距終極夢(mèng)想更近一步!百度全新PLATO-2展現(xiàn)開(kāi)放話題人機(jī)嗨聊新高度

            PLATO-2模型結(jié)構(gòu)簡(jiǎn)圖

            這樣大體量的模型訓(xùn)練,離不開(kāi)百度深度學(xué)習(xí)平臺(tái)飛槳強(qiáng)大的并行能力支持。PLATO-2包含中英文兩部分模型。其中,中文模型在12億中文開(kāi)放域多輪對(duì)話數(shù)據(jù)集上進(jìn)行訓(xùn)練,而英文模型則在7億英文開(kāi)放域多輪數(shù)據(jù)集上訓(xùn)練。PLATO-2訓(xùn)練耗費(fèi)了64張V100卡共3周的時(shí)間,依托了飛槳強(qiáng)大并行能力,包括Fleet并行庫(kù)和Recompute等擴(kuò)展顯存的方式。單個(gè)Batch包含52萬(wàn)Token,訓(xùn)練過(guò)程中約進(jìn)行了30萬(wàn)次梯度回傳。

            為了驗(yàn)證模型效果,百度對(duì)PLATO-2進(jìn)行了全面的靜態(tài)和動(dòng)態(tài)評(píng)估。靜態(tài)評(píng)估為利用現(xiàn)有對(duì)話從上文預(yù)測(cè)下文,以及人機(jī)對(duì)話、兩個(gè)模型相互對(duì)話形式的中英文動(dòng)態(tài)評(píng)估。評(píng)測(cè)結(jié)果顯示,百度PLATO在動(dòng)態(tài)和靜態(tài)評(píng)估中均明顯超越了微軟DialoGPT, 谷歌Meena和Facebook Blender模型。更在中文上,與微軟小冰在連貫性、信息量、吸引力、人性化

            等維度拉開(kāi)了極大的差距。

            在對(duì)話演示中,也可以明顯看出PLATO不僅在對(duì)話內(nèi)容豐富度上提升明顯,還能夠就一個(gè)話題深入聊天并擴(kuò)展到相關(guān)話題。而此前的最佳模型Blender,則會(huì)頻繁地轉(zhuǎn)換話題。

          距終極夢(mèng)想更近一步!百度全新PLATO-2展現(xiàn)開(kāi)放話題人機(jī)嗨聊新高度

            PLATO-2英文對(duì)話演示和Blender使用相同對(duì)話種子對(duì)比

            基于PLATO-2在對(duì)話內(nèi)容的豐富度和連貫性上展現(xiàn)出了來(lái)的高度,有望為智能對(duì)話開(kāi)辟出全新的領(lǐng)域。此外,百度POLATO-2相關(guān)英文模型和代碼將在Github中陸續(xù)開(kāi)放,中文模型未來(lái)也將開(kāi)放接口服務(wù)。也期待在全球領(lǐng)軍AI企業(yè)的共同努力下,我們將離人機(jī)自由對(duì)話的終極夢(mèng)想更近一步。

            更多信息請(qǐng)參考:https://github.com/PaddlePaddle/Knover

          特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

          贊(0)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)