欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長(zhǎng)資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          科技巨頭們?yōu)槭裁慈绱丝是笳Z(yǔ)音數(shù)據(jù)?

          科技巨頭們?yōu)槭裁慈绱丝是笳Z(yǔ)音數(shù)據(jù)?
           

            亞馬遜Echo讓人工智能家庭助理走進(jìn)現(xiàn)實(shí)。使用過(guò)Echo內(nèi)置的Alexa語(yǔ)音助理的用戶都會(huì)被她的魅力所折服:“她”不僅能打?qū)\?,還能叫外賣,甚至可以完成高一的數(shù)學(xué)家庭作業(yè)。亞馬遜甚至聲稱,每天有超過(guò)5000人對(duì)Alexa示愛。

            但與此同時(shí),Alexa的用戶也都知道:除非你用緩慢的語(yǔ)速清晰地說(shuō)出自己的指令,否則她很有可能對(duì)你說(shuō):“抱歉,我無(wú)法回答這個(gè)問(wèn)題。”有一位用戶在亞馬遜網(wǎng)站上寫道:“我實(shí)在是對(duì)她又愛又恨。” 但這位用戶仍然給了Alexa五星好評(píng)。“你很快就會(huì)學(xué)會(huì)通過(guò)她能理解的方式與之溝通,就像跟剛會(huì)走路的孩子說(shuō)話一樣。”

            語(yǔ)音識(shí)別在過(guò)去幾年實(shí)現(xiàn)了巨大進(jìn)步,但仍不足以讓這項(xiàng)技術(shù)融入日常生活,開啟人機(jī)互動(dòng)的新時(shí)代,讓我們與汽車、洗衣機(jī)、電視機(jī)等所有電子產(chǎn)品展開語(yǔ)音溝通。盡管語(yǔ)音識(shí)別已經(jīng)取得了長(zhǎng)足進(jìn)步,但多數(shù)人仍會(huì)沿用手勢(shì)操作和觸摸界面。在可預(yù)見的未來(lái),這種趨勢(shì)恐怕難以改變。

            障礙究竟何在?一定程度上源于這種技術(shù)背后的人工智能仍有改進(jìn)空間。數(shù)據(jù)缺乏也同樣也是一大問(wèn)題——不同語(yǔ)言、不同口音、不同方言的語(yǔ)音數(shù)據(jù)尤其匱乏。倘若是在嘈雜的環(huán)境中,使用效果更是大打折扣。

          科技巨頭們?yōu)槭裁慈绱丝是笳Z(yǔ)音數(shù)據(jù)?

            谷歌智能家居中心Google Home

            所以,亞馬遜、蘋果、微軟和中國(guó)的百度都在世界范圍內(nèi)廣泛收集海量的人類語(yǔ)音數(shù)據(jù)。微軟已經(jīng)在多地建設(shè)了專門的部門,錄制志愿者在家居環(huán)境中的對(duì)話內(nèi)容。亞馬遜每個(gè)小時(shí)都會(huì)將Alexa收到的海量語(yǔ)音請(qǐng)求上傳到龐大的數(shù)據(jù)庫(kù)。百度也在中國(guó)各地收集方言數(shù)據(jù)。在此之后,他們都會(huì)利用這些數(shù)據(jù)教給電腦如何分析、理解、響應(yīng)不同的語(yǔ)音指令和語(yǔ)音請(qǐng)求。

            真正的挑戰(zhàn)在于尋找一種方式來(lái)捕捉自然狀態(tài)下的真實(shí)對(duì)話。百度加州桑尼韋爾人工實(shí)驗(yàn)室負(fù)責(zé)人亞當(dāng)·科茨(Adam Coates)表示,就算是95%的準(zhǔn)確率也不足以滿足人們的需求。“我們的目標(biāo)是將錯(cuò)誤率降低到1%。”他說(shuō),“只有達(dá)到這種水平,我們才能相信機(jī)器能夠理解我們的話。這將是革命性的。”

            不久以前,語(yǔ)音識(shí)別還非常粗糙。在2006年的一次演示中,微軟早期在Windows中配備的一項(xiàng)技術(shù)甚至把“mom”聽成了“aunt”。當(dāng)蘋果五年前推出Siri時(shí),這款個(gè)人助理同樣因?yàn)闊o(wú)法返回正確答案或聽不清問(wèn)題而備受嘲笑。在被問(wèn)及吉莉安·安德森(Gillian Anderson)是不是英國(guó)人時(shí),Siri竟然給出了一份英國(guó)餐館的列表。

            微軟現(xiàn)在表示,該公司的語(yǔ)音引擎錯(cuò)誤率甚至可以媲美專業(yè)速錄員。Siri也勉強(qiáng)獲得了人們的尊重,Alexa更是讓我們窺見了未來(lái)。

            這種進(jìn)步很大程度上歸功于神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,這是一種模擬人腦結(jié)構(gòu)的人工智能技術(shù). 神經(jīng)網(wǎng)絡(luò)無(wú)需明確的指令便可自學(xué)各種內(nèi)容,但通常需要輔以龐大而多樣的數(shù)據(jù)。語(yǔ)音識(shí)別引擎獲得的數(shù)據(jù)越多,就越能理解不同的聲音,也就更加接近在眾多語(yǔ)言環(huán)境中實(shí)現(xiàn)自然對(duì)話的目標(biāo)。

            正因如此,科技巨頭才爭(zhēng)相在世界各地收集不同的語(yǔ)音數(shù)據(jù)。“我們的系統(tǒng)獲得的數(shù)據(jù)越多,表現(xiàn)就越好。”百度首席科學(xué)家吳恩達(dá)說(shuō),“正因如此,語(yǔ)音識(shí)別才是一項(xiàng)資本密集型業(yè)務(wù)。沒有多少組織擁有如此龐大的數(shù)據(jù)。”

            高科技行業(yè)20世紀(jì)90年代開始重視語(yǔ)音識(shí)別技術(shù)時(shí),微軟等公司依靠的都是來(lái)自Linguistics Data Consortium等研究機(jī)構(gòu)提供的公共數(shù)據(jù)——這個(gè)創(chuàng)立于1992年的語(yǔ)音和文本數(shù)據(jù)庫(kù)獲得了美國(guó)政府的支持,總部位于美國(guó)賓夕法尼亞大學(xué)。

            后來(lái),科技公司開始收集自己的語(yǔ)音數(shù)據(jù),其中一些來(lái)自志愿者朗讀的各種內(nèi)容?,F(xiàn)在,隨著語(yǔ)音控制軟件逐步受到人們歡迎,他們也通過(guò)自己的產(chǎn)品和服務(wù)收集了很多數(shù)據(jù)。

            當(dāng)你讓自己的手機(jī)搜索信息、播放歌曲或?qū)Ш铰窂綍r(shí),這些內(nèi)容很可能會(huì)被某家公司錄制下來(lái)。當(dāng)你向Alexa詢問(wèn)天氣和最近的橄欖球賽比分時(shí),她便會(huì)利用這些內(nèi)容改進(jìn)其自然語(yǔ)言理解能力(盡管在你叫她的名字之前,Alexa不會(huì)傾聽你的對(duì)話。)“根據(jù)產(chǎn)品設(shè)計(jì),你使用得越多,Alexa就越聰明。”Alexa資深首席科學(xué)家尼克·斯特羅姆(Nikko Strom)說(shuō)。

          科技巨頭們?yōu)槭裁慈绱丝是笳Z(yǔ)音數(shù)據(jù)?

            亞馬遜Echo智能音箱

            其中的關(guān)鍵挑戰(zhàn)是讓這項(xiàng)技術(shù)熟悉不同的語(yǔ)言、口音和方言。這一點(diǎn)在中國(guó)體現(xiàn)得尤為明顯。為了收集中國(guó)各地的方言數(shù)據(jù),百度在今年春節(jié)期間啟動(dòng)的一項(xiàng)營(yíng)銷計(jì)劃,推出了方言對(duì)話項(xiàng)目。該公司向用戶承諾,如果他們?yōu)樵擁?xiàng)目作出貢獻(xiàn),今后便可使用自己的方言與百度展開互動(dòng)。短短兩周內(nèi),該公司就錄制了超過(guò)1000小時(shí)的方言數(shù)據(jù)。很多人完全免費(fèi)提供這些數(shù)據(jù),因?yàn)樗麄兌紝?duì)自己的方言感到自豪。一位四川的高中教師對(duì)該項(xiàng)目十分熱衷,他甚至讓全班同學(xué)用四川話錄制了1000多首古詩(shī)。

            另外一大挑戰(zhàn)是讓語(yǔ)音識(shí)別技術(shù)在嘈雜的環(huán)境中識(shí)別語(yǔ)音指令——包括酒吧和體育場(chǎng)等人聲鼎沸的環(huán)境。微軟也在Xbox上部署了一款名為Voice Studio的應(yīng)用,專門收集人們?cè)谕嬗螒蚧蚩措娪皶r(shí)的對(duì)話信息。為了吸引用戶貢獻(xiàn)自己在玩游戲過(guò)程中的對(duì)話內(nèi)容,該公司為參與其中的用戶提供了各種各樣的獎(jiǎng)勵(lì),包括點(diǎn)卡和游戲道具。該項(xiàng)目在巴西展開了大力推廣,當(dāng)?shù)貓F(tuán)隊(duì)還在Xbox主頁(yè)上著重推廣這款應(yīng)用。他們隨后利用這些數(shù)據(jù)開發(fā)了巴西葡萄牙語(yǔ)版的Cortana語(yǔ)音助理,并于今年早些時(shí)候發(fā)布。

            各路企業(yè)還在為特定的環(huán)境設(shè)計(jì)語(yǔ)音識(shí)別系統(tǒng)。微軟一直在測(cè)試一項(xiàng)技術(shù),以便在不受機(jī)場(chǎng)廣播信息干擾的情況下回答旅行者的問(wèn)題。該公司的技術(shù)還被用于麥當(dāng)勞汽車穿梭餐廳的自動(dòng)點(diǎn)餐系統(tǒng)。這套系統(tǒng)可以忽略嘈雜的汽車音響、孩子們的叫聲和各種各樣的口頭語(yǔ),從中提取出復(fù)雜的指令,甚至連調(diào)味品也不會(huì)錯(cuò)過(guò)。亞馬遜也在汽車上展開測(cè)試,希望Alexa能夠適應(yīng)道路上的各種噪音。

            在各大企業(yè)爭(zhēng)相收集數(shù)據(jù)的過(guò)程中,他們也在努力改進(jìn)技術(shù),希望利用更少的數(shù)據(jù)實(shí)現(xiàn)更好的語(yǔ)音識(shí)別效果。微軟首席語(yǔ)音科學(xué)家黃雪冬已經(jīng)在該公司從事了20多年的語(yǔ)音識(shí)別技術(shù)開發(fā)工作,他表示,麥當(dāng)勞正在測(cè)試的技術(shù)比其他系統(tǒng)更加精確,但使用的數(shù)據(jù)卻更少。“即便數(shù)據(jù)量不是最大的,仍然可以實(shí)現(xiàn)技術(shù)突破。”

            谷歌向來(lái)信仰“少即是多”的理念,因此該公司開發(fā)了一種技術(shù),希望利用不知所云的聲音來(lái)構(gòu)建文字和短語(yǔ)。借助該公司的語(yǔ)音識(shí)別系統(tǒng),他們希望通過(guò)一項(xiàng)改變來(lái)解決各種不同的問(wèn)題。谷歌拼接了數(shù)萬(wàn)段時(shí)長(zhǎng)僅有2至5秒的語(yǔ)音片段。該公司研究員弗朗索瓦茲·比倫法斯(Francoise Beaufays)表示,這一過(guò)程所需的計(jì)算資源更少,但卻更容易測(cè)試和修改。

            百度也在開發(fā)更加高效的算法,只需學(xué)習(xí)一種語(yǔ)言便可簡(jiǎn)化另外12種語(yǔ)言的學(xué)習(xí)難度。在學(xué)習(xí)只有數(shù)萬(wàn)人掌握的語(yǔ)種時(shí),這種技術(shù)顯得至關(guān)重要——因?yàn)楹茈y針對(duì)這樣的語(yǔ)言收集龐大的數(shù)據(jù)。

            在被問(wèn)及何時(shí)才能通過(guò)自然語(yǔ)言與數(shù)字助理交流,并得到滿意的答案時(shí),就連吳恩達(dá)這樣的頂尖科學(xué)家也無(wú)法給出確切答案。即便是對(duì)最高水平的神經(jīng)網(wǎng)絡(luò)學(xué)家而言,這項(xiàng)技術(shù)仍然有很多謎團(tuán)有待解開。有很多工作只能通過(guò)不斷試錯(cuò)來(lái)改進(jìn),沒有人敢保證某項(xiàng)技術(shù)調(diào)整可能產(chǎn)生什么樣的后果。根據(jù)現(xiàn)有的技術(shù)和方法,這一過(guò)程大約要耗費(fèi)數(shù)年時(shí)間。

            但吳恩達(dá)、黃雪冬和比倫法斯等科學(xué)家都表示,我們永遠(yuǎn)無(wú)法知道何時(shí)能夠?qū)崿F(xiàn)突破,何時(shí)能讓Alexa和Siri與人類展開真正的對(duì)話。

          特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

          贊(0)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)