欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          科技巨頭們?yōu)槭裁慈绱丝是笳Z音數(shù)據(jù)?

          科技巨頭們?yōu)槭裁慈绱丝是笳Z音數(shù)據(jù)?
           

            亞馬遜Echo讓人工智能家庭助理走進現(xiàn)實。使用過Echo內(nèi)置的Alexa語音助理的用戶都會被她的魅力所折服:“她”不僅能打?qū)\?,還能叫外賣,甚至可以完成高一的數(shù)學(xué)家庭作業(yè)。亞馬遜甚至聲稱,每天有超過5000人對Alexa示愛。

            但與此同時,Alexa的用戶也都知道:除非你用緩慢的語速清晰地說出自己的指令,否則她很有可能對你說:“抱歉,我無法回答這個問題。”有一位用戶在亞馬遜網(wǎng)站上寫道:“我實在是對她又愛又恨。” 但這位用戶仍然給了Alexa五星好評。“你很快就會學(xué)會通過她能理解的方式與之溝通,就像跟剛會走路的孩子說話一樣。”

            語音識別在過去幾年實現(xiàn)了巨大進步,但仍不足以讓這項技術(shù)融入日常生活,開啟人機互動的新時代,讓我們與汽車、洗衣機、電視機等所有電子產(chǎn)品展開語音溝通。盡管語音識別已經(jīng)取得了長足進步,但多數(shù)人仍會沿用手勢操作和觸摸界面。在可預(yù)見的未來,這種趨勢恐怕難以改變。

            障礙究竟何在?一定程度上源于這種技術(shù)背后的人工智能仍有改進空間。數(shù)據(jù)缺乏也同樣也是一大問題——不同語言、不同口音、不同方言的語音數(shù)據(jù)尤其匱乏。倘若是在嘈雜的環(huán)境中,使用效果更是大打折扣。

          科技巨頭們?yōu)槭裁慈绱丝是笳Z音數(shù)據(jù)?

            谷歌智能家居中心Google Home

            所以,亞馬遜、蘋果、微軟和中國的百度都在世界范圍內(nèi)廣泛收集海量的人類語音數(shù)據(jù)。微軟已經(jīng)在多地建設(shè)了專門的部門,錄制志愿者在家居環(huán)境中的對話內(nèi)容。亞馬遜每個小時都會將Alexa收到的海量語音請求上傳到龐大的數(shù)據(jù)庫。百度也在中國各地收集方言數(shù)據(jù)。在此之后,他們都會利用這些數(shù)據(jù)教給電腦如何分析、理解、響應(yīng)不同的語音指令和語音請求。

            真正的挑戰(zhàn)在于尋找一種方式來捕捉自然狀態(tài)下的真實對話。百度加州桑尼韋爾人工實驗室負責(zé)人亞當(dāng)·科茨(Adam Coates)表示,就算是95%的準確率也不足以滿足人們的需求。“我們的目標(biāo)是將錯誤率降低到1%。”他說,“只有達到這種水平,我們才能相信機器能夠理解我們的話。這將是革命性的。”

            不久以前,語音識別還非常粗糙。在2006年的一次演示中,微軟早期在Windows中配備的一項技術(shù)甚至把“mom”聽成了“aunt”。當(dāng)蘋果五年前推出Siri時,這款個人助理同樣因為無法返回正確答案或聽不清問題而備受嘲笑。在被問及吉莉安·安德森(Gillian Anderson)是不是英國人時,Siri竟然給出了一份英國餐館的列表。

            微軟現(xiàn)在表示,該公司的語音引擎錯誤率甚至可以媲美專業(yè)速錄員。Siri也勉強獲得了人們的尊重,Alexa更是讓我們窺見了未來。

            這種進步很大程度上歸功于神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,這是一種模擬人腦結(jié)構(gòu)的人工智能技術(shù). 神經(jīng)網(wǎng)絡(luò)無需明確的指令便可自學(xué)各種內(nèi)容,但通常需要輔以龐大而多樣的數(shù)據(jù)。語音識別引擎獲得的數(shù)據(jù)越多,就越能理解不同的聲音,也就更加接近在眾多語言環(huán)境中實現(xiàn)自然對話的目標(biāo)。

            正因如此,科技巨頭才爭相在世界各地收集不同的語音數(shù)據(jù)。“我們的系統(tǒng)獲得的數(shù)據(jù)越多,表現(xiàn)就越好。”百度首席科學(xué)家吳恩達說,“正因如此,語音識別才是一項資本密集型業(yè)務(wù)。沒有多少組織擁有如此龐大的數(shù)據(jù)。”

            高科技行業(yè)20世紀90年代開始重視語音識別技術(shù)時,微軟等公司依靠的都是來自Linguistics Data Consortium等研究機構(gòu)提供的公共數(shù)據(jù)——這個創(chuàng)立于1992年的語音和文本數(shù)據(jù)庫獲得了美國政府的支持,總部位于美國賓夕法尼亞大學(xué)。

            后來,科技公司開始收集自己的語音數(shù)據(jù),其中一些來自志愿者朗讀的各種內(nèi)容?,F(xiàn)在,隨著語音控制軟件逐步受到人們歡迎,他們也通過自己的產(chǎn)品和服務(wù)收集了很多數(shù)據(jù)。

            當(dāng)你讓自己的手機搜索信息、播放歌曲或?qū)Ш铰窂綍r,這些內(nèi)容很可能會被某家公司錄制下來。當(dāng)你向Alexa詢問天氣和最近的橄欖球賽比分時,她便會利用這些內(nèi)容改進其自然語言理解能力(盡管在你叫她的名字之前,Alexa不會傾聽你的對話。)“根據(jù)產(chǎn)品設(shè)計,你使用得越多,Alexa就越聰明。”Alexa資深首席科學(xué)家尼克·斯特羅姆(Nikko Strom)說。

          科技巨頭們?yōu)槭裁慈绱丝是笳Z音數(shù)據(jù)?

            亞馬遜Echo智能音箱

            其中的關(guān)鍵挑戰(zhàn)是讓這項技術(shù)熟悉不同的語言、口音和方言。這一點在中國體現(xiàn)得尤為明顯。為了收集中國各地的方言數(shù)據(jù),百度在今年春節(jié)期間啟動的一項營銷計劃,推出了方言對話項目。該公司向用戶承諾,如果他們?yōu)樵擁椖孔鞒鲐暙I,今后便可使用自己的方言與百度展開互動。短短兩周內(nèi),該公司就錄制了超過1000小時的方言數(shù)據(jù)。很多人完全免費提供這些數(shù)據(jù),因為他們都對自己的方言感到自豪。一位四川的高中教師對該項目十分熱衷,他甚至讓全班同學(xué)用四川話錄制了1000多首古詩。

            另外一大挑戰(zhàn)是讓語音識別技術(shù)在嘈雜的環(huán)境中識別語音指令——包括酒吧和體育場等人聲鼎沸的環(huán)境。微軟也在Xbox上部署了一款名為Voice Studio的應(yīng)用,專門收集人們在玩游戲或看電影時的對話信息。為了吸引用戶貢獻自己在玩游戲過程中的對話內(nèi)容,該公司為參與其中的用戶提供了各種各樣的獎勵,包括點卡和游戲道具。該項目在巴西展開了大力推廣,當(dāng)?shù)貓F隊還在Xbox主頁上著重推廣這款應(yīng)用。他們隨后利用這些數(shù)據(jù)開發(fā)了巴西葡萄牙語版的Cortana語音助理,并于今年早些時候發(fā)布。

            各路企業(yè)還在為特定的環(huán)境設(shè)計語音識別系統(tǒng)。微軟一直在測試一項技術(shù),以便在不受機場廣播信息干擾的情況下回答旅行者的問題。該公司的技術(shù)還被用于麥當(dāng)勞汽車穿梭餐廳的自動點餐系統(tǒng)。這套系統(tǒng)可以忽略嘈雜的汽車音響、孩子們的叫聲和各種各樣的口頭語,從中提取出復(fù)雜的指令,甚至連調(diào)味品也不會錯過。亞馬遜也在汽車上展開測試,希望Alexa能夠適應(yīng)道路上的各種噪音。

            在各大企業(yè)爭相收集數(shù)據(jù)的過程中,他們也在努力改進技術(shù),希望利用更少的數(shù)據(jù)實現(xiàn)更好的語音識別效果。微軟首席語音科學(xué)家黃雪冬已經(jīng)在該公司從事了20多年的語音識別技術(shù)開發(fā)工作,他表示,麥當(dāng)勞正在測試的技術(shù)比其他系統(tǒng)更加精確,但使用的數(shù)據(jù)卻更少。“即便數(shù)據(jù)量不是最大的,仍然可以實現(xiàn)技術(shù)突破。”

            谷歌向來信仰“少即是多”的理念,因此該公司開發(fā)了一種技術(shù),希望利用不知所云的聲音來構(gòu)建文字和短語。借助該公司的語音識別系統(tǒng),他們希望通過一項改變來解決各種不同的問題。谷歌拼接了數(shù)萬段時長僅有2至5秒的語音片段。該公司研究員弗朗索瓦茲·比倫法斯(Francoise Beaufays)表示,這一過程所需的計算資源更少,但卻更容易測試和修改。

            百度也在開發(fā)更加高效的算法,只需學(xué)習(xí)一種語言便可簡化另外12種語言的學(xué)習(xí)難度。在學(xué)習(xí)只有數(shù)萬人掌握的語種時,這種技術(shù)顯得至關(guān)重要——因為很難針對這樣的語言收集龐大的數(shù)據(jù)。

            在被問及何時才能通過自然語言與數(shù)字助理交流,并得到滿意的答案時,就連吳恩達這樣的頂尖科學(xué)家也無法給出確切答案。即便是對最高水平的神經(jīng)網(wǎng)絡(luò)學(xué)家而言,這項技術(shù)仍然有很多謎團有待解開。有很多工作只能通過不斷試錯來改進,沒有人敢保證某項技術(shù)調(diào)整可能產(chǎn)生什么樣的后果。根據(jù)現(xiàn)有的技術(shù)和方法,這一過程大約要耗費數(shù)年時間。

            但吳恩達、黃雪冬和比倫法斯等科學(xué)家都表示,我們永遠無法知道何時能夠?qū)崿F(xiàn)突破,何時能讓Alexa和Siri與人類展開真正的對話。

          特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

          贊(0)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號