欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          超越Siri、Google Now?百度語音合成大咖要教機器真正“說人話”

            “我們?yōu)槭裁匆稣Z音合成?剛才也提到了,讓機器說話是人類千百年來的夢想;而對于一些特殊群體,他們的受教育程度等問題造成了他們獲取現(xiàn)代信息的障礙。如果我們給他們直接提供更自然的語音內(nèi)容,可以改善他們不能平等享受信息的現(xiàn)狀。”7月26日,負責百度語音合成系統(tǒng)開發(fā)工作的李秀林在第52期百度技術沙龍上說。

            語音合成也被稱為文語轉(zhuǎn)換,是將文本轉(zhuǎn)換成語音的一種技術。在日常生活中,我們已經(jīng)用到很多使用語音合成技術的產(chǎn)品,例如汽車導航內(nèi)嵌了語音系統(tǒng)、智能手機的語音助手、讀書軟件等等,這些應用的實現(xiàn)都離不開語音合成。而如今非常火爆的可穿戴智能設備,也為語音技術提供了嶄新的實用空間。本期的百度技術沙龍,李秀林與大家分享了百度在語音合成技術方面的話題和研發(fā)成果。

            在充滿創(chuàng)新能量的中關村創(chuàng)業(yè)大街,每月舉辦的百度技術沙龍成為眾多開發(fā)者和技術愛好者們學習、交流、碰撞思維、開拓眼界的最佳平臺,而來自百度的嘉賓講師所帶來的最前沿技術分享往往成為活動的亮點。

          超越Siri、Google Now?百度語音合成大咖要教機器真正“說人話”

            負責百度語音合成系統(tǒng)開發(fā)工作的李秀林說:“千百年來人們一直在期待著機器能夠開口說話,這就是語音合成。”

            百度語音合成:“折衷”的藝術

            2013年初,百度就開始進行語音合成技術的研究,歷經(jīng)一年左右的時間,2014年4月份,百度語音合成正式通過開放平臺對外開放;2014年7月,語音合成技術也成功地應用于百度搜索框這個重量級的應用。

            “作為國內(nèi)搜索行業(yè)的領導者,百度在大數(shù)據(jù)積累、自然語言處理方面有著深厚的底蘊,但在語音合成技術的研發(fā)過程中,挑戰(zhàn)仍層出不窮,而不同層面的折衷處理也是技術攻關的難點所在。”李秀林表示。

            基于中文發(fā)音的語音合成一直是業(yè)內(nèi)技術難點,而針對觀眾所提出的使用HMM框架是否會導致語音合成質(zhì)量下降的問題,李秀林老師也給出了答案。

            據(jù)他介紹,中文語音合成需處理多達1400多個帶調(diào)的音節(jié),每個音節(jié)的前后音連、調(diào)連等不同語境又衍生出數(shù)百萬的上下文情況。對此,百度靈活應用了語音學和語言學的知識,對上下文情境進行適當分類,縮小特征空間。以聲母的分類為例,根據(jù)發(fā)音方法和發(fā)音位置的不同,聲母的類型可以被從二十幾個壓縮到十幾個甚至幾個的規(guī)模。

            在開發(fā)過程中,百度語音合成系統(tǒng)采用了聲母和韻母作為基本的單元,有效減小了單元量,并借此進一步壓縮特征空間的大小。在此基礎上,錄音語料、錄音規(guī)模跟發(fā)音者之間、模型訓練的充分性與可拓展性之間、主觀感知與聲學參數(shù)之間的折衷處理也獲得了更大的操作空間。

            “折衷,其實不是對付做一個(語音合成系統(tǒng))就可以了;折衷的目標是為了讓語音合成的表現(xiàn)更加卓越。”李秀林說。

            擁抱開發(fā)者,百度語音全面開放

            2014年4月份,百度語音合成正式通過語音開放平臺,向開發(fā)者免費開放,開發(fā)者可以通過網(wǎng)站獲得相關的技術文檔和開發(fā)資料,并以此為基礎更加輕松地開發(fā)含有對話系統(tǒng)或者是閱讀信息系統(tǒng)的應用。

            “開發(fā)者只需要下載SDK,在自己的APP里面用相關的接口,百度的在線系統(tǒng)即可幫助開發(fā)者管理數(shù)據(jù)、機器、網(wǎng)絡等等一系列的問題,開發(fā)者可以把精力集中在自己想要展現(xiàn)的功能上。”李秀林說。

            在2013年10月月正式向開發(fā)者開放后,百度語音平臺已經(jīng)吸引了包括陌陌、去哪兒、國航等大批移動應用使用。百度語音開放平臺提供的一整套完備的解決方案,讓每一位開發(fā)者都能以最低的成本將最先進的語音合成與識別技術整合進自己的產(chǎn)品中。

            百度語音合成系統(tǒng)的前端是基于海量語料的自然語言理解技術,實現(xiàn)智能分詞、高精度的多音字處理、準確的韻律層級預測。利用數(shù)萬句話的精加工語音庫,通過采用HMM框架和問題集優(yōu)化,得到了既穩(wěn)健、又有一定表現(xiàn)力的聲學模型。最后,經(jīng)過快速單元預選,多層次的代價優(yōu)化,選出最合適的單元進行拼接。對于開發(fā)者來說,百度語音開放平臺為他們的應用帶來了更豐富的應用場景和更開闊的想象空間。

            “百度的使命就是讓人們更平等便捷地獲取信息找到所求;通過語音合成技術,我們可以讓信息更符合用戶所求。”李秀林說。

            據(jù)了解,百度技術沙龍是國內(nèi)互聯(lián)網(wǎng)界最早的技術開放交流活動,由百度組織策劃,至今已經(jīng)持續(xù)舉辦4年。百度技術沙龍致力于以“技術開放”的心態(tài),分享行業(yè)領先的技術理念和技術實踐。目前,百度技術沙龍已經(jīng)成為互聯(lián)網(wǎng)行業(yè)中高端技術人員的精神家園,有效推動國內(nèi)互聯(lián)網(wǎng)的技術發(fā)展與行業(yè)創(chuàng)新。?

          特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內(nèi)容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

          贊(0)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號