繼去年4月推出有道神經網絡翻譯,網易有道近日公布了又一AI大動作——推出離線神經網絡翻譯(離線NMT)以及離線文字識別(離線OCR)。
據悉,有道是目前國內為數不多能夠實現離線NMT和離線OCR的公司,并且能夠在離線的狀態(tài)下,保持高質量的翻譯和識別效果。該技術已于有道翻譯官等產品中上線,能夠實現高質量的離線拍照翻譯,更好地解決出國旅行的語言翻譯問題。
離線NMT,翻譯效果依然準確
一般而言,離線翻譯相對于在線翻譯,最大的問題就是質量不高。為了攻克這個難題,有道技術團隊在離線模型、訓練數據方面做了大量的針對性的優(yōu)化和調整,使得即使在沒有網絡的情況下,仍然能夠保證高質量的翻譯。
目前有道離線翻譯仍采用神經網絡翻譯模型,翻譯效果不僅高于在線SMT(統(tǒng)計機器翻譯),與同類競品的對比中,有道離線NMT翻譯質量處于領先。
以以下一段BBC news的一條新聞導語為例,原文是:
“More than a century ago, an antiquities dealer from Jerusalem claimed he had discovered an ancient version of the book of Deuteronomy. But was it a fake?”
通過有道離線NMT與其他離線NMT對其進行翻譯,對比顯示,有道離線NMT的翻譯結果更符合人類語言習慣,而且對于特殊地名、人名有道離線NMT也都能精準翻譯。

(有道與其他離線NMT翻譯結果對比.英譯中)
再以一段中文語料為例原文是:
“這幾年關于人工智能的討論不絕于耳。人們一邊早已習慣了種種“黑科技”對生活潛移默化的影響,一邊對讓世界翻天覆地的人工智能技術嘆為觀止。”
依然讓三款離線NMT進行翻譯,結果也顯示出,有道離線NMT的翻譯結果更加流暢、長短句斷句清晰、時態(tài)翻譯也更符合英文的語法習慣。

(有道與其他離線NMT翻譯結果對比.中譯英)
離線OCR識別 準確度堪比聯網效果
有道自主研發(fā)的文字識別OCR技術,是業(yè)內效果最好的文字識別技術之一,其對圖片中標準文字識別率達97%,對于圖片中特殊文字識別率也可達90%。

而有道近日推出的離線OCR,識別率依然很高,甚至由于在本地處理的優(yōu)勢,離線OCR識別速度比聯網更快,不到1秒就能完成。而且對于斜體、曲面、折疊等非平整的物體都能高質量識別,所支持的種類也達十幾種,包括中英繁、日韓、拉丁語(葡萄牙、意大利、西班牙、法語、羅馬尼亞、波蘭)、俄語、荷蘭、德語、挪威、丹麥、印地語等。
而離線NMT及OCR的推出,也第一時間應用在了有道旗下產品中,例如有道翻譯官的離線拍照翻譯功能,在即使沒有網絡的情況下,依然實現高質量的拍譯效果。而該功能的使用場景十分廣泛,例如不少國人出國旅游都會遇到網絡不穩(wěn)定或者沒有網絡的情況,利用有道翻譯官離線拍照翻譯,就能很好的解決這一問題。

有道翻譯官離線拍照翻譯(曲面物體及日文)

有道翻譯官拍照翻譯(傾斜角度)
有道是國內最早進入機器翻譯領域的公司,十年來一直聚焦中文與其他語言之間的翻譯,通過不斷提升機器翻譯的質量,為用戶帶來高質量的翻譯體驗。自去年4月,有道神經網絡翻譯上線后,其帶來的翻譯質量提升是過去十年的總和。
目前,包括有道NMT、有道離線NMT、有道OCR、有道離線OCR在內的多項業(yè)內領先的技術均已在有道智云平臺上線,開放給第三方合作伙伴;包括支付寶、微信、360、掌閱、網易郵箱、華為榮耀Magic手機、今日頭條海外版、智聯招聘等在內的產品和公司,都已經和有道智云展開了深入的合作。
特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。