谷歌神經網絡翻譯是如何煉成的?
時間:2017-09-29 14:22 來源:未知 作者:dongli 點擊:次
中國互聯網協會主辦的2017中國互聯網大會在北京北京舉行。會上,谷歌翻譯研發科學家高勤發表了《利用機器學習消除語言障礙》 的演講,闡述了谷歌神經網絡翻譯背后的技術以及未來研發的方向。
世聯翻譯-讓世界自由溝通!專業的全球語言翻譯供應商,上海翻譯公司專業品牌。絲路沿線56種語言一站式翻譯與技術解決方案,專業英語翻譯、日語翻譯等文檔翻譯、同傳口譯、視頻翻譯、出國外派服務,加速您的全球交付。
世聯翻譯公司在北京、上海、深圳等國際交往城市設有翻譯基地,業務覆蓋全國城市。每天有近百萬字節的信息和貿易通過世聯走向全球!積累了大量政商用戶數據,翻譯人才庫數據,多語種語料庫大數據。世聯品牌和服務品質已得到政務防務和國際組織、跨國公司和大中型企業等近萬用戶的認可。全球僅20%的人能看懂英文,谷歌翻譯支持100種語言翻譯 據悉,谷歌翻譯在2006年就已經推出,經過11年的發展已經支持超過100種語言的翻譯,覆蓋世界99%的網民。據高勤透露,谷歌翻譯每天提供超過10億次的翻譯,月度活躍用戶超過10億人次,其中95%來自于美國以外地區。 目前,谷歌翻譯支持手機攝像頭識別即時翻譯,手機麥克風和揚聲器即時對話翻譯,離線翻譯等等。 高勤在會上解釋了谷歌翻譯服務推出的原因,“今天全世界互聯網內容中英文占到了50%。與此同時僅有20%的人口能夠看懂英文。可以說對于世界上大多數的人來說互聯網上的大部分內容是與他們絕緣的。” 神經網絡翻譯初露鋒芒,已堪比非專業人工翻譯 而谷歌翻譯質量的大幅提升則得益于神經網絡翻譯的發展。據悉,谷歌的神經網絡翻譯從2015年9月研發,13個月后上線。谷歌的測試顯示,神經網絡機器翻譯和非專業人工翻譯已經相當接近,對于英中、中英翻譯也取得最大的提升。 高勤還透露了谷歌神經網絡研發的過程。高勤稱,谷歌神經網絡在研發之初預期要花三年時間來完成,但實際發布時間超乎我們意料。據了解,2015年9月,谷歌翻譯項目開始基于TensorFlow研發,2016年2月獲得首個產品規模模型,2016年11月總計16個語言上線,自此神經網絡機器翻譯初具規模。目前,谷歌翻譯中超過50%的流量采用神經網絡翻譯。這得益于谷歌在機器學習軟硬件上的全面布局,尤其是谷歌張量處理器(TPU)的誕生。 高勤認為,神經網絡相對于傳統技術是一種革命性的改變。基于短語的統計機器翻譯是拼圖過程,通過對短語對的排列和組合,嘗試找出較好的翻譯選項,而整個決策過程是離散的,支持這個決策的信息也都是局部的。神經網絡機器學習反其道而行之,做每一步翻譯過程中可以利用云語言與目標語言所有信息,使整個決策過程既是連續也是全局的。 探索多語言模型:疑似發現多語言的通用語! 然而,從一個實驗室研究結果到服務10億人的產品,其中仍有很長的路要走。 目前來看,因為語言的不同,谷歌翻譯仍需要對200個模型進行訓練與維護,這仍然是極為繁重的任務。因此,谷歌翻譯目前已將目光投向多語言模型。所謂多語言模型是指用同一套神經網絡學習多種語言的互相翻譯。如,可以將英語、西班牙語、韓語放在同一個翻譯模型中進行翻譯。高勤稱,實現多語言模型的機器翻譯其方法可以非常簡單,只需要將我們想要翻譯的目標語言代碼通過特殊符號形式告訴神經網絡,神經網絡就可以處理多種語言的翻譯。如,要翻譯到日語,只需要在原語言前加入2ja+簡單符號。通過這樣處理的多語言簡單符號,很多情況下其性能超過單語言情況。 高勤同時指出,多語言模型可以非常好地處理零數據翻譯,無需通過英語中轉就可以實現兩者非英語語言的翻譯,這為未來構建統一翻譯模型提供了可能性。 最新研究顯示,谷歌翻譯團隊目前對多語言模型、以及在神經網絡內部對不同語言中意義相近的句子向量表示進行多維空間投影,發現意義相近的句子投影到相鄰區域,這表明神經網絡內部對多種語言的表示具有一定的普適性。高勤表示,“這是否代表我們找到了一種能夠代表多種語言的通用語呢?現在還不能確定。我認為還需要進一步研究。” 谷歌翻譯下一步:探究新的模型結構,追求性能極限 目前,谷歌已經推出神經網絡機器翻譯模型,其API接口已提供開發者下載使用。高勤稱,下一步我們將繼續致力于改進數字、日期、姓名、品牌以及不常見短語翻譯,同時進一步研究新的模型結構與訓練方法。 高勤稱,過去一年的研究,我們對神經網絡機器翻譯的認識仍然非常膚淺。我們認為神經網絡機器翻譯僅僅是初露鋒芒,并沒有達到性能的極限。 |




