3 月 7 日消息,據外媒報道,谷歌近日公布了去年 11 月投入使用的通用語言模型研究結果。結果顯示,谷歌語言模型現在已經可對 100 多種語言進行識別。在部分通用語言識別上,谷歌語言模型的語意理解表現更是亮眼。相較 OpenAI 推出的大型語言模型 Whisper,語意識別錯誤率更低。
根據谷歌官方介紹,谷歌語言模型可進行持續自我學習,并可在 BEST-RQ 算法的加持下不斷修改語言模型整體架構,從而完成持續分析、學習語言結構等操作。除此之外,谷歌語言模型在進行語意理解時,還會調動 text injection 以及監督式 loss 函數,從而讓語言模型語意理解更加精準。目前,谷歌語言模型在處理 70 多種語言翻譯時,錯誤率已經可以保持在 30% 以下。
值得一提的是,IT之家獲取到的信息表明,谷歌語言模型在處理非裔美籍人士所使用的英語口語 CORAAL、混合口音的 SpeechStew 以及其他多種語言的 FLEURS 測試中,其正確率要在 Whisper 之上。
關鍵詞: 谷歌