12 月 22 日消息,阿里巴巴達摩院今日發布了新一代語音識別模型 Paraformer,適用于語音輸入法、智能客服、車載導航、會議紀要等場景。
據介紹,這是業界首個應用落地的非自回歸端到端語音識別模型,在推理效率上最高可較傳統模型提升 10 倍,且識別準確率在多個權威數據集上名列第一。目前,該模型于魔搭社區面向全社會開源。
數據顯示,配合 GPU 推理,不同版本的 Paraformer 可將推理效率提升 5-10 倍。同時,Paraformer 使用了 6 倍下采樣的低幀率建模方案,可將計算量大幅降低,支持大模型的高效推理。
IT之家了解到,阿里達摩院方面表示,Paraformer 是阿里巴巴研發的下一代“殺手锏”級別的語音識別基礎模型,未來將廣泛應用于會議紀要產品“聽悟”、釘釘語音轉文字、高德導航等場景。