1 月 17 日消息,多年來,微軟持續探索 AI 語音合成與識別技術,Azure Neural TTS(text-to-speech,語音合成)與 STT(speech-to-text,語音識別)支持的語言區域達到 140 余個,并支持超過 400 多個音色。
近兩年,微軟在漢語方言智能語音上加大了研究力度。微軟宣布,在語音合成上實現了對吳方言和粵方言兩種漢語方言,以及西南官話、東北官話、冀魯官話、中原官話(包括河南、陜西地區)等多種官話次方言的支持;在語音識別上支持吳方言、粵方言和西南官話。
微軟表示,漢語是世界上最古老的語言之一,受歷史與地理條件的影響,出現了眾多代表地域文化特色的方言。自 2017 年起,微軟一直致力于AI for Good計劃的推進,其中包括:通過提供前沿的技術、資源和專業知識,保護人文遺產以及創造更具可持續性和便利性的世界。微軟也將持續投入于方言智能語音的研究,助力中國傳統文化的保護與傳承。
在方言之外,古典詩歌也是文化傳承的重要載體。IT之家了解到,微軟通過學習大量詩歌朗誦者的語音數據,可以讓 AI 更好地表達詩歌的韻律、停頓、情感。微軟智能語音現已支持傳統詩歌、現代詩歌、五言、七言律等智能語音的朗誦。