站長之家(ChinaZ.com)3月7日 消息:谷歌正在開發(fā)各種人工智能技術(shù),其中包括一個通用語音模型,這是該公司試圖建立一個可以理解世界上1000種最常用語言的模型的一部分。
有傳言稱,除了計劃在今年的年度 I/O 活動中展示20多款人工智能產(chǎn)品外,谷歌正在朝著構(gòu)建支持1,000種不同語言的人工智能語言模型的目標(biāo)邁進(jìn)。在周一發(fā)布的更新中,谷歌分享了有關(guān)通用語音模型 (USM) 的更多信息,該系統(tǒng)被谷歌描述為實現(xiàn)其目標(biāo)的“關(guān)鍵的第一步”。
去年11月,該公司宣布計劃創(chuàng)建一個支持1,000種世界上使用最廣泛的語言的語言模型,同時還展示其 USM 模型。谷歌將 USM 描述為“最先進(jìn)的語音模型家族”,有20億個參數(shù),經(jīng)過1200萬小時的語音和280億個句子的訓(xùn)練,涵蓋300多種語言。
USM 已被 YouTube 用于生成隱藏式字幕,它還支持自動語音識別 (ASR),支持自動檢測和翻譯語言,包括英語、普通話、阿姆哈拉語等。
目前,谷歌表示 USM 支持100多種語言,并將作為構(gòu)建更廣泛系統(tǒng)的“基礎(chǔ)”。另外,Meta 也正在開發(fā)一種類似的 AI 翻譯工具,該工具仍處于早期階段。
(舉報)