科技日?qǐng)?bào)記者 張夢(mèng)然
《自然》雜志15日介紹了一款人工智能(AI)模型,其宛如科幻小說(shuō)里的“巴別魚”,能直接“語(yǔ)音到語(yǔ)音”翻譯多達(dá)101種語(yǔ)言的語(yǔ)音和文本。由Meta推出的這一模型名為SEAMLESSM4T,其填補(bǔ)了語(yǔ)言覆蓋方面的空白,且性能優(yōu)于現(xiàn)有其他系統(tǒng)。該成果為快速通用翻譯鋪平道路,其資源公開可用(用于非商業(yè)用途),以協(xié)助進(jìn)一步研究包容性語(yǔ)音翻譯技術(shù)。
科幻小說(shuō)讀者可能很熟悉《銀河系漫游指南》里的“巴別魚”,這種小魚能進(jìn)入耳朵,以口譯形式即時(shí)將一種語(yǔ)言翻譯成另一種語(yǔ)言。這種工具對(duì)于促成全球互聯(lián)環(huán)境下的交流非常有用,但大多數(shù)現(xiàn)有的機(jī)器學(xué)習(xí)翻譯系統(tǒng)都是文本導(dǎo)向的,或需要好幾步轉(zhuǎn)換——語(yǔ)音識(shí)別、翻譯成文本、再將文本轉(zhuǎn)換成語(yǔ)音。此外,現(xiàn)有語(yǔ)音到語(yǔ)音模型的語(yǔ)言覆蓋范圍也遠(yuǎn)低于文本到文本模型,并且傾向于從源語(yǔ)言翻譯成英語(yǔ),而非從英語(yǔ)到另一種語(yǔ)言。
為了突破這些限制,Meta的“無(wú)縫交流團(tuán)隊(duì)”開發(fā)了一款單一模型,支持多達(dá)101種語(yǔ)言之間的多種翻譯模式。SEAMLESSM4T可支持語(yǔ)音到語(yǔ)音(識(shí)別101種語(yǔ)言并翻譯為36種語(yǔ)言)、語(yǔ)音到文本(101種語(yǔ)言譯為96種)、文本到語(yǔ)音(96種語(yǔ)言譯為36種)、文本到文本(96種語(yǔ)言)的翻譯,以及自動(dòng)語(yǔ)音識(shí)別(96種語(yǔ)言)。在語(yǔ)音到語(yǔ)音的翻譯中,SEAMLESSM4T的文本翻譯比現(xiàn)有系統(tǒng)準(zhǔn)確度要高23%。這一AI模型可過(guò)濾背景噪聲并適應(yīng)說(shuō)話者的差異。
研究團(tuán)隊(duì)總結(jié)稱,雖然還需要進(jìn)一步優(yōu)化,但SEAMLESSM4T標(biāo)志著在跨越語(yǔ)言障礙、促進(jìn)交流方面的重要進(jìn)步。