重慶專業(yè)速記:微軟人工智能35天2破紀錄,但是
點擊量:發(fā)布時間:2018-05-31 17:44
35天時間里,微軟人工智能與研究部門的一個研究團隊,將其語音識別系統(tǒng)的詞錯率(WER)提高了兩次,達到了人類專業(yè)速記員水平。
當(dāng)?shù)貢r間10月18日,微軟人工智能與研究部門的研究員和工程師發(fā)表了一篇論文《Achieving Human Parity in Conversational Speech Recognition》。論文表明,微軟的對話語音識別技術(shù)在產(chǎn)業(yè)標準Switchboard語音識別基準測試中實現(xiàn)了詞錯率(word error rate, 簡稱WER)低至5.9%,首次達成與人類專業(yè)速記員持平,并且要優(yōu)于絕大多數(shù)人的表現(xiàn)。同時,也刷新了自己的一個月前創(chuàng)造的6.3%的記錄。
詞錯率5.9%是什么概念?在行業(yè)標準Switchboard語音識別任務(wù)測試中,人類對照組(由專業(yè)速記員組成)將對話語音轉(zhuǎn)錄成文字,目前有記錄的最低詞錯率就是5.9%,這就意味著微軟的語音識別系統(tǒng)的語音識別能力已經(jīng)高于世界上絕大多數(shù)人,而與人類專業(yè)高手持平,創(chuàng)造了一項新的世界紀錄。
微軟首席語音科學(xué)家黃學(xué)東是這一研究的參與者之一,他在接受媒體采訪時說:“在對話語音識別中,我們已經(jīng)實現(xiàn)了和人類同等的水平,這是一個歷史性的突破,意味著有史以來第一次有計算機能像人類一樣識別對話中的每一個單詞。并且,我們團隊花了不到一年時間就實現(xiàn)了這個目標,這遠遠超出大家的期望。”
在微軟公布論文前一周,IBM在舊金山舉辦的國際語音交流和技術(shù)大會Interspeech上, 宣稱他們?nèi)〉昧?6.6% 的詞錯率。20 年前,最好的研究系統(tǒng)的詞錯率是 43%。
“要是在五年前,我是絕對不敢相信我們可以實現(xiàn)這個目標的。”微軟人工智能與研究部門的微軟全球執(zhí)行副總裁沈向洋博士說。
未來,微軟有望利用這一語音識別系統(tǒng)增強自己的消費和企業(yè)產(chǎn)品。比如像 Xbox 這樣的消費娛樂設(shè)備、即時語音-文本速錄輔助工具及Cortana這樣的個人數(shù)字助理。
雖然已經(jīng)達到了人類專業(yè)水平,但這并不意味著微軟的語音識別系統(tǒng)能完美地識別每一個詞匯。微軟語音和對話研究組負責(zé)人Geoffrey Zweig舉例說,計算機將“have”誤聽為“is”、將“a”誤聽為“the”的錯誤率,和人類從同樣對話中出現(xiàn)誤聽的錯誤率是一樣的。
此外,計算機雖然能識別、轉(zhuǎn)錄,但要真正做到像人類一樣理解語音、語言,還有很長的路要走。Zweig說,研究者正在努力確保語音識別能在更真實的生活環(huán)境中良好地工作。這些環(huán)境包括具有很多背景噪聲的地方,比如聚會場所或是在高速路上駕駛的時候。“下一個前沿是從識別走向理解。”Zweig說。
重慶專業(yè)速記公司18696689154 18623000143
重慶新創(chuàng)速記服務(wù)有限公司是經(jīng)國家相關(guān)部門批準注冊、專業(yè)提供中文電腦速記服務(wù)的速記專業(yè)服務(wù)公司http:///
重慶速記,成都速記,重慶會議記錄,重慶速記公司,重慶錄音字幕整理,錄音轉(zhuǎn)文字整理,速記公司,會議文字快速記錄,重慶速錄公司
下一篇:沒有了