技術魔幻 市場難測
無聲語音識別暫難成消費級產(chǎn)品
產(chǎn)業(yè)界
本報記者 劉 艷
世界知識產(chǎn)權組織(WIPO)日前公布了一項微軟申請的“無聲語音輸入”(Silent Voice Input)專利,豐富了“機器聽懂人話”的場景。
雖然還很難判斷使用者能否接受該專利的另類語音輸入方法及該專利的市場前景,但很多看似天馬行空的研發(fā)往往孕育著巨大的商機,如果它們能找到正確的市場和恰當?shù)耐苿臃椒ā?/p>
驗證了語音交互技術的又一種可能
語音識別技術離完美還很遠,噪雜的環(huán)境、吐字不清的詞匯、俚語及方言都會讓機器陷入混亂,開發(fā)更精準更私密的語言識別技術,仍是包括微軟在內的產(chǎn)業(yè)和學界的主要科研方向。
通常情況下,語音輸入首先要發(fā)出聲音,其次需要一個相對安靜的環(huán)境。根據(jù)微軟這項專利的說明,只要讓麥克風等設備靠近嘴巴,該語音輸入解決方案就能捕捉到極低的,如同耳語般的聲音信號,并過濾掉周圍的雜音。除自己之外,別人聽不見或聽不懂。
當然,說話方式可能需要練習。一般情況下,我們講話時吐氣,微軟的解決方案要求使用者在吸氣時執(zhí)行語音輸入。
此外,盡管語音輸入的性能持續(xù)被改善,但除了“調戲”siri,很少有人會在公共場所一本正經(jīng)的用語音輸入,怕打擾別人,也有語音內容私密性的顧慮。在這種情況下,微軟的專利不失為一種妥善的解決方案。
而麻省理工學院的研究人員開發(fā)的新型人機接口“AlterEgo”則更為魔幻,骨傳導耳機環(huán)繞用戶的耳朵和下巴,計算機系統(tǒng)處理并翻譯耳機接收的數(shù)據(jù)并輸出反應,如同人們在閱讀時的“默念”。
這個系統(tǒng)有點像“肌電假體”,當你準備作出某種行為時,大腦會告訴肌肉怎么做,同理,當你想著某個詞時,大腦會向面部及喉部肌肉發(fā)送信號。
主要研究人員Arnav Kapur表示,他們的初衷是將人類和機器以某種方式進行混合,仿佛人類自身認知的內部延伸。
如果這臺設備真的能商用,確實意義非凡。但是,當前的無聲語音識別都處在技術驗證階段,這究竟是一種無用的“情懷技術”,還是可演變?yōu)橛糜谔厥鈭鼍暗漠a(chǎn)品,尚待業(yè)界探索。
工程師們還在努力彌補語音技術缺陷
語音技術不僅具有典型的“賦能”特征,更是當前人們與人工智能互動的最重要界面,已同焦土戰(zhàn)般激烈的“百箱大戰(zhàn)”給語音技術市場帶來很多幻象。
事實上,現(xiàn)在大多數(shù)基于語音技術的硬件產(chǎn)品與智能服務交互體驗仍然存在很多缺陷,研究機構與產(chǎn)業(yè)公司還在技術研發(fā)層面不斷努力完善。
微軟全球資深技術院士、微軟云與人工智能事業(yè)部負責人黃學東博士,是微軟語音技術的創(chuàng)始人,微軟的語音識別、語音合成技術研發(fā)團隊都由他一手組建。
在黃學東的帶領下,2016年10月18日,微軟語音團隊識別研究團隊在 Switchboard語音識別基準測試中刷新自己的紀錄,詞錯率低至5.9%,達到了人類的水平。
306天后,這一紀錄再次被微軟刷新,詞錯率降低到 5.1%,超過專業(yè)速記員的誤差水平,被學術界看作是“人工智能在感知上的一重大里程碑”。
微軟全球執(zhí)行副總裁沈向洋說:“盡管這項語音識別系統(tǒng)還存在一些應用場景的限制,但我相信未來幾年內,機器將會完全超越人類的識別水平。”
盡管各類科研機構為了實現(xiàn)語音識別準確率的“人類對等”,奮斗了二十幾年,但目前在嘈雜環(huán)境下較遠的麥克風的語音識別、方言識別、訓練數(shù)據(jù)有限的特定說話風格或較少人使用的語言的語音識別等,都未達到人類水平。
與此同時,Switchboard雖然是全球語音研究人員用了20多年的通用測試數(shù)據(jù)集,很多技術公司與組織在上面做語音方面的相關研究,它有著全球開發(fā)人員多年來的技術積累,但并不意味著測試結果可以“平移”到現(xiàn)實環(huán)境中。
如黃學東所說,公開性的測試、發(fā)表的學術文章,與現(xiàn)實產(chǎn)品雖然不能完全割裂,但消費級產(chǎn)品與商業(yè)場景,需要不一樣的評判標準。
標簽:
凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責。
原標題:《子夜外賣》描繪城市的夜色畫卷(主題)總制片人張燁鏑:帶觀
2023-06-17 15:43
原標題:用腳和筆丈量世界(引題)?阿來《西高地行記》出版(主題)華
2023-06-17 13:45
原標題:“這里是三星堆”:高清手繪圖“復活”國寶華西都市報-封面新
2023-06-17 13:49
原標題:90多個“關鍵詞”還原蘇軾(引題)?蔣藍新作《蘇東坡辭典》出
2023-06-17 11:34
原標題:圖博會天津出版?zhèn)髅郊瘓F再創(chuàng)佳績(引題)?《閱讀天津·津渡》
2023-06-17 11:35
原標題:良渚遺址“琮王”“鉞王”現(xiàn)身上博(主題)6月20日起亮相“實
2023-06-17 11:51
原標題:《魚廬記》:鄂地小人物的傳奇華西都市報-封面新聞記者張杰近
2023-06-17 11:52
原標題:伴隨著人工智能技術飛速發(fā)展,科幻電影創(chuàng)作將走向何方──(引
2023-06-17 11:56
原標題:國標舞劇《人間四月天》啟動創(chuàng)排北京日報訊(記者韓軒)北京舞
2023-06-17 10:40
原標題:2023年青年攝影獎申報啟動天津日報訊(記者仇宇浩)近日,世界
2023-06-17 10:37
原標題:別樣《鳳求凰》百人合唱點擊量百億次作品(主題)中國古詩詞藝
2023-06-17 10:53
原標題:首屆天津音樂節(jié)中國天津·2023圣彼得堡愛樂樂團演繹經(jīng)典(引題
2023-06-17 10:32
原標題:電視劇《淬火丹心》唱響武鋼人的青春之歌長江日報訊(記者萬旭
2023-06-17 10:53
【作品廣議】原標題:主動自覺,珍視生命肖承森汗流禾下土 蘇慶眼下正
2023-06-17 05:45
解碼文化自信的城市樣本原標題:長沙:千載星城吐芳華天上一顆星,地上
2023-06-17 05:56
原標題:第五屆中國西藏旅游文化國際博覽會6月16日晚開幕由文化和旅游
2023-06-17 05:54
原標題:開心果左一:節(jié)約用水左二:面具左三:——把衣服穿上!右一:
2023-06-17 06:00
原標題:“中國戲曲節(jié)2023”在香港開鑼新華社香港6月16日電(記者褚萌
2023-06-17 06:01
原標題:取材于武鋼的發(fā)展歷史(引題)《淬火丹心》凝聚鋼鐵人的青春與
2023-06-16 21:32
原標題:山東:文化館里涌動“青春力量”中國文化報駐山東記者蘇銳剛過
2023-06-16 17:49
原標題:北京國際圖書博覽會開幕6月15日,北京國際圖書博覽會現(xiàn)場,參
2023-06-16 16:42
原標題:芭蕾舞劇,如何圈粉諸多觀眾?中新網(wǎng)北京6月16日電(記者上官云
2023-06-16 14:44
原標題:中新人物丨演員楊蓉:學演戲,得先學做人中新網(wǎng)北京6月16日電(
2023-06-16 14:49
原標題:《尋她》首映舒淇暢聊與九零后導演的“碰撞”(引題)我心里曾
2023-06-16 14:52
原標題:“京城飄書香五洲共閱讀”(引題)第21屆北京國際圖書節(jié)開幕(
2023-06-16 13:52