試想一下(xià),我們在高速公路上使用(yòng)GPS導航時,我們更願意口述目的地還是手動輸入目的地?未來,語音将極大程度上代替鍵盤,成爲我們與計算機交流的主要(yào / yāo)方式。
随着(zhe/zhuó/zhāo/zháo)深度學習、大數據以及雲計算在語音識别中的廣泛應用(yòng),語音識别的技術得(dé / de / děi)到了長足的進展,在此方面有多年(nián)經驗的東芝綜合運用(yòng)其(qí)先進的語音、圖像識别技術并綜合雲計算服務,開發(fā/fà)出能(néng)夠助力人與人交流的AI技術——“RECAIUS™”。
爲了實現人與AI安心、舒适、協調共存,AI需要(yào / yāo)具備能(néng)夠捕捉人類感知和體驗的判斷。在語音識别方面,即便AI沒有完全聽清人們的語音,也能(néng)夠從表情動作中給出恰當的應答,并實現一對(duì)一的簡單會(huì)話,還可(kě)分辨多個會(huì)話組合,通過(guò)計算機算法形成文本。爲此,東芝開發(fā/fà)出的 RECAIUS™ 能(néng)夠根據人的表情、聲音和動作,綜合判斷把握具體意圖和狀況并做出适宜應答。”
“RECAIUS™” 你(nǐ)身邊的同聲傳譯
試想一下(xià),如(rú)果一個以英語爲母語的人,他一句普通話也不懂,當他想和一位土生(shēng)土長的中國人交談,他面臨的選擇有兩個:要(yào / yāo)麽他開始艱難的學習,直到能(néng)夠熟練掌握中文;要(yào / yāo)麽他就(jiù)得(dé / de / děi)雇另一個人來幫他翻譯對(duì)話,而(ér)有了“RECAIUS™”,就(jiù)相當于(yú)你(nǐ)身邊有一位同聲傳譯。
相對(duì)你(nǐ)手機裏(lǐ)面其(qí)他的翻譯軟件,東芝的“RECAIUS™”具備了同聲傳譯的功能(néng),其(qí)不僅可(kě)以翻譯多國語言,而(ér)且即便是語句間沒有間斷的連續語音,“RECAIUS™”也能(néng)自(zì)動判斷适合翻譯的單位,實現智能(néng)斷句,然後(hòu)逐句完成翻譯。面對(duì)一些固有名詞被生(shēng)硬直譯後(hòu)無法理解的情況,使用(yòng)者可(kě)以登錄固有詞彙或例句,給出應當如(rú)何翻譯的指示,“RECAIUS™”就(jiù)能(néng)給出恰當的翻譯。
所(suǒ)見即能(néng)翻譯 真正的讀圖時代
除了語音識别、交互、翻譯等功能(néng),東芝還開發(fā/fà)了将可(kě)視文字信息即時翻譯成其(qí)他語言的技術。想象一下(xià),人們出國旅行(háng / xíng),來到一家(jiā)以美味著稱的餐館,卻往往被菜單上的異國文字搞得(dé / de / děi)一頭霧水,如(rú)果菜單上又沒有圖片,根本不知道該如(rú)何點菜,而(ér)東芝的“RECAIUS™”可(kě)幫你(nǐ)擺脫這個困境,拿起智能(néng)手機對(duì)準菜單進行(háng / xíng)拍攝,東芝“RECAIUS™”可(kě)以瞬間把菜品翻譯成母語,讓你(nǐ)輕松點菜。
(圖:抹茶 綠茶 烘焙茶 烏龍茶 玄米茶 中國茶)
但是,人們用(yòng)相機拍攝圖像時,照片上不隻有文字,還有背景、圖案等其(qí)他信息,爲了能(néng)夠清晰地從複雜圖像中辨别出文字信息,東芝開發(fā/fà)出獨有的圖像特征提取技術,可(kě)以精準檢測到文字。而(ér)這一技術對(duì)國外的街景圖像很有效果,“RECAIUS™”可(kě)以輕松地從街景的圖像中識别其(qí)中的字符串,判斷語言屬性并将字符翻譯成你(nǐ)需要(yào / yāo)的語言文字顯示在屏幕上。未來我們帶上AR眼鏡,沉浸在異國他鄉的外語世界,或許能(néng)夠将眼前充斥着(zhe/zhuó/zhāo/zháo)外語的世界轉換成母語來欣賞,會(huì)不會(huì)是一種非常陌生(shēng)而(ér)又熟悉的景象?
東芝秉承“以人爲本”的技術研發(fā/fà)理念
梅木秀雄表示:“随着(zhe/zhuó/zhāo/zháo)科技的進步以及物聯網IoT(Internet of Things)時代的到來,未來不僅是物與物相連,還有人與人相連以及人與物相連。爲了給人們的生(shēng)活和工作創造更加安心、安全、舒适的環境,東芝将一如(rú)既往地秉承以人爲本的理念,開發(fā/fà)越來越智能(néng)的AI技術,實現更安全、舒适、人與AI和諧共生(shēng)的社會(huì)。”
*标注的日期爲日文原文發(fā/fà)布日期
*注:RECAIUS是東芝數字解決方案株式會(huì)社在日本的商标以及注冊商标。