近期,東芝開發(fā/fà)了支持中日、中英翻譯的會(huì)議支援系統。該系統使用(yòng)公司最新研發(fā/fà)的文本整理技術和關鍵詞抽取技術,解決了會(huì)議中的專業術語、口語化發(fā/fà)言等翻譯問題,使同聲翻譯的精度大幅提高。文本整理技術,是将發(fā/fà)言内容分割成多個易翻譯的單元,再按正确語法整理成文的技術;關鍵詞抽取技術,是從會(huì)議資料中自(zì)動抽取關鍵詞的技術。按計劃,東芝将在内部啓動運行(háng / xíng),以測評該系統是否能(néng)達到預期效果。
随着(zhe/zhuó/zhāo/zháo)制造業的全球化及中國、印度等新興國家(jiā)市場的日益增長,東芝與海外企業之間的會(huì)議交流使用(yòng)外語的情況不斷增多,而(ér)不同語言導緻的溝通障礙和誤解、翻譯成本增加、外語人才管理等,都已成爲日漸突出的經營課題。
當下(xià),語音識别和機器翻譯技術突飛猛進,尤其(qí)在旅行(háng / xíng)和購物等日常會(huì)話方面,已出現實用(yòng)性語音翻譯工具。然而(ér),會(huì)議中的專業術語和口語性發(fā/fà)言等增加了翻譯難度,迄今尚未開發(fā/fà)出适用(yòng)于(yú)商務領域的實用(yòng)化翻譯系統。爲解決這一問題,東芝推出外語會(huì)議支援系統。
該系統采用(yòng)東芝最新研發(fā/fà)的文本整理技術,即利用(yòng)捕捉發(fā/fà)言者口語化發(fā/fà)言的共通性的規則型翻譯,與收集大量多樣化實例而(ér)逐漸改進的統計型翻譯,将難翻譯、難理解的語句修整爲易翻譯句法和長度。而(ér)相關的文本整理網絡工具,可(kě)收集大量的文本整理實例和對(duì)整理結果進行(háng / xíng)高效評價,從而(ér)大幅提高文本整理的精度。
爲防止未知詞彙造成的聲音識别精度和翻譯精度下(xià)降,東芝還研發(fā/fà)了關鍵詞抽取技術。即從會(huì)議資料中自(zì)動抽取專業術語等會(huì)議所(suǒ)需詞彙,在會(huì)議開始前預先存儲該詞彙的正确翻譯。經過(guò)文本整理後(hòu)的原文,通過(guò)關鍵詞抽取技術和東芝獨有的統計型+規則型混合機器翻譯方式進行(háng / xíng)處理,對(duì)各種發(fā/fà)言實現高品質翻譯。
此外,東芝還開發(fā/fà)了支持遠程會(huì)議、面對(duì)面會(huì)議和演講的支援系統。使用(yòng)該系統在公司内部進行(háng / xíng)測評,日語能(néng)力測試二級或二級以上的測試對(duì)象對(duì)日語會(huì)議内容的理解度從60%提高到80%,而(ér)日語能(néng)力測試二級以下(xià)或完全不懂日語的測試對(duì)象理解度則從30%提高到60%。該系統此前僅在開發(fā/fà)部門内部進行(háng / xíng)試運行(háng / xíng),本次則将在包括5家(jiā)中國當地公司在内的東芝集團内部投入試運行(háng / xíng)。東芝将在内部應用(yòng)的基礎上,不斷積累内部會(huì)議翻譯所(suǒ)需的語言數據,在力争将翻譯譯文的可(kě)理解度提高到80%以上的同時,不斷完善會(huì)議語音應用(yòng)系統的各項功能(néng)。
相關視頻請點擊:video11.html