日本東芝公司14日宣布,已開發(fā)出使用人工智能(AI)將會議及演講的語音立即轉(zhuǎn)換成易于閱讀的文字,并通過字幕顯示出來的技術(shù)。該技術(shù)能區(qū)別并刪去發(fā)言者“嗯”、“那個”等停頓時夾雜的無意義的詞語,轉(zhuǎn)換成簡潔的文章。該技術(shù)旨在方便聽覺障礙人士理解信息。
目前通過使用AI的語音識別技術(shù)自動記錄文字正在普及。然而由于是將說話者的原話轉(zhuǎn)換成文字,對于通過視覺獲得信息的聽覺障礙者而言很難理解。
據(jù)悉,東芝的AI技術(shù)除了能識別話語中的停頓等,還能通過預(yù)測接下來出現(xiàn)的詞語瞬間省去文章構(gòu)成中不需要的詞。
東芝自2017年起開展把語音轉(zhuǎn)換成字幕的實(shí)證試驗。據(jù)悉已實(shí)現(xiàn)在能充分掌握發(fā)言內(nèi)容的水平上進(jìn)行轉(zhuǎn)換。今后考慮將該技術(shù)投入實(shí)用。
【來源:環(huán)球網(wǎng)】