?
在很多行業(yè),對電話、無線電中的雙方通話以及密閉空間里的會議、競標、宣判等場景的說話,都會錄音,存檔做記錄或證據(jù)。
在需要獲取并了解錄音的內(nèi)容時,就需要人工去回放傾聽,有些場合還需要將內(nèi)容敲打成文字,記錄下來。在錄音文件比較多的時候,就需要花費很多的人力,而且不可避免的可能會出現(xiàn)差錯。
在計算機科技飛速發(fā)展的當下,比較合理的解決方法是用自動語音識別(ASR)引擎對這些錄音文件進行自動文字識別并保存下來。
然而目前的市場現(xiàn)狀是可購買的獨立部署的識別引擎價格昂貴且安裝繁瑣,需要廠家到現(xiàn)場去安裝。而用公網(wǎng)上的云平臺識別引擎開發(fā)的系統(tǒng),按次數(shù)或者年收費,雖然價格不算高,但是不保密,數(shù)據(jù)不安全;錄音文件上傳到云平臺上進行識別,相當于數(shù)據(jù)發(fā)給了對方。對一些比較敏感的行業(yè)來講,這是沒法接受的
在這種情況下,從保密性、成本以及使用便捷這幾個方面兼顧作為出發(fā)點,力盈力泰推出了自己的內(nèi)網(wǎng)里部署的錄音文件自動語音識別(ASR,文字轉(zhuǎn)語音)解決方案。
?
?
目標
給本公司或第三方的錄音系統(tǒng)生成的錄音文件,提供一個安全、便捷、可靠、低成本的自動語音識別(語音轉(zhuǎn)文字)解決方案。
這有助于最終用戶能夠快速地掌握海量錄音文件的內(nèi)容,或者從中定位一些關(guān)鍵字詞,做后續(xù)處理。
?
實現(xiàn)方法和網(wǎng)絡(luò)架構(gòu)
?
在內(nèi)網(wǎng)部署一至多臺力盈力泰語音識別服務(wù)器;找一臺windows電腦,運行力盈力泰錄音文件提交識別軟件。
力盈力泰錄音文件提交識別軟件對接錄音系統(tǒng)的數(shù)據(jù)庫,從中獲取到錄音文件,自動提交給內(nèi)網(wǎng)的力盈力泰語音識別服務(wù)器,在得到識別結(jié)果的文字內(nèi)容后,寫回到數(shù)據(jù)庫對應(yīng)的記錄中。
?
力盈力泰錄音文件自動語音識別(ASR,文字轉(zhuǎn)語音)網(wǎng)絡(luò)結(jié)構(gòu)圖
?
?
優(yōu)勢
?
?
關(guān)鍵參數(shù)
?
?
?
相關(guān)內(nèi)容: