Amazon Transcribe簡介
Amazon Transcribe 是一項自動語音識別 (ASR) 服務,使開發人員能夠輕松地為其應用程序添加語音轉文本功能。通過使用 Amazon Transcribe API,您可以分析 Amazon S3 中存儲的音頻文件,并讓該服務返回一個轉錄的語音文本文件。
Amazon Transcribe 可用于很多常見應用程序,包括客戶服務通話轉錄,以及在音頻和視頻內容上生成字幕。該服務可以轉錄以常見格式(例如 WAV 和 MP3)存儲的音頻文件,并為每個詞附加時間戳,以便您可以通過搜索文本輕松找到原始源中的音頻。Amazon Transcribe 正在不斷學習和改進,以跟上語言的發展。
主要功能
便于閱讀的轉錄
大多數語音識別系統輸出的都是一連串沒有標點符號的文本。Amazon Transcribe 采用深度學習功能自動添加標點符號和格式,從而使輸出內容更容易理解,無需進一步編輯即可直接使用。
自定義詞匯表
使用 Amazon Transcribe,您可以擴展和自定義語音識別詞匯表。您可以將新詞添加到基本詞匯表中,并生成特定于使用案例的高準確轉錄,例如產品名稱、域特定術語或個人姓名。
生成時間戳
Amazon Transcribe 會為每個詞返回時間戳,以便您可以通過搜索文本輕松找到原始錄音中的音頻。
識別多個講話者
Amazon Transcribe 能夠識別出講話者的變化,并相應地確定轉錄文本的歸屬。這樣可以顯著減少轉錄具有多個講話者的音頻(例如電話、會議和電視節目)所需的工作量。
支持廣泛的使用案例
Amazon Transcribe 旨在為各種質量的音頻提供準確的自動轉錄。您可以為任何視頻或音頻文件生成字幕,甚至可以轉錄低質量的電話錄音,例如客戶服務電話。
聲道合成(即將推出)
Amazon Transcribe 將每個講話人的聲音都錄制在不同的聲道中,從而更好地處理音頻。聯絡中心可以將單個音頻文件提交到 Amazon Transcribe,后者會識別并分解出兩個聲道,轉錄每個聲道的講話內容,然后使用聲道標簽制作協調的合并腳本,從而令聯絡中心受益匪淺。
使用案例
Amazon Transcribe 可以為廣泛的使用案例提供轉錄服務,包括客戶服務、字幕、搜索與合規性。
改善客戶服務
通過將音頻輸入轉換成文本,Amazon Transcribe 可幫助您構建能夠搜索和分析語音輸入的文本分析應用程序。客戶聯絡中心可以使用 Amazon Transcribe 轉錄語音通話,并借助其他 AWS 產品 (例如 Amazon Comprehend) 挖掘數據以提取對話中的含義和意圖,從而獲取見解。
字幕工作流
Amazon Transcribe 可以自動生成帶時間戳的字幕 (隨視頻內容一起顯示),從而幫助內容生成和媒體發行者提高到達率和訪問量。
音頻存檔分類
借助該服務,您可以將音頻和視頻資源轉錄成完全可搜索的存檔,以便進行合規性監控和風險管理。客戶可以使用 Amazon Transcribe 將音頻轉換成文本,使用 Amazon ElasticSearch Service 在音頻/視頻庫內編寫索引并執行基于文本的搜索。