服務介紹:
Whisper JAX 是一個免費開源的語音轉文字工具,基於 Whisper 自動語音辨識模型,使用 Google JAX 高性能數值計算的 Python 庫進行優化,能夠在 GPU、TPU 設備上快速將語音轉錄為文字,處理速度提升 70 倍。開發者在 Hugging Face 平台上建立演示模型,無須註冊免費使用,支援錄音、音訊檔和 YouTube 影片轉文字,能夠準確辨識 40 多種語言。介面簡潔易於使用,只需上傳音訊檔案或輸入 YT 影片連結即可生成逐字稿,並提供時間標記選項,可選擇輸出純文字或帶有時間戳記的文本,要將會議錄音轉文字稿或生成影片字幕都能快速完成。
語言:英文
網址:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
專案:https://github.com/sanchit-gandhi/whisper-jax
Whisper JAX 使用說明:
1. 開啟 Whisper JAX 網頁,先在頁面上方選擇音訊來源,有麥克風錄音、音訊檔案、YouTube 三個語音轉錄工具。2. 點選「Audio File」可用拖曳方式或點擊選擇檔案加入音訊。
3. 開啟音訊檔案會出現播放器,點擊「Edit」按鈕有修剪功能,處理任務可選擇轉錄、翻譯,勾選「Return timestamps」產生有時間標記的文本。
4. 設置完成後,點擊「Submit」開始處理,頁面右側會顯示進度。
5. Whisper JAX 的處理速度很快,十分鐘以內的音訊不用一分鐘即可轉錄完成,下圖左/右分別是有無時間標記,點擊「複製」按鈕就能將文本用於其他地方。
6. 音訊來源選擇「YouTube」並貼上影片連結,點擊「Submit」即可轉錄 YT 影片產生逐字稿,支援辨識 40 多種語言。
7. Whisper JAX 的 Task (處理任務)雖然有提供翻譯選項,但是只能翻譯為英文。
延伸閱讀:
0 留言