使用 Buzz 軟體可選擇 Tiny、Base、Small、Medium、Large 五種模型,執行語音轉錄處理會先下載 AI 模型,取得模型後可以離線使用,語音轉錄文字過程都在電腦上運行。轉錄處理速度會因所選模型而有差異,以 Tiny 模型最為迅速卻可能出現偏差,選擇 Large 模型的處理時間最久,相對地文字稿的準確度較高。
授權型式:免費開源
介面語言:英文
作業系統:Windows、Mac
官方網站:https://github.com/chidiwilliams/buzz
軟體下載:【Windows】【MacOS】
(2024/09/10 軟體更新 1.1.0 版本)
Buzz 使用說明:
1. Buzz 是在 GitHub 網站上成立開源專案,打開發布頁面即可下載 Windows、Mac 版本軟體。2. Windows 電腦下載完成後,打開檔案執行安裝,如果看到 Microsoft Defender 警告阻止未知應用程式的執行,點選仍要執行。
3. Buzz 軟體介面簡潔,目前只有英文版本,點選「File」→「Import Media File」或「+」按鈕選擇檔案,預設是瀏覽音訊檔案,可在右下方變更檔案類型。
4. 開啟影片或音訊檔案會出現設置,可選擇 AI 模型、任務(翻譯/轉錄)、語言和輸出格式,目前任務中的翻譯功能只限翻譯為英文,語言預設是自動偵測不用更改。
5. 設置完成後,點擊「Run」按鈕會先下載相應的 AI 模型。
6. 接著主畫面就會顯示處理進度。
7. 等待轉錄完成,軟體會根據所選格式在原路徑儲存文本檔案,點擊「Open Transcript」會開啟轉錄文本可轉存其他格式。
8. Buzz 是採用 Whisper 自動語音辨識模型可轉錄各種語言,處理時間會因 AI 模型而有差異,如下圖,相同影片筆者選擇 Tiny、Small、Medium 模型,處理時間分別是 53 秒、4 分鐘、9 分鐘。
延伸閱讀:
0 留言