
VideoCaptioner 是免費且開源的應用程式,適用於 Windows 系統,前往 GitHub 平台下載安裝程式即可使用。用戶可以選擇自動轉換影片,或單獨使用語音轉錄、字幕優化/翻譯和字幕影片合併功能。
預設是透過開發者提供的接口進行語音轉錄,可選擇下載 Whisper 模型以便離線生成字幕,支援設置多種大型語言模型的 API 金鑰,使用 OpenAI、Gemini、DeepSeek 等服務來處理字幕內容,並提供字幕樣式設置,讓影片嵌入字幕變得簡單快速。
卡卡字幕助手主要特色:
- 免費開源:無須支付任何費用,在 GitHub 平台開放原始碼。
- 支援多國語言:能夠辨識多種語言,自動偵測語言無需手動設定。
- 字幕優化功能:提供調整字幕段落、標點與校正功能。
- 生成雙語字幕:可將字幕翻譯成其他語言,並選擇合併雙語字幕。
- 影片字幕合併:使用 FFmpeg 將字幕直接嵌入影片中。
- 支援批次處理:可一次處理多個影片,節省工作時間。
- 轉換字幕格式:支援輸出 srt、ass、txt、vtt 等格式。
授權型式:免費
介面語言:繁體中文(多國語言)
作業系統:Windows
官方網頁:https://github.com/WEIFENG2333/VideoCaptioner
軟體下載:【GitHub 載點】【發布頁面】
(2025/03/03 軟體更新 v1.3.3 版本)
VideoCaptioner 使用說明:
1. 開啟 VideoCaptioner 軟體,主頁的「任務創建」會一次執行語音轉錄、字幕優化和合併功能,選擇影片檔案後,按下「▶」開始處理。
2. 處理完成,VideoCaptioner 會輸出字幕、影片兩個檔案,輕鬆將無字幕影片變成內嵌字幕的影片。

3. 在主頁中切換頁面可以更改設置或單獨使用該項功能,點選「語音轉錄」頁面,打開文件(影片/音訊)並按下「開始轉錄」就會生成字幕檔案。預設為 B 接口,用戶可以選擇 Faster Whisper 模型。

4. 使用 Faster Whisper 要先下載程式與模型,有 tiny、small、medium、large-v1、large-v2 和 large-v3 等選項,大容量模型的處理效果更佳,但是下載速度不快。

5. 點選「字幕優化與翻譯」會有輸出格式、字幕校正、翻譯、文稿提示與其他設置(分割、字數、去掉末端標點符號),同樣可加入字幕檔案進行轉換。

6. 在「字幕視頻合成」頁面可開啟字幕、影片檔案進行合併。用戶可根據需求選擇自動全流程處理或使用單一功能,操作更加靈活方便。

7. 此外,在左側欄有批量處理、字幕樣式,能夠一次執行多項任務,以及調整字幕位置、字體、大小、間距、顏色。

8. 在左下方點擊「⚙️」打開設置會有轉錄配置、LLM 配置、翻譯服務、翻譯與優化等項目,若有其他大型語言模型的 API 可以自行設置。

延伸閱讀:
0 留言