DayZZinG 发表于 2025-6-28 02:26:36

利用PotPlayer實時生成書面語字幕

本帖最后由 DayZZinG 于 2025-7-7 23:53 编辑

相信有壇友聽過Whisper的大名,即是OpenAI研發的語音轉文字軟件。此貼將教電腦白癡最簡單的方法。

PotPlayer最新版本已有Whisper生成字幕的功能,是實時生成的,即可以一邊看影片一邊生成,無需等待完成才能觀看。有顯示卡的電腦可更快完成!


最低系統需求
作業系統: Windows 10 64bit
CPU模式: RAM 4GB
GPU模式: RAM 5GB, VRAM 4GB

為方便不同語言人士,步驟已各自分發至各頁
2:简体中文
3:繁體中文
4:English

電視台漸漸取消字幕提供,望此貼可幫助想要字幕的壇友。

下載LINK (備用):
**** Hidden Message *****

==================================================

FAQs

[*]準確度高嗎?
準確度頗高,但會被檔案音質和演員音準咬字影響。
[*]可以翻譯嗎?
Whisper是個語音轉文字軟件,不存在翻譯。想要翻譯可用PotPlayer實時字幕翻譯功能(百度翻譯插件),不過我建議生成字幕後用GPT/DeepSeek翻譯更為準確,因其可以上下文連接翻譯,甚至修正錯字、意思不通的句子。(PS:其實Whisper可以翻譯英語,在特定情況下還可以翻譯其他語言,但非常不穩定,因其模型不是為翻譯而訓練的)


字幕 -> 生成有声字幕 -> 生成有声字幕...

转换引擎: Faster-Whisper-XXL -> 点击<下载> (或 下载Faster-Whisper-XXL.7z -> 点击"转换引擎:" -> 解压根目录至此)
型号: large-v2 -> 点击<开始>会自动下载 (或 下载faster-whisper-large-v2.7z -> 点击"型号:" -> 解压根目录至此)
附加选项: --multilingual true --suppress_tokens "" --vad_method pyannote_v3
✓尽可能将字幕保存在视频同目录中
点击<开始>


高级用户可用以下附加选项,较上面的稳定 (要有Nvidia显卡,没有的话超慢):
--verbose true --multilingual true --beam_size 7 --patience 2.5 --hallucination_silence_threshold 2 --vad_method pyannote_v3 --vad_speech_pad_ms 6000 --temperature_increment_on_fallback None --suppress_tokens ""

字幕 -> 生成有聲字幕 -> 生成有聲字幕...

轉換引擎: Faster-Whisper-XXL -> 點擊<下載> (或 下載Faster-Whisper-XXL.7z -> 點擊"轉換引擎:" -> 解壓縮根目錄至此)
模型: large-v2 -> 點擊<開始>會自動下載 (或 下載faster-whisper-large-v2.7z -> 點擊"模型:" -> 解壓縮根目錄至此)
附加選項: --multilingual true --suppress_tokens "" --vad_method pyannote_v3
✓盡可能將字幕儲存在影片同目錄中
點擊<開始>


進階使用者可用以下附加選項,較上面的穩定 (要有Nvidia顯示卡,沒有的話超慢):
--verbose true --multilingual true --beam_size 7 --patience 2.5 --hallucination_silence_threshold 2 --vad_method pyannote_v3 --vad_speech_pad_ms 6000 --temperature_increment_on_fallback None --suppress_tokens ""

Subtitles -> Create subtitles from audio -> Create subtitles from audio...

Engine: Faster-Whisper-XXL -> Click <Download> (or Download Faster-Whisper-XXL.7z -> Click "Engine:" -> Extract root folder to here)
Model: large-v2 -> Click <Start> will start downloading (or Download faster-whisper-large-v2.7z -> Click "Model:" -> Extract root folder to here)
Additional: --multilingual true --suppress_tokens "" --vad_method pyannote_v3
✓If possible, save subtitles in the same folder as the video
Click <Start>


Advanced users can use the following additional options, which are more stable than the ones above (requires an Nvidia GPU, without which it is very slow):
--verbose true --multilingual true --beam_size 7 --patience 2.5 --hallucination_silence_threshold 2 --vad_method pyannote_v3 --vad_speech_pad_ms 6000 --temperature_increment_on_fallback None --suppress_tokens ""

hk3600 发表于 2025-6-28 05:15:50

我就係電腦白痴,第一個報名嚟學!

kyson 发表于 2025-6-28 06:26:26

入嚟学野

守护星 发表于 2025-6-28 07:13:01

之前试过,不过好像生成的字幕不怎么准的时间线

chocobo 发表于 2025-6-28 07:36:37

好好学习,天天向上

DayZZinG 发表于 2025-6-28 07:52:26

守护星 发表于 2025-6-28 07:13
之前试过,不过好像生成的字幕不怎么准的时间线

跟我的選擇, 时间线滿准

lck 发表于 2025-6-28 08:08:35

呢個係好消息

姚筱桦 发表于 2025-6-28 08:11:02

感谢分享

ps2123456 发表于 2025-6-28 08:16:34

看一看先。

甘草拿卡 发表于 2025-6-28 08:21:15

学习一下,好好学习
页: [1] 2 3 4 5 6 7 8 9
查看完整版本: 利用PotPlayer實時生成書面語字幕