
你有沒有看過那種字幕明明還在講上一句,畫面裡的人已經換話題的影片?在長影片的自動字幕生成裡,這不是偶發錯誤,而是結構性問題。當影片超過十分鐘,中間穿插靜音片段,語音辨識 API 回傳的時間戳可能已經偏移 3 到 6 秒。

你有沒有看過那種字幕明明還在講上一句,畫面裡的人已經換話題的影片?在長影片的自動字幕生成裡,這不是偶發錯誤,而是結構性問題。當影片超過十分鐘,中間穿插靜音片段,語音辨識 API 回傳的時間戳可能已經偏移 3 到 6 秒。