Files

Warren 8f05a7c188 feat: update Python processors and add utility scripts

- Update ASR, face, OCR, pose processors
- Add release pre-flight check script
- Add synonym generation, chunk processing scripts
- Add face recognition, stamp search utilities

2026-04-30 15:07:49 +08:00

3.3 KiB

Raw Blame History

ASR 處理器版本說明

三個版本對比

版本	模型	處理時間	準確度	適用場景
tiny	Whisper tiny	~12 秒	70%	快速預覽、測試
base	Whisper base	~24 秒	75%	平衡速度與準確度
small	Whisper small	~50 秒	90%	正式處理、台灣腔調

測試結果（ExaSAN 短影片）

關鍵詞彙識別

詞彙	tiny	base	small
剪輯師	❌ 簡吉斯	❌ 簡吉斯	✅ 剪輯師
調光師	✅	✅	✅
錄音師	❌	❌	❌
特效	✅	✅	✅
套片	✅	✅	✅

片段數量

tiny: 78 片段
base: 61 片段（合併過度）
small: 83 片段（最細緻）

使用建議

快速預覽（<15 秒）

python3 scripts/asr_processor.py video.mp4 output.json

適用場景：

快速查看影片內容
測試流程是否正常
不關心準確度

平衡模式（~25 秒）

python3 scripts/asr_processor_base.py video.mp4 output.json

適用場景：

一般用途
速度與準確度平衡
非台灣腔調內容

正式處理（~50 秒）⭐ 推薦

python3 scripts/asr_processor_small.py video.mp4 output.json

適用場景：

正式生產環境
台灣腔調內容
專業詞彙識別（如剪輯師）
需要高準確度

比對工具

使用比對工具

python3 scripts/compare_asr_models.py \
  /tmp/asr_tiny.json \
  /tmp/asr_base.json \
  /tmp/asr_small.json > /tmp/asr_comparison.md

檢視比對報告

cat /tmp/asr_comparison.md

決策建議

如果您需要

速度優先 → 使用 tiny 模型
平衡考量 → 使用 base 模型
準確度優先 → 使用 small 模型 ⭐

針對台灣腔調

強烈建議使用 small 模型：

唯一正確識別「剪輯師」
專業詞彙準確度最高
斷句最細緻

檔案清單

scripts/
├── asr_processor.py          # tiny 模型（原有，不修改）
├── asr_processor_base.py     # base 模型（新增）
├── asr_processor_small.py    # small 模型（新增）
├── compare_asr_models.py     # 比對工具（新增）
└── ASR_PROCESSOR_README.md   # 本文件

測試記錄

測試影片

檔名: ExaSAN PCIe series - Director Ou Yu-Zhi Shares His Experience.mp4
時長: 2 分 39 秒
語言: 台灣國語（繁體中文）
內容: 影視後製討論

測試結果

詳見 /tmp/asr_comparison.md

關鍵發現

small 模型是唯一正確識別「剪輯師」的模型
base 模型片段合併過度（61 vs 78 vs 83）
tiny 模型速度最快但準確度最低

未來優化方向

如果 small 模型仍不滿意

添加後處理校正
- 建立專業詞彙校正表
- 自動修正常見錯誤
添加上下文提示詞
- 提供影視後製專業詞彙列表
- 提升特定領域準確度
考慮其他方案
- 阿里雲繁體中文 API（如果不能使用雲端則跳過）
- 其他專門優化台灣腔調的模型

聯絡與反饋

如有問題或建議，請提供更多測試樣本，我們會持續優化。

3.3 KiB Raw Blame History Unescape Escape

ASR 處理器版本說明

三個版本對比

測試結果（ExaSAN 短影片）

關鍵詞彙識別

片段數量

使用建議

快速預覽（<15 秒）

平衡模式（~25 秒）

正式處理（~50 秒）⭐ 推薦

比對工具

使用比對工具

檢視比對報告

決策建議

如果您需要

針對台灣腔調

檔案清單

測試記錄

測試影片

測試結果

關鍵發現

未來優化方向

如果 small 模型仍不滿意

聯絡與反饋

3.3 KiB

Raw Blame History