转写
OnceScribe 的核心能力是将音频或视频转换为带时间戳的文字。所有处理均在本地完成。
支持的格式
- 音频:MP3, WAV, M4A, FLAC, OGG, AAC, WMA
- 视频:MP4, MOV, AVI, MKV, WMV, FLV, WEBM
开始转写
- 在工作台选择「文件」Tab
- 拖拽文件到窗口,或点击「选择文件」
- (可选)调整转写选项:语言、模型、温度等
- 点击「转写」按钮
- 实时预览转写结果,右侧逐段追加
转写选项
| 选项 | 说明 | 建议 |
|---|---|---|
| 语言 | 自动检测或指定源语言 | 指定语言可提高准确率 |
| 模型 | tiny/base/small/medium/large | base 适合快速,large 适合高精度 |
| 温度 | 采样随机性 | 0 最确定,1 最随机,默认 0 |
| 稳定时间戳 | 基于 VAD 的精准时间戳 | 开启以获得更准确的字幕时间 |
| 说话人分离 | 识别不同发言人 | Pro 功能,会议场景建议开启 |
说话人分离(Pro)
开启后,转写结果会标注 Speaker 1、Speaker 2 等。支持最多 4 人分离。
- 需要额外的 ONNX 模型(首次使用自动下载)
- 分离准确率受音频质量和说话人数量影响
- 不同发言人以不同颜色标注,点击可跳转
中止与重试
- 转写过程中可随时点击「中止」
- 中止后已转写的内容会保留
- 可调整选项后重新转写同一文件
快捷键
Cmd/Ctrl + T:开始转写Cmd/Ctrl + .:中止转写