Skip to Content
文档⚡ 核心功能转写

转写

OnceScribe 的核心能力是将音频或视频转换为带时间戳的文字。所有处理均在本地完成。

支持的格式

  • 音频:MP3, WAV, M4A, FLAC, OGG, AAC, WMA
  • 视频:MP4, MOV, AVI, MKV, WMV, FLV, WEBM

开始转写

  1. 在工作台选择「文件」Tab
  2. 拖拽文件到窗口,或点击「选择文件」
  3. (可选)调整转写选项:语言、模型、温度等
  4. 点击「转写」按钮
  5. 实时预览转写结果,右侧逐段追加

转写选项

选项说明建议
语言自动检测或指定源语言指定语言可提高准确率
模型tiny/base/small/medium/largebase 适合快速,large 适合高精度
温度采样随机性0 最确定,1 最随机,默认 0
稳定时间戳基于 VAD 的精准时间戳开启以获得更准确的字幕时间
说话人分离识别不同发言人Pro 功能,会议场景建议开启

说话人分离(Pro)

开启后,转写结果会标注 Speaker 1Speaker 2 等。支持最多 4 人分离。

  • 需要额外的 ONNX 模型(首次使用自动下载)
  • 分离准确率受音频质量和说话人数量影响
  • 不同发言人以不同颜色标注,点击可跳转

中止与重试

  • 转写过程中可随时点击「中止」
  • 中止后已转写的内容会保留
  • 可调整选项后重新转写同一文件

快捷键

  • Cmd/Ctrl + T:开始转写
  • Cmd/Ctrl + .:中止转写