Skip to Content
文档📖 参考与设置设置说明

设置说明

模型

模型路径

Whisper 模型文件的存放目录。首次使用时会自动下载到默认路径,你也可以手动指定。

模型选择

  • tiny:最快,准确率最低,适合测试
  • base:速度快,准确率一般,适合日常使用
  • small:平衡选择,推荐入门
  • medium:准确率高,速度适中
  • large:最高准确率,速度最慢,需要更多内存
  • turbo:优化版 large,速度更快

GPU 加速

  • macOS:自动使用 CoreML / ANE(Apple Silicon)
  • Windows/Linux:选择 GPU 设备索引,支持 Vulkan

转写选项

语言

  • auto:自动检测(准确率稍低)
  • 指定语言:如 zh(中文)、en(英语)、ja(日语)等

温度

控制采样随机性。0 为完全确定,1 为最随机。默认 0,建议保持。

稳定时间戳

基于 Silero VAD 的精准时间戳模式,开启后字幕时间更准确,但处理稍慢。

说话人分离

开启后需要下载额外的 ONNX 模型。支持 2-4 人分离。

录音

  • 默认设备:设置默认麦克风和系统音频设备
  • 录音格式:WAV(无损)或 MP3(压缩)
  • 保存路径:录音文件的默认保存位置
  • 自动转写:录音结束后是否自动开始转写

AI

LLM 提供商

选择使用的 AI 服务:

  • Ollama:本地运行,数据不出设备
  • Claude / DeepSeek / Gemini / 通义千问 / 智谱:云端 API,需填写 Key

API Key

在对应提供商官网获取 API Key 后填入。Key 仅保存在本地,不会上传。

自定义 Prompt

编辑摘要、对话、润色等功能的默认 prompt 模板。

导出

  • 默认格式:设置默认导出格式
  • 包含时间戳:导出时是否包含时间信息
  • 编码:UTF-8 或 UTF-8-BOM

快捷键

快捷键功能
Cmd/Ctrl + T开始转写
Cmd/Ctrl + .中止转写
Cmd/Ctrl + Shift + R开始/停止录音(全局)
Cmd/Ctrl + E导出