扩展能力

词汇与高级设置

在需要更细调校时使用热词、文本替换和润色高级设置,而不是把整份指南扩写成完整设置手册。

向 AI 提问

当前部署尚未启用受保护的文档问答。

这页把几个容易分散在设置里的“细调能力”收在一起:热词文本替换说话人档案,以及 LLM 润色高级设置。它们不是首次上手必看内容,但在需要提高识别、说话人匹配或清洗稳定性时很有用。

适合这些场景

  • 某些专有名词、术语或名字经常被识别错
  • 想在转录完成后统一替换固定写法
  • 希望 Sona 对已知说话人给出候选建议或自动匹配
  • 想进一步调 Auto-Polish 或自定义润色上下文

先打开正确的设置入口

  • 设置 > 词汇:管理 热词文本替换说话人档案
  • LLM 润色 > 高级设置:管理 Auto-Polish、频率、关键词、场景预设、自定义上下文
  • 如果你主要想先理解润色和翻译本身的基础流程,请回到 AI 润色与翻译

热词 适合做什么

  • 当某些词在识别里反复出现偏差时,可以把它们加入 热词
  • 热词 按每行一个填写,也支持 关键词 :2.0 这类带权重的写法。
  • 目前这项能力对 Transducer 与 Qwen3 ASR 模型尤其相关。

文本替换 适合做什么

  • 当转录经常把同一个术语写成不一致的形式时,可以用 文本替换 统一结果。
  • 它更适合修正重复出现的写法问题,而不是替代逐段人工校对。
  • 如果你的重点已经变成整理分段文本本身,请继续看 编辑与播放

说话人档案 适合做什么

  • 为某个已知说话人创建档案,并导入一个或多个本地参考音频片段。
  • Sona 会把导入样本规范化到应用管理的数据目录中;配置说话人模型后,这些档案可用于候选建议或自动匹配。
  • 档案会根据可用样本数量和时长显示为可自动匹配、可作为候选建议,或尚未就绪。
  • 项目可以选择启用哪些说话人档案,因此客户、课程或会议系列可以保留自己的常用说话人集合。
  • 说话人档案并不意味着自动归因一定正确。你仍然可以在 编辑与播放 中确认建议、绑定其他档案,或把分组恢复为匿名。

什么时候打开 高级设置

  • 当你不只想手动点一次 LLM 润色,而是还要管理 Auto-Polish 时。
  • 当你需要调 Auto-Polish Frequency、关键词、场景预设或自定义上下文时。
  • 当你已经完成 provider 与模型配置,但想把润色行为调得更贴近自己的场景时。

补充说明

  • 高级设置 仍然属于 AI 润色与翻译 的延伸能力,不会替代基础的 provider 配置。
  • 说话人档案的就绪状态会影响候选质量和自动匹配置信度,但不影响你手动绑定档案。
  • 如果你主要想做贴着转录存在的归纳而不是润色,改看 AI 摘要
  • 如果某项能力已经配置但效果不对,请继续查看 常见问题与排障
上一页

实时字幕与语音输入法

下一页

CLI 指南