这页把几个容易分散在设置里的“细调能力”收在一起:热词、文本替换、说话人档案,以及 LLM 润色 的 高级设置。它们不是首次上手必看内容,但在需要提高识别、说话人匹配或清洗稳定性时很有用。
适合这些场景
- 某些专有名词、术语或名字经常被识别错
- 想在转录完成后统一替换固定写法
- 希望 Sona 对已知说话人给出候选建议或自动匹配
- 想进一步调
Auto-Polish或自定义润色上下文
先打开正确的设置入口
设置 > 词汇:管理热词、文本替换与说话人档案LLM 润色 > 高级设置:管理Auto-Polish、频率、关键词、场景预设、自定义上下文- 如果你主要想先理解润色和翻译本身的基础流程,请回到 AI 润色与翻译
热词 适合做什么
- 当某些词在识别里反复出现偏差时,可以把它们加入
热词。 热词按每行一个填写,也支持关键词 :2.0这类带权重的写法。- 目前这项能力对 Transducer 与 Qwen3 ASR 模型尤其相关。
文本替换 适合做什么
- 当转录经常把同一个术语写成不一致的形式时,可以用
文本替换统一结果。 - 它更适合修正重复出现的写法问题,而不是替代逐段人工校对。
- 如果你的重点已经变成整理分段文本本身,请继续看 编辑与播放。
说话人档案 适合做什么
- 为某个已知说话人创建档案,并导入一个或多个本地参考音频片段。
- Sona 会把导入样本规范化到应用管理的数据目录中;配置说话人模型后,这些档案可用于候选建议或自动匹配。
- 档案会根据可用样本数量和时长显示为可自动匹配、可作为候选建议,或尚未就绪。
- 项目可以选择启用哪些说话人档案,因此客户、课程或会议系列可以保留自己的常用说话人集合。
- 说话人档案并不意味着自动归因一定正确。你仍然可以在 编辑与播放 中确认建议、绑定其他档案,或把分组恢复为匿名。
什么时候打开 高级设置
- 当你不只想手动点一次
LLM 润色,而是还要管理Auto-Polish时。 - 当你需要调
Auto-Polish Frequency、关键词、场景预设或自定义上下文时。 - 当你已经完成 provider 与模型配置,但想把润色行为调得更贴近自己的场景时。