实时字幕 与 语音输入法 都建立在同一套离线实时转录能力之上,但它们服务的界面并不相同:一个是悬浮显示,一个是把文字输入到别的应用里。
适合这些场景
- 想把系统音频显示成悬浮字幕窗口
- 想在聊天窗口、文档或表单里直接听写文字
- 已经理解主录音流程,只想单独用好某一个侧向能力
开始前
- 你已经完成 快速开始,或者已经在
设置 > 模型设置中配置实时录音模型。 - 如果要把声音输入到其他应用,仍然要依赖同一套离线实时转录能力。
实时字幕 从哪里开始
- 打开 实时录音。
- 在页面里找到
实时字幕或悬浮字幕(系统音频)开关。 - 如果你的目标只是显示系统音频字幕,可以不先开始录音,直接开启它。
- 如果你之后再开始
实时录音,两者也可以并行使用。
设置 > 字幕设置 负责什么
- 它负责控制字幕浮窗的启动行为、置顶、点击穿透、字体大小、宽度、颜色和背景透明度。
- 它不负责启动入口;真正的开关仍在 实时录音 页面。
- 如果你已经打开
实时字幕,但窗口仍然没有出现,请继续查看 常见问题与排障。
语音输入法 怎么开始
- 打开
设置 > 语音输入法。 - 启用
语音输入法。 - 在同一页设置一个全局快捷键。
- 在
按住说话和切换模式之间选择适合自己的方式。 - 如果它仍然没有就绪,就查看同页给出的依赖与状态提示。
按住说话 和 切换模式 的区别
按住说话更适合短句输入,需要按住快捷键时才开始说。切换模式更适合连续口述,按一次开始,再按一次停止。- 不论使用哪种模式,
语音输入法都依赖可用的实时录音模型、所需的VAD模型、可用输入设备,以及后台预热状态。 - 如果
语音输入法还没有就绪,同一页会告诉你当前的阻塞点究竟来自快捷键、模型、VAD、输入设备,还是运行时预热。
什么时候该选哪一个
- 如果你主要想把系统音频内容显示出来,而不是写入别的应用,优先用
实时字幕。 - 如果你主要想把语音变成输入框里的文字,优先用
语音输入法。 - 如果某个能力已经启用但行为不符合预期,请直接查看 常见问题与排障。