扩展能力

实时字幕与语音输入法

理解实时字幕的入口在哪里、字幕浮窗设置负责什么,以及语音输入法页如何管理快捷键、就绪状态与同一套离线实时转录依赖。

向 AI 提问

当前部署尚未启用受保护的文档问答。

实时字幕语音输入法 都建立在同一套离线实时转录能力之上,但它们服务的界面并不相同:一个是悬浮显示,一个是把文字输入到别的应用里。

适合这些场景

  • 想把系统音频显示成悬浮字幕窗口
  • 想在聊天窗口、文档或表单里直接听写文字
  • 已经理解主录音流程,只想单独用好某一个侧向能力

开始前

  • 你已经完成 快速开始,或者已经在 设置 > 模型设置 中配置 实时录音模型
  • 如果要把声音输入到其他应用,仍然要依赖同一套离线实时转录能力。

实时字幕 从哪里开始

  1. 打开 实时录音
  2. 在页面里找到 实时字幕悬浮字幕(系统音频) 开关。
  3. 如果你的目标只是显示系统音频字幕,可以不先开始录音,直接开启它。
  4. 如果你之后再开始 实时录音,两者也可以并行使用。

设置 > 字幕设置 负责什么

  • 它负责控制字幕浮窗的启动行为、置顶、点击穿透、字体大小、宽度、颜色和背景透明度。
  • 它不负责启动入口;真正的开关仍在 实时录音 页面。
  • 如果你已经打开 实时字幕,但窗口仍然没有出现,请继续查看 常见问题与排障

语音输入法 怎么开始

  1. 打开 设置 > 语音输入法
  2. 启用 语音输入法
  3. 在同一页设置一个全局快捷键。
  4. 按住说话切换模式 之间选择适合自己的方式。
  5. 如果它仍然没有就绪,就查看同页给出的依赖与状态提示。

按住说话切换模式 的区别

  • 按住说话 更适合短句输入,需要按住快捷键时才开始说。
  • 切换模式 更适合连续口述,按一次开始,再按一次停止。
  • 不论使用哪种模式,语音输入法 都依赖可用的 实时录音模型、所需的 VAD 模型、可用输入设备,以及后台预热状态。
  • 如果 语音输入法 还没有就绪,同一页会告诉你当前的阻塞点究竟来自快捷键、模型、VAD、输入设备,还是运行时预热。

什么时候该选哪一个

  • 如果你主要想把系统音频内容显示出来,而不是写入别的应用,优先用 实时字幕
  • 如果你主要想把语音变成输入框里的文字,优先用 语音输入法
  • 如果某个能力已经启用但行为不符合预期,请直接查看 常见问题与排障
上一页

AI 摘要

下一页

词汇与高级设置