확장 기능

Live Caption과 Voice Typing

시스템 오디오용 플로팅 실시간 자막과 다른 앱에 텍스트를 입력하는 Voice Typing 흐름을 구분합니다.

向 AI 提问

当前部署尚未启用受保护的文档问答。

Live CaptionVoice Typing은 같은 오프라인 실시간 전사 설정에 의존하지만 쓰이는 화면은 다릅니다. 하나는 플로팅 실시간 자막을 보여 주고, 다른 하나는 다른 앱에 텍스트를 입력합니다.

이런 경우에 적합합니다

  • 시스템 오디오를 플로팅 실시간 자막으로 보고 싶을 때
  • 채팅 앱, 문서, form에 직접 받아쓰기하고 싶을 때
  • 기본 녹음 흐름은 이미 알고 있고 한쪽 확장 기능만 필요한 경우

시작하기 전에

  • 시작하기를 마치거나 Settings > Model Settings에서 작동하는 Live Record Model을 설정하세요.
  • 다른 앱에 텍스트를 보내려는 경우에도 이 기능은 같은 오프라인 live transcription stack에 의존합니다.

Live Caption 시작 위치

  1. Live Record를 엽니다.
  2. 이 페이지에서 Live Caption 또는 System Audio Captions 토글을 찾습니다.
  3. 시스템 오디오용 플로팅 자막만 필요하다면 먼저 녹음을 시작할 필요가 없습니다. 토글을 켜는 것으로 충분합니다.
  4. 나중에 Live Record를 시작하면 둘을 동시에 실행할 수 있습니다.

Settings > Subtitle Settings가 제어하는 것

  • 플로팅 자막 창의 동작을 제어합니다: 시작 동작, 항상 위에 표시, 클릭 통과, 글꼴 크기, 너비, 색상, 배경 투명도.
  • 시작 토글을 제공하지는 않습니다. 실제 진입점은 Live Record 페이지에 남아 있습니다.
  • Live Caption이 이미 켜져 있는데도 창이 나타나지 않으면 FAQ와 문제 해결로 이어가세요.

Voice Typing 시작 방법

  1. Settings > Voice Typing을 엽니다.
  2. Voice Typing을 켭니다.
  3. 해당 페이지에서 global shortcut을 지정합니다.
  4. Push to Talk (Hold) 또는 Toggle (Press once)를 선택합니다.
  5. 그래도 준비되지 않았다면 페이지에 표시되는 readiness와 dependency status를 확인합니다.

Push to TalkToggle

  • Push to Talk (Hold)는 짧게 말할 때 좋습니다. shortcut을 누르고 있는 동안에만 capture가 실행됩니다.
  • Toggle (Press once)는 긴 받아쓰기에 더 좋습니다. 한 번 누르면 시작하고 다음 한 번으로 멈춥니다.
  • 두 모드 모두 작동하는 Live Record Model, 필요한 VAD model, 사용 가능한 input device, background warm-up에 의존합니다.
  • Voice Typing이 아직 준비되지 않았다면 같은 settings page가 blocker가 shortcut, model, VAD, input device, runtime warm-up 중 무엇인지 알려 줍니다.

어느 쪽을 선택할까요

  • 시스템 오디오를 플로팅 텍스트로 보는 것이 목표라면 Live Caption에서 시작하세요.
  • 말한 내용을 다른 앱 입력 필드에 넣는 것이 목표라면 Voice Typing에서 시작하세요.
  • 기능이 켜져 있는데 기대대로 동작하지 않으면 FAQ와 문제 해결로 바로 이동하세요.
이전

AI Summary

다음

Vocabulary / 고급 설정