ClawOps Docs

제공자 호환성

ClawOps Voice Agent SDK의 제공자 목록입니다. 검증 상태를 확인하고 사용하세요.

ClawOps Voice Agent SDK의 제공자 목록입니다. 검증 상태를 확인하고 사용하세요.

커스텀 제공자를 직접 구현할 수도 있습니다. 커스텀 제공자 가이드를 참고하세요.

Realtime (Speech-to-Speech)

단일 API로 음성 입력부터 음성 출력까지 처리하는 end-to-end 방식입니다.

제공자클래스기본 모델Tool Calling환경변수PythonNode상태검증일
OpenAI Realtime APIOpenAIRealtimegpt-realtime-2OPENAI_API_KEY검증 완료2026-03-12
Google Gemini Live APIGeminiRealtimegemini-3.1-flash-live-previewGOOGLE_API_KEY검증 중

Vertex AI: GOOGLE_API_KEY 대신 GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 Google Cloud Vertex AI 백엔드를 사용할 수 있습니다. ADC(Application Default Credentials) 인증이 필요합니다.

Pipeline 모드 제공자

STT → LLM → TTS를 개별 조합하는 방식입니다. PipelineSession에서 사용합니다.

STT (Speech-to-Text)

제공자클래스프로토콜VADBarge-in환경변수PythonNode상태검증일
DeepgramDeepgramSTTWebSocket 스트리밍DEEPGRAM_API_KEY검증 전

LLM (Large Language Model)

제공자클래스API 방식Tool CallingStreaming환경변수PythonNode상태검증일
OpenAIOpenAILLMNative SDKOPENAI_API_KEY검증 전
AnthropicAnthropicLLMNative SDKANTHROPIC_API_KEY검증 전
Google GeminiGeminiLLMNative SDKGOOGLE_API_KEY검증 전

Vertex AI: GeminiLLM도 Vertex AI 백엔드를 지원합니다. GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 GOOGLE_API_KEY 없이 동작합니다.

| Ollama | OllamaLLM | OpenAI 호환 | — | — | OLLAMA_BASE_URL | — | — | 검증 전 | — | | Mistral | MistralLLM | OpenAI 호환 | — | — | MISTRAL_API_KEY | — | — | 검증 전 | — | | Groq | GroqLLM | OpenAI 호환 | — | — | GROQ_API_KEY | — | — | 검증 전 | — | | Perplexity | PerplexityLLM | OpenAI 호환 | — | — | PERPLEXITY_API_KEY | — | — | 검증 전 | — | | Together AI | TogetherLLM | OpenAI 호환 | — | — | TOGETHER_API_KEY | — | — | 검증 전 | — | | Fireworks AI | FireworksLLM | OpenAI 호환 | — | — | FIREWORKS_API_KEY | — | — | 검증 전 | — | | DeepSeek | DeepSeekLLM | OpenAI 호환 | — | — | DEEPSEEK_API_KEY | — | — | 검증 전 | — | | xAI (Grok) | XaiLLM | OpenAI 호환 | — | — | XAI_API_KEY | — | — | 검증 전 | — |

OpenAI 호환 API를 사용하는 다른 제공자가 있다면 OpenAICompatLLM으로 직접 연결할 수 있습니다.

TTS (Text-to-Speech)

제공자클래스프로토콜Sample Rate환경변수PythonNode상태검증일
ElevenLabsElevenLabsTTSWebSocket 스트리밍24kHz (기본)ELEVENLABS_API_KEY검증 전

설치

# 코어 패키지 (모든 제공자 포함)
npm install @teamlearners/clawops

# 환경변수 설정 (사용하는 제공자만)
OPENAI_API_KEY=sk-...               # OpenAI Realtime / LLM (검증 완료)
GOOGLE_API_KEY=AI...                 # Gemini Realtime / LLM
ANTHROPIC_API_KEY=sk-ant-...         # Anthropic LLM
DEEPGRAM_API_KEY=...                 # Deepgram STT
ELEVENLABS_API_KEY=...               # ElevenLabs TTS
MISTRAL_API_KEY=...                  # Mistral LLM
GROQ_API_KEY=gsk_...                 # Groq LLM
PERPLEXITY_API_KEY=pplx-...          # Perplexity LLM
TOGETHER_API_KEY=...                 # Together AI LLM
FIREWORKS_API_KEY=...                # Fireworks AI LLM
DEEPSEEK_API_KEY=sk-...              # DeepSeek LLM
XAI_API_KEY=xai-...                  # xAI LLM

세션 타입별 비교

OpenAI RealtimeGemini RealtimePipeline
방식Speech-to-SpeechSpeech-to-SpeechSTT → LLM → TTS
지연낮음낮음중간
Barge-in내장 VAD내장 VADDeepgram VAD
LLM 선택OpenAI 전용Gemini 전용11개 제공자 자유 선택
음성 선택OpenAI 음성Google 음성ElevenLabs 등 자유 선택
Tool Calling
비용Realtime API 요금Gemini API 요금각 제공자 개별 요금
상태검증 완료검증 전검증 전

범례

기호의미
기능 지원
⚠️알려진 이슈 있음, 조건부 동작
미검증
검증 완료실제 통화 환경에서 테스트 완료
검증 전구현은 완료되었으나 실제 통화 환경 테스트 미완료

마지막 업데이트: 2026-03-12