ClawOps Docs

제공자 호환성

ClawOps Voice Agent SDK에서 지원하는 제공자 목록과 검증 상태입니다.

제공자 호환성

ClawOps Voice Agent SDK의 제공자 목록입니다. 검증 상태를 확인하고 사용하세요.

Realtime (Speech-to-Speech)

단일 API로 음성 입력부터 음성 출력까지 처리하는 end-to-end 방식입니다.

제공자클래스기본 모델Tool Calling환경변수PythonNode상태검증일
OpenAI Realtime APIOpenAIRealtimegpt-realtime-1.5OPENAI_API_KEY검증 완료2026-03-12
Google Gemini Live APIGeminiRealtimegemini-3.1-flash-live-previewGOOGLE_API_KEY검증 중

Vertex AI: GOOGLE_API_KEY 대신 GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 Google Cloud Vertex AI 백엔드를 사용할 수 있습니다. ADC(Application Default Credentials) 인증이 필요합니다.

Pipeline 모드 제공자

STT → LLM → TTS를 개별 조합하는 방식입니다. PipelineSession에서 사용합니다.

STT (Speech-to-Text)

제공자클래스프로토콜VADBarge-in환경변수PythonNode상태검증일
DeepgramDeepgramSTTWebSocket 스트리밍DEEPGRAM_API_KEY검증 전

LLM (Large Language Model)

제공자클래스API 방식Tool CallingStreaming환경변수PythonNode상태검증일
OpenAIOpenAILLMNative SDKOPENAI_API_KEY검증 전
AnthropicAnthropicLLMNative SDKANTHROPIC_API_KEY검증 전
Google GeminiGeminiLLMNative SDKGOOGLE_API_KEY검증 전

Vertex AI: GeminiLLM도 Vertex AI 백엔드를 지원합니다. GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 GOOGLE_API_KEY 없이 동작합니다.

| Ollama | OllamaLLM | OpenAI 호환 | — | — | OLLAMA_BASE_URL | — | — | 검증 전 | — | | Mistral | MistralLLM | OpenAI 호환 | — | — | MISTRAL_API_KEY | — | — | 검증 전 | — | | Groq | GroqLLM | OpenAI 호환 | — | — | GROQ_API_KEY | — | — | 검증 전 | — | | Perplexity | PerplexityLLM | OpenAI 호환 | — | — | PERPLEXITY_API_KEY | — | — | 검증 전 | — | | Together AI | TogetherLLM | OpenAI 호환 | — | — | TOGETHER_API_KEY | — | — | 검증 전 | — | | Fireworks AI | FireworksLLM | OpenAI 호환 | — | — | FIREWORKS_API_KEY | — | — | 검증 전 | — | | DeepSeek | DeepSeekLLM | OpenAI 호환 | — | — | DEEPSEEK_API_KEY | — | — | 검증 전 | — | | xAI (Grok) | XaiLLM | OpenAI 호환 | — | — | XAI_API_KEY | — | — | 검증 전 | — |

OpenAI 호환 API를 사용하는 다른 제공자가 있다면 OpenAICompatibleLLM (Python) / OpenAICompatLLM (Node)으로 직접 연결할 수 있습니다.

TTS (Text-to-Speech)

제공자클래스프로토콜Sample Rate환경변수PythonNode상태검증일
ElevenLabsElevenLabsTTSWebSocket 스트리밍24kHz (기본)ELEVENLABS_API_KEY검증 전

세션 타입별 비교

OpenAI RealtimeGemini RealtimePipeline
방식Speech-to-SpeechSpeech-to-SpeechSTT → LLM → TTS
지연낮음낮음중간
Barge-in내장 VAD내장 VADDeepgram VAD
LLM 선택OpenAI 전용Gemini 전용11개 제공자 자유 선택
음성 선택OpenAI 음성Google 음성ElevenLabs 등 자유 선택
Tool Calling
비용Realtime API 요금Gemini API 요금각 제공자 개별 요금
상태검증 완료검증 전검증 전

범례

기호의미
기능 지원
미검증
검증 완료실제 통화 환경에서 테스트 완료
검증 전구현은 완료되었으나 실제 통화 환경 테스트 미완료

마지막 업데이트: 2026-03-12