ClawOps Docs

제공자 호환성

ClawOps Voice Agent SDK의 제공자 목록입니다. 검증 상태를 확인하고 사용하세요.

ClawOps Voice Agent SDK의 제공자 목록입니다. 검증 상태를 확인하고 사용하세요.

커스텀 제공자를 직접 구현할 수도 있습니다. 커스텀 제공자 가이드를 참고하세요.

Realtime (Speech-to-Speech)

단일 API로 음성 입력부터 음성 출력까지 처리하는 end-to-end 방식입니다.

제공자클래스기본 모델Tool Calling환경변수PythonNode상태검증일
OpenAI Realtime APIOpenAIRealtimegpt-realtime-2OPENAI_API_KEY검증 완료2026-03-12
Google Gemini Live APIGeminiRealtimegemini-3.1-flash-live-previewGOOGLE_API_KEY검증 중

Vertex AI: GOOGLE_API_KEY 대신 GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 Google Cloud Vertex AI 백엔드를 사용할 수 있습니다. ADC(Application Default Credentials) 인증이 필요합니다.

Pipeline 모드 제공자

STT → LLM → TTS를 개별 조합하는 방식입니다. PipelineSession에서 사용합니다.

STT (Speech-to-Text)

제공자클래스프로토콜VADBarge-in환경변수PythonNode상태검증일
DeepgramDeepgramSTTWebSocket 스트리밍DEEPGRAM_API_KEY검증 전

LLM (Large Language Model)

제공자클래스API 방식Tool CallingStreaming환경변수PythonNode상태검증일
OpenAIOpenAILLMNative SDKOPENAI_API_KEY검증 전
AnthropicAnthropicLLMNative SDKANTHROPIC_API_KEY검증 전
Google GeminiGeminiLLMNative SDKGOOGLE_API_KEY검증 전

Vertex AI: GeminiLLM도 Vertex AI 백엔드를 지원합니다. GOOGLE_GENAI_USE_VERTEXAI=true, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION 환경변수를 설정하면 GOOGLE_API_KEY 없이 동작합니다.

| Ollama | OllamaLLM | OpenAI 호환 | — | — | OLLAMA_BASE_URL | — | — | 검증 전 | — | | Mistral | MistralLLM | OpenAI 호환 | — | — | MISTRAL_API_KEY | — | — | 검증 전 | — | | Groq | GroqLLM | OpenAI 호환 | — | — | GROQ_API_KEY | — | — | 검증 전 | — | | Perplexity | PerplexityLLM | OpenAI 호환 | — | — | PERPLEXITY_API_KEY | — | — | 검증 전 | — | | Together AI | TogetherLLM | OpenAI 호환 | — | — | TOGETHER_API_KEY | — | — | 검증 전 | — | | Fireworks AI | FireworksLLM | OpenAI 호환 | — | — | FIREWORKS_API_KEY | — | — | 검증 전 | — | | DeepSeek | DeepSeekLLM | OpenAI 호환 | — | — | DEEPSEEK_API_KEY | — | — | 검증 전 | — | | xAI (Grok) | XaiLLM | OpenAI 호환 | — | — | XAI_API_KEY | — | — | 검증 전 | — |

OpenAI 호환 API를 사용하는 다른 제공자가 있다면 OpenAICompatibleLLM (Python) / OpenAICompatLLM (Node)으로 직접 연결할 수 있습니다.

TTS (Text-to-Speech)

제공자클래스프로토콜Sample Rate환경변수PythonNode상태검증일
ElevenLabsElevenLabsTTSWebSocket 스트리밍24kHz (기본)ELEVENLABS_API_KEY검증 전

설치

각 제공자는 선택적 의존성으로 분리되어 있습니다. 필요한 제공자만 설치하세요.

# Realtime (검증 완료)
pip install clawops[openai]         # OpenAI Realtime + OpenAI LLM

# Realtime (검증 전)
pip install clawops[gemini]     # Gemini Realtime + Gemini LLM

# Pipeline 개별 제공자 (검증 전)
pip install clawops[deepgram]       # Deepgram STT
pip install clawops[elevenlabs]     # ElevenLabs TTS
pip install clawops[anthropic-llm]  # Anthropic LLM
pip install clawops[ollama]         # Ollama LLM
pip install clawops[mistral]        # Mistral LLM
pip install clawops[groq]           # Groq LLM
pip install clawops[perplexity]     # Perplexity LLM
pip install clawops[together]       # Together AI LLM
pip install clawops[fireworks]      # Fireworks AI LLM
pip install clawops[deepseek]       # DeepSeek LLM
pip install clawops[xai]            # xAI LLM

# 전체 설치
pip install clawops[agent-all]

세션 타입별 비교

OpenAI RealtimeGemini RealtimePipeline
방식Speech-to-SpeechSpeech-to-SpeechSTT → LLM → TTS
지연낮음낮음중간
Barge-in내장 VAD내장 VADDeepgram VAD
LLM 선택OpenAI 전용Gemini 전용11개 제공자 자유 선택
음성 선택OpenAI 음성Google 음성ElevenLabs 등 자유 선택
Tool Calling
비용Realtime API 요금Gemini API 요금각 제공자 개별 요금
상태검증 완료검증 전검증 전

범례

기호의미
기능 지원
⚠️알려진 이슈 있음, 조건부 동작
미검증
검증 완료실제 통화 환경에서 테스트 완료
검증 전구현은 완료되었으나 실제 통화 환경 테스트 미완료

마지막 업데이트: 2026-03-12