통화 녹음
`recording=True`로 통화를 실시간 녹음할 수 있습니다.
recording=True로 통화를 실시간 녹음할 수 있습니다.
설정
from clawops.agent import ClawOpsAgent, OpenAIRealtime
agent = ClawOpsAgent(
from_="07012341234",
session=OpenAIRealtime(
system_prompt="상담원입니다.",
),
recording=True,
recording_path="./recordings", # 기본값
rx_gain=1.0,
tx_gain=1.0,
)생성되는 파일
통화마다 WAV 파일(PCM16 8kHz mono)이 생성됩니다.
| 파일 | 내용 |
|---|---|
{call_id}/in.wav | 발신자 음성 (수신 오디오) |
{call_id}/out.wav | AI 응답, hold audio 등 실제 송신 오디오 |
{call_id}/mix.wav | 양방향 믹스 |
rx_gain 또는 tx_gain을 조정한 경우 녹음 파일에는 게인이 적용된 후의 오디오가 저장됩니다.
in.wav= STT/LLM이 실제로 받은 caller 오디오 (rx_gain 적용 후)out.wav= caller가 핸드폰으로 실제로 들은 AI 오디오 (tx_gain 적용 후)
따라서 녹음을 청취하면 통화 양측이 실제로 들은 음량을 그대로 검증할 수 있습니다.
원본 caller 음성을 보존하려면 rx_gain=1.0(기본값)을 유지하세요.
동작 원리
- 수신 오디오(발신자)는
rx_gain적용 후 세션에 전달되고 같은 오디오가 기록됩니다 - 수신 오디오의 media timestamp가 통화 타임라인 역할을 합니다
- 송신 오디오는
tx_gain적용 후CallSession.send_audio()직전에 가로채어 같은 타임라인에 기록합니다 - 같은 timestamp에서 연속 송신되는 청크는 오디오 길이만큼 cursor를 전진시켜 서로 겹치지 않습니다
- 파일은 실시간으로 기록되므로 통화 중 디스크에 바로 저장됩니다
- 통화 종료 시 WAV 헤더가 최종 크기로 업데이트됩니다