Audio Models
Armox의 오디오 모델은 텍스트 설명 또는 레퍼런스 입력을 기반으로 음악, 음성, 사운드 이펙트를 생성합니다.
Overview
오디오 모델은 다음을 수행할 수 있습니다:
- Music generation — 설명으로 오리지널 음악 생성
- Text-to-speech — 텍스트에서 자연스러운 음성 생성
- Sound effects — 환경음과 효과음 생성
- Voice cloning — 특정 목소리로 음성 생성
- Audio continuation — 기존 오디오를 이어서 확장
Available Audio Models
| Model | Provider | Cost | Duration | Best For |
|---|---|---|---|---|
| MusicGen | Meta | 100 credits | 8-30s | Music generation |
| Ace Step | Various | 100 credits | 60-300s | Long-form music |
| Dia TTS | Nari Labs | 50 credits | Variable | Text-to-speech |
| Kokoro TTS | Kokoro | 50 credits | Variable | Fast TTS |
| Chatterbox | Various | 50 credits | Variable | Voice cloning |
Connection Colors
Armox Canvas에서 오디오 연결은 orange 핸들과 엣지를 사용합니다:
- Input Handle: 노드 왼쪽의 Red circle
- Output Handle: 노드 오른쪽의 Red circle
- Connection Edge: 노드를 연결하는 Red line
Common Settings
Duration
생성되는 오디오의 길이를 제어합니다.
Sample Rate
- 44.1kHz — CD 품질
- 48kHz — 프로 오디오
Format
- MP3 — 압축, 파일이 작음
- WAV — 무압축, 더 높은 품질
Choosing the Right Model
For Music
- MusicGen (100 credits) — 짧은 음악 클립
- Ace Step (100 credits) — 롱폼 음악
For Speech
- Dia TTS (50 credits) — 자연스러운 대화
- Kokoro TTS (50 credits) — 빠른 생성
- Chatterbox (50 credits) — 보이스 클로닝
Best Practices
- Be specific about genre — "jazz", "electronic", "orchestral"
- Describe mood — "upbeat", "melancholic", "energetic"
- Include instruments — "piano", "guitar", "synthesizer"
- Specify tempo — "slow", "moderate", "fast"
- For speech, use natural text — 실제 말하듯이 작성하세요
Next Steps
개별 모델 문서를 확인해 상세 설정과 사용 사례를 살펴보세요.