Armox Academy 📚

AI 모델 참조오디오 모델

Audio Models

Armox의 오디오 모델은 텍스트 설명 또는 레퍼런스 입력을 기반으로 음악, 음성, 사운드 이펙트를 생성합니다.

Overview

오디오 모델은 다음을 수행할 수 있습니다:

Music generation — 설명으로 오리지널 음악 생성
Text-to-speech — 텍스트에서 자연스러운 음성 생성
Sound effects — 환경음과 효과음 생성
Voice cloning — 특정 목소리로 음성 생성
Audio continuation — 기존 오디오를 이어서 확장

Available Audio Models

Model	Provider	Cost	Duration	Best For
MusicGen	Meta	100 credits	8-30s	Music generation
Ace Step	Various	100 credits	60-300s	Long-form music
Dia TTS	Nari Labs	50 credits	Variable	Text-to-speech
Kokoro TTS	Kokoro	50 credits	Variable	Fast TTS
Chatterbox	Various	50 credits	Variable	Voice cloning

Connection Colors

Armox Canvas에서 오디오 연결은 orange 핸들과 엣지를 사용합니다:

Input Handle: 노드 왼쪽의 Red circle
Output Handle: 노드 오른쪽의 Red circle
Connection Edge: 노드를 연결하는 Red line

Common Settings

Duration

생성되는 오디오의 길이를 제어합니다.

Sample Rate

44.1kHz — CD 품질
48kHz — 프로 오디오

Format

MP3 — 압축, 파일이 작음
WAV — 무압축, 더 높은 품질

Choosing the Right Model

For Music

MusicGen (100 credits) — 짧은 음악 클립
Ace Step (100 credits) — 롱폼 음악

For Speech

Dia TTS (50 credits) — 자연스러운 대화
Kokoro TTS (50 credits) — 빠른 생성
Chatterbox (50 credits) — 보이스 클로닝

Best Practices

Be specific about genre — "jazz", "electronic", "orchestral"
Describe mood — "upbeat", "melancholic", "energetic"
Include instruments — "piano", "guitar", "synthesizer"
Specify tempo — "slow", "moderate", "fast"
For speech, use natural text — 실제 말하듯이 작성하세요

Next Steps

개별 모델 문서를 확인해 상세 설정과 사용 사례를 살펴보세요.

창의적 워크플로우를 혁신할 준비가 되셨나요?

신용카드 불필요1000 무료 크레딧