Armox
    Armox Academy 📚
    AI 모델 참조오디오 모델

    Audio Models

    Armox의 오디오 모델은 텍스트 설명 또는 레퍼런스 입력을 기반으로 음악, 음성, 사운드 이펙트를 생성합니다.

    Overview

    오디오 모델은 다음을 수행할 수 있습니다:

    • Music generation — 설명으로 오리지널 음악 생성
    • Text-to-speech — 텍스트에서 자연스러운 음성 생성
    • Sound effects — 환경음과 효과음 생성
    • Voice cloning — 특정 목소리로 음성 생성
    • Audio continuation — 기존 오디오를 이어서 확장

    Available Audio Models

    ModelProviderCostDurationBest For
    MusicGenMeta100 credits8-30sMusic generation
    Ace StepVarious100 credits60-300sLong-form music
    Dia TTSNari Labs50 creditsVariableText-to-speech
    Kokoro TTSKokoro50 creditsVariableFast TTS
    ChatterboxVarious50 creditsVariableVoice cloning

    Connection Colors

    Armox Canvas에서 오디오 연결은 orange 핸들과 엣지를 사용합니다:

    • Input Handle: 노드 왼쪽의 Red circle
    • Output Handle: 노드 오른쪽의 Red circle
    • Connection Edge: 노드를 연결하는 Red line

    Common Settings

    Duration

    생성되는 오디오의 길이를 제어합니다.

    Sample Rate

    • 44.1kHz — CD 품질
    • 48kHz — 프로 오디오

    Format

    • MP3 — 압축, 파일이 작음
    • WAV — 무압축, 더 높은 품질

    Choosing the Right Model

    For Music

    • MusicGen (100 credits) — 짧은 음악 클립
    • Ace Step (100 credits) — 롱폼 음악

    For Speech

    • Dia TTS (50 credits) — 자연스러운 대화
    • Kokoro TTS (50 credits) — 빠른 생성
    • Chatterbox (50 credits) — 보이스 클로닝

    Best Practices

    1. Be specific about genre — "jazz", "electronic", "orchestral"
    2. Describe mood — "upbeat", "melancholic", "energetic"
    3. Include instruments — "piano", "guitar", "synthesizer"
    4. Specify tempo — "slow", "moderate", "fast"
    5. For speech, use natural text — 실제 말하듯이 작성하세요

    Next Steps

    개별 모델 문서를 확인해 상세 설정과 사용 사례를 살펴보세요.