Armox
    Armox Academy 📚
    CanvasNós de Áudio

    Audio Nodes

    Audio nodes adicionam som ao seu trabalho criativo. Gere música de fundo, locuções, efeitos sonoros e até clone vozes.

    O que são Audio Nodes?

    Audio Node with MusicGen

    Um Audio node usando MusicGen para geração de música com IA.

    Audio nodes geram som usando IA. Eles podem:

    • 🎵 Gerar música — Trilhas, jingles, músicas
    • 🗣️ Criar fala — Locuções, narração
    • 🎙️ Clonar vozes — Replicar uma voz a partir de uma amostra
    • 🔊 Criar sons — Efeitos sonoros, áudio ambiente

    Adicionando um Audio Node

    1. Abra a node sidebar à esquerda
    2. Encontre Audio na lista
    3. Arraste para o canvas

    Inputs do Audio Node

    InputTipoObrigatórioFinalidade
    Prompt/TextTexto (amarelo)SimDescrição ou script
    Reference AudioÁudio (laranja)NãoPara voice cloning ou estilo

    Modelos de áudio

    Geração de música

    ModeloCréditosIdeal para
    Music 1.548Música de fundo rápida
    Lyria 2120Músicas de alta qualidade
    MusicGen176Composições detalhadas
    Music-01200Música complexa

    Geração de fala

    ModeloCréditosIdeal para
    Speech-02 Turbo8Locuções rápidas
    XTTS-v220Voice cloning
    Speech-02 HD40Fala de alta qualidade

    Voice tools

    ModeloCréditosIdeal para
    Voice Cloning100Clonar qualquer voz

    Geração de música

    Gere música original a partir de descrições em texto.

    Workflow

    Prompt Template
    [Text Node][Audio Node (Music)]
    Music description → Generated music

    Exemplo

    1. Adicione um Text Node com a descrição da música:
      Upbeat electronic music, energetic and modern,
      suitable for tech product video,
      driving beat, synth melodies
      
    2. Adicione um Audio Node
    3. Selecione um modelo de música (ex.: Music 1.5)
    4. Conecte e execute

    Dicas para prompts de música

    Inclua estes elementos:

    • Gênero — “lo-fi hip hop”, “cinematic orchestral”
    • Mood — “uplifting”, “mysterious”, “relaxing”
    • Instrumentos — “piano”, “synths”, “strings”
    • Tempo — “slow”, “upbeat”, “moderate”
    • Finalidade — “background music”, “intro jingle”

    Veja Audio Prompting para orientações detalhadas.


    Geração de fala (Text-to-Speech)

    Converta texto em áudio falado.

    Workflow

    Prompt Template
    [Text Node][Audio Node (Speech)]
    Your script → Spoken audio

    Exemplo

    1. Adicione um Text Node com seu script:
      Welcome to our product demonstration. 
      Today, we'll show you how easy it is 
      to create amazing content with AI.
      
    2. Adicione um Audio Node
    3. Selecione Speech-02 Turbo ou Speech-02 HD
    4. Conecte e execute

    Configurações de fala

    ConfiguraçãoDescrição
    VoiceEscolha entre vozes disponíveis
    SpeedRitmo de fala
    PitchAjuste do tom
    LanguageIdioma do output

    Voice cloning

    Replicar uma voz específica a partir de uma amostra de áudio.

    Workflow

    Prompt Template
    [Upload Node (Audio)][Audio Node (Voice Clone)]
    Voice sample → Cloned speech

    Etapas

    1. Faça upload de uma amostra de voz

      • Adicione um Upload Node
      • Faça upload de um áudio claro (10–30 segundos)
      • Um único locutor, sem ruído de fundo
    2. Adicione um Audio Node

      • Selecione XTTS-v2 ou Voice Cloning
      • Conecte a amostra de áudio
    3. Adicione seu script

      • Text Node com o que você quer que seja dito
      • Conecte ao Audio Node
    4. Gere

      • Execute para criar fala na voz clonada

    Requisitos da amostra de voz

    RequisitoDetalhes
    Length10–30 segundos é o ideal
    QualityClaro, sem ruído
    SpeakerApenas uma voz
    ContentFala natural

    Configurações do Audio Node

    Duration

    Controle o tamanho do áudio:

    Use caseDuration
    Short jingle5–15 segundos
    Background loop30–60 segundos
    Full track60–180 segundos
    VoiceoverDepende do script

    Configurações de qualidade

    ConfiguraçãoEfeito
    Sample RateQualidade do áudio (maior = melhor)
    FormatFormato do output (MP3, WAV)

    Visualização e download

    Quando a geração termina:

    1. Um audio player aparece no node
    2. Clique em play para pré-visualizar
    3. Botão de Download para salvar localmente
    4. O áudio é salvo automaticamente na sua Gallery

    Combinando áudio com vídeo

    Método 1: na Armox

    Alguns modelos de vídeo aceitam input de áudio:

    Prompt Template
    [Audio Node][Video Node]
    Generated music → Video with audio

    Método 2: editor externo

    1. Gere o vídeo na Armox
    2. Gere o áudio na Armox
    3. Baixe ambos
    4. Combine em um editor (Premiere, Final Cut, etc.)

    Dicas para combinar

    • Gere áudio depois de saber a duração do vídeo
    • Combine o mood do áudio com o conteúdo do vídeo
    • Considere gerar a música um pouco mais longa do que precisa

    Dicas para áudio melhor

    Dicas de música

    • Seja específico sobre gênero e mood
    • Inclua preferências de instrumentos
    • Especifique tempo se for importante
    • Cite o caso de uso (vídeo, podcast, etc.)

    Dicas de fala

    • Escreva scripts naturais, conversacionais
    • Use pontuação para pausas naturais
    • Teste com o modelo Turbo primeiro
    • Use HD para produção final

    Dicas de voice cloning

    • Use áudio de origem com alta qualidade
    • Amostras mais longas = cloning melhor
    • Mantenha scripts naturais para a voz
    • Teste com frases curtas primeiro

    Problemas comuns

    A música não combina com a descrição

    • Seja mais específico sobre gênero
    • Inclua mais keywords de mood
    • Tente outro modelo
    • Simplifique a descrição

    A fala parece artificial

    • Adicione pontuação para pausas
    • Encurte frases longas
    • Use linguagem mais conversacional
    • Tente outra voz

    O voice clone está estranho

    • Melhore a qualidade do áudio de origem
    • Use uma amostra mais longa
    • Garanta que há apenas um locutor
    • Remova ruído de fundo da amostra

    Exemplos de uso

    Música de intro para YouTube

    Energetic electronic intro music,
    10 seconds, catchy hook,
    modern and professional,
    suitable for tech channel
    

    Locução para podcast

    Welcome to The Creative Hour, 
    where we explore the intersection 
    of technology and creativity. 
    I'm your host, and today we're diving into...
    

    Música de fundo para vídeo de produto

    Corporate background music,
    uplifting and professional,
    moderate tempo, subtle and non-distracting,
    suitable for product demonstration video
    

    Áudio para meditação

    Peaceful ambient music,
    very slow and calming,
    soft pads and gentle nature sounds,
    suitable for meditation or relaxation
    

    Próximos passos