Armox
    Armox Academy 📚
    Podstawowe KoncepcjeInżynieria PromptówPrompty Audio

    Audio Prompting

    Generowanie audio z AI otwiera nowe możliwości — od muzyki w tle, przez voice-overy, po efekty dźwiękowe. Ten przewodnik uczy, jak skutecznie promptować modele audio.

    Modele audio w Armox

    Generowanie muzyki

    ModelKredytyNajlepszy do
    Music 1.548Szybka muzyka w tle
    Lyria 2120Utwory wysokiej jakości
    MusicGen176Szczegółowe kompozycje
    Music-01200Złożona muzyka

    Mowa i głos

    ModelKredytyNajlepszy do
    Speech-02 Turbo8Szybkie voice-overy
    XTTS-v220Voice cloning
    Speech-02 HD40Mowa wysokiej jakości
    Voice Cloning100Klonowanie dowolnego głosu

    Podstawy promptów do muzyki

    Prompty do muzyki powinny opisywać:

    1. Genre/Style — jaki typ muzyki?
    2. Mood/Emotion — jaki ma być nastrój?
    3. Instruments — jakie brzmienia?
    4. Tempo — szybko czy wolno?
    5. Purpose — do czego to ma służyć?

    Podstawowa struktura

    Prompt Template
    [Genre] music, [mood], [instruments], 
    [tempo], [purpose/context]

    Słowa kluczowe gatunków

    Bądź konkretny/a w opisie stylu:

    Popularne gatunki

    GenreOpis
    „Lo-fi hip hop”relaksujący klimat do pracy
    „Cinematic orchestral”epicko jak soundtrack filmowy
    „Upbeat pop”chwytliwe, komercyjne
    „Ambient electronic”ambientowe tło
    „Acoustic folk”ciepłe, organiczne
    „Corporate”profesjonalne, biznesowe
    „Epic trailer”dramatyczne, narastające
    „Chill electronic”nowoczesne, spokojne

    Style mieszane (fusion)

    Łącz gatunki, aby uzyskać unikalne brzmienie:

    • „Jazz-influenced lo-fi”
    • „Orchestral with electronic elements”
    • „Acoustic pop with indie vibes”
    • „Cinematic ambient”

    Mood i emocje

    Pozytywne nastroje

    • „Uplifting and inspiring”
    • „Happy and cheerful”
    • „Energetic and exciting”
    • „Warm and comforting”
    • „Hopeful and optimistic”

    Spokojne nastroje

    • „Peaceful and serene”
    • „Relaxing and meditative”
    • „Dreamy and ethereal”
    • „Gentle and soothing”
    • „Contemplative and reflective”

    Dramatyczne nastroje

    • „Intense and powerful”
    • „Mysterious and suspenseful”
    • „Epic and triumphant”
    • „Dark and moody”
    • „Emotional and moving”

    Instrumenty i brzmienia

    Instrumenty akustyczne

    Piano, acoustic guitar, strings, 
    violin, cello, flute, 
    drums, bass, percussion
    

    Brzmienia elektroniczne

    Synthesizer, electronic beats, 
    bass drops, pads, arpeggios, 
    808 drums, ambient textures
    

    Orkiestra

    Full orchestra, brass section, 
    string ensemble, timpani, 
    French horn, choir
    

    Przykład z instrumentami

    Cinematic orchestral music with soaring strings, 
    powerful brass, and thundering timpani, 
    building to an epic climax, 
    movie trailer style
    

    Tempo i energia

    Słowa kluczowe tempa

    TermBPMOdczucie
    „Very slow”40-60medytacyjne
    „Slow”60-80relaksujące
    „Moderate”80-100spokojne tempo
    „Upbeat”100-120energiczne
    „Fast”120-140ekscytujące
    „Very fast”140+intensywne

    Opis energii

    • „Starts soft, builds gradually”
    • „High energy throughout”
    • „Ebb and flow dynamics”
    • „Steady and consistent”
    • „Explosive crescendo”

    Szablony promptów do muzyki

    Muzyka w tle

    Prompt Template
    [Genre] background music, 
    [mood], [tempo], 
    suitable for [use case], 
    [instruments], [duration note]

    Example:

    Lo-fi hip hop background music, 
    relaxing and focused, moderate tempo, 
    suitable for studying or working, 
    mellow beats with soft piano and vinyl crackle, 
    loopable
    

    Soundtrack do wideo

    Prompt Template
    [Genre] music for [video type], 
    [mood] feeling, [tempo], 
    [instruments], 
    syncs with [visual description]

    Example:

    Uplifting corporate music for product launch video, 
    inspiring and professional feeling, moderate upbeat tempo, 
    piano, light percussion, subtle strings, 
    builds energy toward the end
    

    Intro do podcastu / YouTube

    Prompt Template
    [Genre] intro music, 
    [duration] seconds, [mood], 
    [instruments], 
    catchy and memorable, 
    suitable for [content type]

    Example:

    Modern electronic intro music, 
    10-15 seconds, energetic and exciting, 
    punchy synths and driving beat, 
    catchy and memorable hook, 
    suitable for tech podcast
    

    Prompty do mowy i voice-overów

    Text-to-Speech

    Dla Speech-02 i podobnych modeli promptem jest tekst, który ma zostać wypowiedziany:

    Prompt Template
    [The actual words you want spoken]

    Cechy głosu

    Niektóre modele pozwalają określić cechy głosu:

    TraitOpcje
    GenderMale, female, neutral
    AgeYoung, middle-aged, elderly
    ToneProfessional, friendly, authoritative
    AccentAmerican, British, Australian
    SpeedSlow, normal, fast

    Przykłady mowy

    Professional Narration:

    Welcome to our quarterly report. 
    This presentation covers our key achievements 
    and strategic initiatives for the coming year.
    

    Friendly Explainer:

    Hey there! In this video, we're going to show you 
    exactly how to get started with our app. 
    It's super easy, I promise!
    

    Dramatic Trailer:

    In a world where technology has changed everything... 
    one company dares to reimagine the future.
    

    Voice cloning

    Aby sklonować głos:

    1. Upload czystej próbki audio (10–30 sekund)
    2. Connect do Voice Cloning node
    3. Provide tekst, który ma zostać wypowiedziany
    4. AI generuje mowę w tym głosie

    Best practices dla próbek

    • ✅ czyste nagranie bez szumów
    • ✅ tylko jeden mówca
    • ✅ naturalne tempo mowy
    • ✅ 10–30 sekund mowy
    • ❌ muzyka lub szum tła
    • ❌ wielu mówców
    • ❌ mocno przetworzone audio

    Łączenie audio z wideo

    Workflow

    1. Najpierw wygeneruj wideo
    2. Stwórz audio pasujące do długości wideo
    3. Połącz w edytorze wideo

    Dopasowanie audio do wideo

    Zwróć uwagę na:

    • Video duration — dopasuj długość audio
    • Video mood — audio powinno uzupełniać
    • Key moments — beaty mogą zgrywać się z cięciami
    • Pacing — szybkie wideo = bardziej energetyczne audio

    Najczęstsze błędy w promptach muzyki

    ❌ Zbyt ogólnie

    Nice music
    

    ✅ Lepiej

    Uplifting acoustic folk music, 
    warm and hopeful, moderate tempo, 
    acoustic guitar and light percussion, 
    suitable for lifestyle brand video
    

    ❌ Sprzeczne opisy

    Sad and depressing but also happy and upbeat
    

    ✅ Lepiej

    Bittersweet and nostalgic, 
    melancholic melody with hopeful undertones
    

    ❌ Zbyt technicznie

    Music in C major at 120 BPM with 
    a I-IV-V-I chord progression
    

    ✅ Lepiej

    Upbeat pop music with a classic, 
    familiar chord progression, 
    catchy and singable
    

    Przykłady zastosowań

    Tło do YouTube

    Upbeat electronic background music, 
    energetic but not distracting, 
    moderate-fast tempo, 
    synth pads and light beats, 
    suitable for tech review video, 
    loopable for long videos
    

    Medytacja / relaks

    Ambient meditation music, 
    deeply calming and peaceful, 
    very slow tempo, 
    soft pads, gentle bells, nature sounds, 
    suitable for yoga or sleep
    

    Reklama produktu

    Modern corporate music, 
    confident and innovative feeling, 
    moderate tempo building to upbeat, 
    clean synths and subtle percussion, 
    30 seconds, ends with resolution
    

    Social media reel

    Trendy pop music, 
    catchy and fun, fast tempo, 
    suitable for Instagram Reels, 
    15-30 seconds, 
    hook in first 3 seconds
    

    Strategia iteracji

    1. Start simple — genre + mood + tempo
    2. Add instruments — określ kluczowe brzmienia
    3. Refine energy — opisz dynamikę i build
    4. Match purpose — dopasuj do use case

    Następne kroki