Audio Prompting
Generowanie audio z AI otwiera nowe możliwości — od muzyki w tle, przez voice-overy, po efekty dźwiękowe. Ten przewodnik uczy, jak skutecznie promptować modele audio.
Modele audio w Armox
Generowanie muzyki
| Model | Kredyty | Najlepszy do |
|---|---|---|
| Music 1.5 | 48 | Szybka muzyka w tle |
| Lyria 2 | 120 | Utwory wysokiej jakości |
| MusicGen | 176 | Szczegółowe kompozycje |
| Music-01 | 200 | Złożona muzyka |
Mowa i głos
| Model | Kredyty | Najlepszy do |
|---|---|---|
| Speech-02 Turbo | 8 | Szybkie voice-overy |
| XTTS-v2 | 20 | Voice cloning |
| Speech-02 HD | 40 | Mowa wysokiej jakości |
| Voice Cloning | 100 | Klonowanie dowolnego głosu |
Podstawy promptów do muzyki
Prompty do muzyki powinny opisywać:
- Genre/Style — jaki typ muzyki?
- Mood/Emotion — jaki ma być nastrój?
- Instruments — jakie brzmienia?
- Tempo — szybko czy wolno?
- Purpose — do czego to ma służyć?
Podstawowa struktura
Prompt Template
[Genre] music, [mood], [instruments], [tempo], [purpose/context]
Słowa kluczowe gatunków
Bądź konkretny/a w opisie stylu:
Popularne gatunki
| Genre | Opis |
|---|---|
| „Lo-fi hip hop” | relaksujący klimat do pracy |
| „Cinematic orchestral” | epicko jak soundtrack filmowy |
| „Upbeat pop” | chwytliwe, komercyjne |
| „Ambient electronic” | ambientowe tło |
| „Acoustic folk” | ciepłe, organiczne |
| „Corporate” | profesjonalne, biznesowe |
| „Epic trailer” | dramatyczne, narastające |
| „Chill electronic” | nowoczesne, spokojne |
Style mieszane (fusion)
Łącz gatunki, aby uzyskać unikalne brzmienie:
- „Jazz-influenced lo-fi”
- „Orchestral with electronic elements”
- „Acoustic pop with indie vibes”
- „Cinematic ambient”
Mood i emocje
Pozytywne nastroje
- „Uplifting and inspiring”
- „Happy and cheerful”
- „Energetic and exciting”
- „Warm and comforting”
- „Hopeful and optimistic”
Spokojne nastroje
- „Peaceful and serene”
- „Relaxing and meditative”
- „Dreamy and ethereal”
- „Gentle and soothing”
- „Contemplative and reflective”
Dramatyczne nastroje
- „Intense and powerful”
- „Mysterious and suspenseful”
- „Epic and triumphant”
- „Dark and moody”
- „Emotional and moving”
Instrumenty i brzmienia
Instrumenty akustyczne
Piano, acoustic guitar, strings,
violin, cello, flute,
drums, bass, percussion
Brzmienia elektroniczne
Synthesizer, electronic beats,
bass drops, pads, arpeggios,
808 drums, ambient textures
Orkiestra
Full orchestra, brass section,
string ensemble, timpani,
French horn, choir
Przykład z instrumentami
Cinematic orchestral music with soaring strings,
powerful brass, and thundering timpani,
building to an epic climax,
movie trailer style
Tempo i energia
Słowa kluczowe tempa
| Term | BPM | Odczucie |
|---|---|---|
| „Very slow” | 40-60 | medytacyjne |
| „Slow” | 60-80 | relaksujące |
| „Moderate” | 80-100 | spokojne tempo |
| „Upbeat” | 100-120 | energiczne |
| „Fast” | 120-140 | ekscytujące |
| „Very fast” | 140+ | intensywne |
Opis energii
- „Starts soft, builds gradually”
- „High energy throughout”
- „Ebb and flow dynamics”
- „Steady and consistent”
- „Explosive crescendo”
Szablony promptów do muzyki
Muzyka w tle
Prompt Template
[Genre] background music, [mood], [tempo], suitable for [use case], [instruments], [duration note]
Example:
Lo-fi hip hop background music,
relaxing and focused, moderate tempo,
suitable for studying or working,
mellow beats with soft piano and vinyl crackle,
loopable
Soundtrack do wideo
Prompt Template
[Genre] music for [video type], [mood] feeling, [tempo], [instruments], syncs with [visual description]
Example:
Uplifting corporate music for product launch video,
inspiring and professional feeling, moderate upbeat tempo,
piano, light percussion, subtle strings,
builds energy toward the end
Intro do podcastu / YouTube
Prompt Template
[Genre] intro music, [duration] seconds, [mood], [instruments], catchy and memorable, suitable for [content type]
Example:
Modern electronic intro music,
10-15 seconds, energetic and exciting,
punchy synths and driving beat,
catchy and memorable hook,
suitable for tech podcast
Prompty do mowy i voice-overów
Text-to-Speech
Dla Speech-02 i podobnych modeli promptem jest tekst, który ma zostać wypowiedziany:
Prompt Template
[The actual words you want spoken]Cechy głosu
Niektóre modele pozwalają określić cechy głosu:
| Trait | Opcje |
|---|---|
| Gender | Male, female, neutral |
| Age | Young, middle-aged, elderly |
| Tone | Professional, friendly, authoritative |
| Accent | American, British, Australian |
| Speed | Slow, normal, fast |
Przykłady mowy
Professional Narration:
Welcome to our quarterly report.
This presentation covers our key achievements
and strategic initiatives for the coming year.
Friendly Explainer:
Hey there! In this video, we're going to show you
exactly how to get started with our app.
It's super easy, I promise!
Dramatic Trailer:
In a world where technology has changed everything...
one company dares to reimagine the future.
Voice cloning
Aby sklonować głos:
- Upload czystej próbki audio (10–30 sekund)
- Connect do Voice Cloning node
- Provide tekst, który ma zostać wypowiedziany
- AI generuje mowę w tym głosie
Best practices dla próbek
- ✅ czyste nagranie bez szumów
- ✅ tylko jeden mówca
- ✅ naturalne tempo mowy
- ✅ 10–30 sekund mowy
- ❌ muzyka lub szum tła
- ❌ wielu mówców
- ❌ mocno przetworzone audio
Łączenie audio z wideo
Workflow
- Najpierw wygeneruj wideo
- Stwórz audio pasujące do długości wideo
- Połącz w edytorze wideo
Dopasowanie audio do wideo
Zwróć uwagę na:
- Video duration — dopasuj długość audio
- Video mood — audio powinno uzupełniać
- Key moments — beaty mogą zgrywać się z cięciami
- Pacing — szybkie wideo = bardziej energetyczne audio
Najczęstsze błędy w promptach muzyki
❌ Zbyt ogólnie
Nice music
✅ Lepiej
Uplifting acoustic folk music,
warm and hopeful, moderate tempo,
acoustic guitar and light percussion,
suitable for lifestyle brand video
❌ Sprzeczne opisy
Sad and depressing but also happy and upbeat
✅ Lepiej
Bittersweet and nostalgic,
melancholic melody with hopeful undertones
❌ Zbyt technicznie
Music in C major at 120 BPM with
a I-IV-V-I chord progression
✅ Lepiej
Upbeat pop music with a classic,
familiar chord progression,
catchy and singable
Przykłady zastosowań
Tło do YouTube
Upbeat electronic background music,
energetic but not distracting,
moderate-fast tempo,
synth pads and light beats,
suitable for tech review video,
loopable for long videos
Medytacja / relaks
Ambient meditation music,
deeply calming and peaceful,
very slow tempo,
soft pads, gentle bells, nature sounds,
suitable for yoga or sleep
Reklama produktu
Modern corporate music,
confident and innovative feeling,
moderate tempo building to upbeat,
clean synths and subtle percussion,
30 seconds, ends with resolution
Social media reel
Trendy pop music,
catchy and fun, fast tempo,
suitable for Instagram Reels,
15-30 seconds,
hook in first 3 seconds
Strategia iteracji
- Start simple — genre + mood + tempo
- Add instruments — określ kluczowe brzmienia
- Refine energy — opisz dynamikę i build
- Match purpose — dopasuj do use case
Następne kroki
- Audio Nodes — ustawienia Audio node
- Audio & Music Workflow — kompletny proces tworzenia audio
- Video Prompting — generuj wideo do połączenia z audio