Hvordan skriver man Midjourney prompts?

Et Midjourney prompt er en tekstinstruktion, der fortæller AI-modellen, hvilket billede den skal generere. Kvaliteten af promptet bestemmer direkte kvaliteten og relevansen af det endelige billede. Det er en kombination af beskrivende ord, stilistiske referencer og tekniske parametre, der styrer billedgenereringen.

Grundlæggende Anatomi af et Prompt

Et effektivt prompt består af flere byggeklodser, der tilsammen former AI-modellens output. Den mest basale struktur indeholder et hovedmotiv, som er det centrale element i billedet. Det kan være en person, et dyr, en genstand eller et landskab. Uden et klart defineret motiv vil modellen ofte producere abstrakte eller usammenhængende resultater.

Ud over motivet er beskrivende detaljer afgørende. Adjektiver og kontekstuelle oplysninger giver billedet dybde og specificitet. I stedet for blot at skrive “en hund”, kan man specificere “en glad golden retriever hvalp, der leger i en mark med højt græs i solnedgangen”. Disse detaljer styrer modellens valg af farver, lyssætning og komposition.

Stil og medie er ligeledes centrale komponenter. Her definerer du den visuelle æstetik. Ønsker du et fotografi, et oliemaleri, en akvarel, en 3D-rendering eller en tegneserietegning? Ved at specificere mediet og stilen, for eksempel “hyperrealistisk fotografi” eller “impressionistisk oliemaleri”, indsnævrer du de kreative muligheder og opnår et mere forudsigeligt resultat.

Endelig kan kompositionelle instruktioner tilføjes. Ord som “close-up”, “wide-angle shot” eller “fra fugleperspektiv” guider kameraets placering og billedets indramning. Samlet set udgør disse elementer – motiv, detaljer, stil og komposition – fundamentet for et vellykket prompt, der effektivt kommunikerer din vision til AI’en.

Betydningen af Nøgleord og Beskrivelser

Præcision i ordvalg er altafgørende for resultatet i Midjourney. Modellen fortolker hvert ord i et prompt og vægter dem i forhold til hinanden. Vage eller tvetydige termer fører ofte til generiske billeder, der ikke matcher brugerens intention. Jo mere specifik du er, desto større kontrol har du over det endelige billede.

Brug af stærke og stemningsfulde adjektiver kan dramatisk ændre et billedes udtryk. Ord som “dyster”, “melankolsk”, “levende”, “kaotisk” eller “fredfyldt” instruerer modellen i at anvende bestemte farvepaletter, lyssætninger og kompositioner, der understøtter den ønskede atmosfære. Det er vores erfaring, at en velvalgt række af adjektiver er en af de mest effektive måder at styre et billedes følelsesmæssige tone.

Rækkefølgen af ord har også betydning. De ord, der står først i promptet, tillægges typisk mere vægt af modellen. Hvis dit primære motiv er en “cykelrytter i bjergene”, bør disse ord placeres tidligt. Mindre vigtige detaljer, som “overskyet vejr”, kan med fordel placeres senere i promptet. Denne struktur hjælper AI’en med at prioritere elementerne korrekt.

At forstå, hvordan modellen “tænker”, er en del af processen. Den har ikke en menneskelig forståelse, men genkender mønstre fra de milliarder af billeder, den er trænet på. Et vellykket prompt fungerer som et præcist søgefilter i dette enorme visuelle bibliotek. Processen minder om, hvordan en AI-agent nedbryder en kompleks opgave i mindre, håndterbare trin for at nå et mål.

Avancerede Parametre og Kommandoer

Ud over beskrivende tekst giver Midjourney adgang til en række tekniske parametre, der finjusterer billedgenereringen. Disse kommandoer tilføjes typisk i slutningen af et prompt og indledes med to bindestreger. De giver en mere teknisk kontrol over outputtet, som ikke kan opnås med ord alene.

En af de mest anvendte parametre er billedformatet, som styres med `–ar` (aspect ratio). Standardformatet er 1:1 (kvadratisk), men ved at skrive `–ar 16:9` kan du skabe billeder i bredformat, velegnet til skærmbaggrunde eller video. Tilsvarende kan `–ar 2:3` bruges til portrætformater, som ofte ses på sociale medier.

Stiliseringsgraden kan justeres med `–s` (stylize). Denne parameter styrer, hvor kunstnerisk og fortolkende Midjourney skal være. En lav værdi (f.eks. `–s 50`) holder sig tættere på promptets bogstavelige beskrivelse, mens en høj værdi (f.eks. `–s 750`) giver modellen mere kreativ frihed til at skabe et æstetisk og poleret billede.

Negative prompts er et andet kraftfuldt værktøj, som aktiveres med `–no`. Hvis du for eksempel vil generere et billede af en skov uden mennesker, kan du tilføje `–no people`. Dette instruerer modellen i at undgå specifikke elementer. Andre nyttige parametre inkluderer:

`–c` (chaos): Justerer, hvor varierede de indledende billeder i et grid skal være. En højere værdi giver mere uforudsigelige resultater.
`–v` (version): Gør det muligt at vælge en specifik version af Midjourney-modellen, f.eks. `–v 6.0`.
`–style raw`: Anvendes for at opnå et mindre poleret og mere fotografisk “råt” udtryk.

En komplet og opdateret liste over kommandoer findes i den officielle Midjourney dokumentation.

Stilistiske Referencer og Kunstneriske Udtryk

En af de mest effektive metoder til at styre den visuelle stil i Midjourney er at referere til kendte kunstnere, kunstretninger, fotografer eller film. Modellen er trænet på et datasæt, der indeholder et bredt udsnit af verdens kunsthistorie og visuelle kultur, hvilket gør den i stand til at efterligne specifikke æstetikker.

Ved at inkludere “i stil med Vincent van Gogh” vil modellen forsøge at genskabe hans karakteristiske penselstrøg og farvebrug. Tilsvarende kan referencer til kunstretninger som “surrealisme”, “kubisme” eller “art nouveau” guide billedets overordnede komposition og tematik. Dette giver brugeren mulighed for at skabe billeder med en specifik historisk eller kunstnerisk forankring.

Fotografiske termer er ligeledes effektive. Du kan specificere kameratype (“Leica M11”), objektiv (“85mm f/1.4”), filmtype (“Kodak Portra 400”) eller lyssætning (“cinematic lighting”, “golden hour”). Disse referencer hjælper modellen med at genskabe den tekniske kvalitet og stemning, der er forbundet med professionelt fotoudstyr og -teknikker. I praksis ser vi ofte, at kombinationen af en kunstnerisk stil og en specifik kameratype giver unikke og kontrollerede resultater.

Det er også muligt at henvise til stilarter fra computerspil, film eller specifikke instruktører. Prompts som “i stil med en Studio Ghibli film” eller “cinematografi af Wes Anderson” giver klare instruktioner om farvepalet, symmetri og karakterdesign. Denne metode er særligt nyttig for konceptkunstnere og designere, der hurtigt vil visualisere en idé inden for en etableret visuel ramme.

Iteration og Forfining af Prompts

Det er sjældent, at det første prompt giver det perfekte resultat. Billedgenerering med Midjourney er en iterativ proces, hvor man gradvist forfiner sine instruktioner baseret på modellens output. Værktøjets indbyggede funktioner til variation og redigering er designet til at understøtte denne arbejdsgang.

Når Midjourney har genereret et grid med fire billeder, præsenteres du for en række knapper. U-knapperne (U1-U4) bruges til at opskalere et af de fire billeder til en højere opløsning. V-knapperne (V1-V4) bruges til at skabe fire nye variationer baseret på det valgte billede. Denne funktion er ideel, når et billede er tæt på det ønskede resultat, men mangler en sidste detalje.

Remix-funktionen er et endnu mere avanceret værktøj til forfining. Når den er aktiveret, giver V-knapperne mulighed for at redigere det oprindelige prompt, før der genereres nye variationer. Dette gør det muligt at tilføje, fjerne eller ændre nøgleord for at justere komposition, farver eller elementer i billedet uden at starte helt forfra.

En systematisk tilgang til iteration indebærer at ændre én variabel ad gangen. Hvis lyssætningen er forkert, kan du justere den del af promptet og se resultatet, før du ændrer på andre elementer. Denne metode giver en bedre forståelse af, hvordan specifikke ord påvirker outputtet. Processen med at forfine kreative resultater ses også i andre AI-værktøjer, som for eksempel dem der bruges til AI musikrevolution.

Almindelige Udfordringer og Løsninger

Selvom Midjourney er en avanceret model, har den visse begrænsninger. En af de mest kendte udfordringer er gengivelsen af hænder og fingre. Modellen kan have svært ved at skabe anatomisk korrekte hænder, hvilket ofte resulterer i billeder med for mange eller for få fingre. En løsning kan være at bruge negative prompts som `–no hands` eller at formulere promptet, så hænderne er skjulte.

Tekst i billeder er en anden hyppig udfordring. Midjourney er en billedmodel, ikke en sprogmodel, og den “tegner” bogstaver som visuelle former uden at forstå deres betydning. Dette fører til ulæselig eller meningsløs tekst. Hvis tekst er nødvendig, er den bedste løsning at generere billedet uden tekst og efterfølgende tilføje den i et billedbehandlingsprogram.

Modellen kan også have svært ved at forstå komplekse relationer mellem flere objekter eller personer i et billede. Et prompt som “en mand, der giver en kvinde et rødt æble” kan blive fortolket forkert, hvor kvinden holder æblet, eller farven er forkert. For at løse dette kan man simplificere promptet eller generere elementerne separat og kombinere dem senere. AI-modellers tendens til at misforstå eller “hallucinere” er ikke unik for billedgenerering; selv store sprogmodeller kan give faktuelt forkerte svar, som det blev set da Google anbefalede lim på pizza.

En generel løsningsmodel er at “re-rolle” eller køre det samme prompt flere gange. På grund af den indbyggede tilfældighed i genereringsprocessen vil hvert forsøg give et unikt resultat. Ofte kan det rette billede opnås ved blot at prøve igen et par gange, indtil modellen rammer den ønskede komposition.

Anvendelse i en Dansk Virksomhedskontekst

For danske virksomheder åbner Midjourney op for en række praktiske anvendelsesmuligheder, især inden for marketing, design og produktudvikling. Værktøjet kan markant reducere omkostninger og tidsforbrug i de tidlige faser af kreative processer.

Inden for marketing kan Midjourney bruges til hurtigt at generere visuelt indhold til sociale medier, blogindlæg og digitale annoncer. En virksomhed kan skabe unikke billeder, der matcher en specifik kampagnes stil og budskab, uden at være afhængig af dyre stock-fotos eller tidskrævende fotoshoots. Dette giver især mindre virksomheder mulighed for at producere professionelt udseende materiale med begrænsede ressourcer.

Designere og arkitekter kan anvende teknologien til konceptvisualisering. I stedet for at bruge timer på at tegne de første skitser til et nyt produkt, en bygning eller et interiør, kan de generere en række visuelle forslag på få minutter. Disse billeder kan fungere som et fælles udgangspunkt for diskussioner med kunder og internt i teamet, hvilket accelererer udviklingsprocessen.

E-handelsvirksomheder kan bruge Midjourney til at skabe inspirerende miljøbilleder eller mockups af deres produkter. Et tøjmærke kan for eksempel visualisere en ny kollektion i forskellige scenarier og stilarter, længe før de første prototyper er produceret. Dette er en del af den bredere tendens, hvor små virksomheder kan lære af AI-revolutionen ved at integrere nye teknologier i deres drift.

Etiske Overvejelser og Ophavsret

Brugen af AI-billedgeneratorer som Midjourney rejser en række etiske og juridiske spørgsmål, som er relevante for danske brugere og virksomheder. Et centralt emne er ophavsret. Ifølge Midjourneys brugsbetingelser ejer betalende abonnenter som udgangspunkt de billeder, de skaber. Den juridiske status for AI-genereret kunst er dog stadig under udvikling globalt, og der er endnu ikke fuld klarhed over, hvordan dansk og europæisk lovgivning vil forholde sig på lang sigt.

Et andet etisk dilemma er muligheden for at efterligne nulevende kunstneres stil. Selvom det kan være et kraftfuldt kreativt værktøj, kan det også ses som en devaluering af kunstnerens unikke arbejde og brand. Debatten om, hvor grænsen går mellem inspiration og kopiering, er intens i kreative brancher. Nogle kunstnere har udtrykt bekymring for, at deres stil bliver brugt uden samtykke eller kompensation.

EU’s AI Act, som er en omfattende regulering af kunstig intelligens, stiller krav om gennemsigtighed for generative AI-systemer. Det betyder, at indhold skabt af AI, som f.eks. billeder fra Midjourney, i mange tilfælde skal mærkes som værende AI-genereret. Formålet er at modvirke misinformation og deepfakes. Virksomheder, der bruger AI-genererede billeder kommercielt, skal være opmærksomme på disse kommende krav, som kan findes på EU’s officielle side om lovgivningen.

Endelig er der risikoen for misbrug til at skabe vildledende eller skadeligt indhold. Selvom Midjourney har indbyggede filtre, der forsøger at forhindre generering af voldeligt eller upassende indhold, er det brugerens ansvar at anvende teknologien etisk forsvarligt. Dette gælder især i forhold til at skabe billeder af virkelige personer uden deres samtykke.