Claude Sonnet 5 som agentisk AI-model

Claude Sonnet 5 er Anthropics nye Sonnet-model til agentisk arbejde: den kan planlægge, bruge værktøjer og følge længere opgaver mere selvstændigt end tidligere Sonnet-modeller, men den kræver stadig klare rammer, datakontrol og menneskelig vurdering i følsomme arbejdsgange.

Artiklens hovedpointer:

Claude Sonnet 5 gør agentisk AI mere praktisk til kodning, research og dokumentarbejde, men kræver stadig klare adgangsgrænser og menneskelig kontrol. Overblikket forklarer modellens tilgængelighed, pris, sikkerhedsforbehold og betydning for organisationer, der skal håndtere persondata, logning og EU-regler.

Hvad er den centrale nyhed?

Anthropic lancerede Claude Sonnet 5 den 30. juni 2026. Modellen er ifølge selskabet tilgængelig på alle Claude-planer, er standardmodel for Free og Pro, kan bruges i Claude Code og findes på Claude Platform med modelnavnet claude-sonnet-5.

Nyheden handler ikke kun om endnu en modelversion. Sonnet-klassen bruges ofte som arbejdsmodel, hvor pris, hastighed og stabilitet betyder lige så meget som den absolut højeste modelkapacitet. Derfor er en stærkere Sonnet-model relevant for udviklere, vidensmedarbejdere og organisationer, der vil bruge AI til flertrinsopgaver uden at gå direkte til de dyreste modeller.

Hvad betyder agentisk AI i denne sammenhæng?

Agentisk AI betyder, at modellen ikke kun svarer på én besked ad gangen, men kan planlægge en opgave, vælge næste trin, bruge værktøjer og kontrollere resultatet undervejs. En klassisk chatbot venter typisk på næste instruktion, mens en AI-agent kan udføre flere handlinger i samme arbejdsgang.

Anthropic beskriver Sonnet 5 som den mest agentiske Sonnet-model hidtil. Det dækker især opgaver som kodning, terminalbrug, browserbrug, informationssøgning og vidensarbejde, hvor modellen skal holde en plan i gang over flere trin. Det gør modellen mere relevant for AI-workflows, hvor opgaven har en tydelig sluttilstand og kan verificeres.

Hvordan adskiller Sonnet 5 sig fra tidligere Sonnet-modeller?

Anthropic fremhæver forbedringer i ræsonnement, værktøjsbrug, kodning og videnstunge opgaver sammenlignet med Claude Sonnet 4.6. Selskabet skriver også, at Sonnet 5 mindsker afstanden til Claude Opus 4.8, men til en lavere pris.

Den praktiske forskel er, at flere opgaver kan flyttes fra enkeltstående beskeder til længere forløb, hvor modellen selv opdager manglende information, skriver tests eller kontrollerer et resultat. Det gør ikke modellen fejlfri. Det betyder, at fejl ofte flytter sig fra simple svarfejl til procesfejl: forkert værktøjsvalg, for bred adgang til data eller for svag kontrol af afslutningen.

Hvordan placerer modellen sig i Claude-familien?

Anthropics dokumentation placerer Sonnet 5 mellem de mest kapable Opus-modeller og den hurtigere Haiku-klasse. Tabellen viser de officielle hovedtal, som er relevante, når modellen vurderes til praktisk brug.

Udvalgte officielle oplysninger om aktuelle Claude-modeller
ModelPrimær rolleKontekstvindueStandardpris pr. mio. tokens
Claude Opus 4.8Mest kapable Opus-model til komplekst ræsonnement og høj autonomi1 million tokens5 dollar input og 25 dollar output
Claude Sonnet 5Kombination af hastighed, intelligens og agentisk arbejde1 million tokens3 dollar input og 15 dollar output efter introduktionsperioden
Claude Haiku 4.5Hurtig model til opgaver, hvor lav ventetid vejer tungt200.000 tokens1 dollar input og 5 dollar output

Anthropic har sat en introduktionspris for Sonnet 5 på 2 dollar pr. million inputtokens og 10 dollar pr. million outputtokens frem til 31. august 2026. Derefter gælder standardprisen i dokumentationen.

Hvad kan modellen bruges til i praksis?

Sonnet 5 er mest relevant, når en AI-opgave har flere trin og et resultat, der kan kontrolleres. Det kan være at analysere en fejlrapport, gennemgå kode, samle oplysninger fra flere dokumenter, foreslå ændringer i en arbejdsproces eller hjælpe med at skrive og kvalitetstjekke tekst.

  • Udviklere kan bruge modellen til kodning, fejlretning og testforslag, men bør stadig gennemgå ændringer, afhængigheder og sikkerhed.
  • Vidensmedarbejdere kan bruge den til research og dokumentarbejde, hvis kilder, versioner og datagrundlag holdes tydelige.
  • Organisationer kan afprøve den i afgrænsede Claude Code-workflows, hvor opgaven har logning og menneskelig godkendelse.

Den vigtigste gevinst er ikke, at modellen erstatter faglig vurdering. Den ligger i at reducere manuelt mellemarbejde, når opgaven kan beskrives, afgrænses og kontrolleres.

Hvad kan modellen ikke afgøre alene?

Sonnet 5 kan stadig hallucinere, overse kontekst eller vælge en forkert fremgangsmåde. En mere agentisk model kan også lave flere handlinger, før et menneske opdager fejlen. Derfor skal opgaver med økonomi, persondata, sikkerhed, jura, ansættelse, sundhed eller offentlig sagsbehandling have tydelige stopregler og menneskelig kontrol.

Modellen bør heller ikke bruges som eneste kilde til faktuelle beslutninger. Hvis den opsummerer dokumenter, foreslår kodeændringer eller vurderer risici, skal resultatet kunne spores til konkrete kilder, logs eller tests. Det minder om problemstillingen ved evaluering af AI-modeller: benchmarktal og leverandørbeskrivelser er nyttige, men de erstatter ikke lokal test i den konkrete arbejdsgang.

Hvordan påvirker sikkerhedsvurderingen brugen?

Anthropic skriver, at Sonnet 5 samlet set viser færre uønskede adfærdsmønstre end Sonnet 4.6 i selskabets egne sikkerhedstests. Selskabet skriver også, at modellen har væsentligt lavere evne til farlige cybersikkerhedsopgaver end de nuværende Opus-modeller.

Samtidig er Sonnet 5 lanceret med realtidsbeskyttelse mod farlig cyberbrug. Det kan begrænse visse anmodninger, især hvor en opgave ligner udvikling af exploits, masseudtræk af data eller offensiv sikkerhedstest. For legitime sikkerhedsteams betyder det, at adgang, godkendelse og dokumenteret formål kan blive en del af den praktiske modelstyring.

Hvad betyder det for organisationer i Danmark?

Anthropic skriver, at Sonnet 5 er tilgængelig overalt fra lanceringsdagen. For organisationer i Danmark er den centrale vurdering alligevel ikke kun adgang, men hvordan modellen bruges med persondata, fortrolige dokumenter, ophavsretligt materiale og beslutninger, der påvirker mennesker.

Hvis modellen bruges i almindeligt vidensarbejde, vil fokus typisk være databehandleraftaler, adgangsstyring, logning og klare regler for, hvilke oplysninger der må sendes til en ekstern model. Hvis den bruges i rekruttering, uddannelse, offentlige processer eller andre områder med mulig høj risiko, skal vurderingen også forholde sig til EU’s AI-forordning og krav om gennemsigtighed, menneskelig kontrol og risikostyring.

Hvilke datakontroller bør være på plads?

En agentisk model kan få adgang til filer, terminaler, browsere, cloudmiljøer og interne værktøjer. Det gør adgangsstyring mere konkret end ved almindelig chat. Den praktiske kontrol bør derfor ligge før opgaven startes, mens den kører, og når resultatet godkendes.

  1. Afgræns hvilke filer, systemer og konti modellen må bruge.
  2. Brug testmiljøer eller skrivebeskyttet adgang, når opgaven kan ændre data.
  3. Log værktøjskald, instruktioner, ændringsforslag og endelige beslutninger.
  4. Lad et menneske godkende handlinger med økonomisk, juridisk eller organisatorisk betydning.
  5. Kontrollér om persondata, fortrolige oplysninger eller kundedata behandles efter gældende regler.

Disse punkter ligger tæt på den bredere disciplin omkring datafortrolighed i generativ AI, men agentiske funktioner gør kontrollen mere operationel, fordi modellen kan handle gennem værktøjer.

Hvordan bør prisen forstås?

Tokenpriser fortæller kun en del af økonomien. En agentisk model kan bruge mange tokens, fordi den planlægger, læser dokumenter, kalder værktøjer og kontrollerer sit eget arbejde. Den lavere Sonnet-pris kan derfor være attraktiv, men omkostningen afhænger af opgavens længde, kontekststørrelse, gentagelser og hvor meget output der genereres.

Det er derfor mere præcist at måle pris pr. færdig opgave end pris pr. enkelt svar. En kort chat kan være billig, mens en lang agentkørsel med mange værktøjskald kan bruge langt mere. Rate limits, adgangsniveauer og introduktionsprisens udløb den 31. august 2026 bør også indgå i en realistisk test.

Hvad bør testes før bred brug?

En ny modelversion bør ikke kun vurderes på leverandørens generelle benchmarktal. Den bør testes på egne opgaver med kendte svar, realistiske dokumenter og tydelige fejlscenarier. Det gælder især, når modellen skal bruge værktøjer eller foreslå ændringer i kode, data eller forretningsprocesser.

  • Test om modellen afslutter opgaven korrekt, ikke kun om den svarer flydende.
  • Kontrollér om den beder om manglende information i stedet for at gætte.
  • Sammenlign resultater med tidligere modelversioner på samme opgaver.
  • Mål fejl, tidsforbrug, tokenforbrug og behov for menneskelig rettelse.

Det giver et mere brugbart billede end at spørge, om modellen generelt er bedre. Den afgørende forskel er, om Sonnet 5 er mere stabil i de konkrete processer, hvor den faktisk skal bruges.

Hvad er den realistiske betydning?

Claude Sonnet 5 peger på en bredere udvikling, hvor mellemklassen af store sprogmodeller bliver stærk nok til flere agentiske opgaver. Det kan gøre AI-assisteret kodning, dokumentarbejde og analyse mere praktisk i hverdagen, fordi flere opgaver kan løses med en model, der er billigere end topmodellerne.

Den realistiske begrænsning er, at agentisk kapacitet øger behovet for styring. Jo mere modellen kan gøre selv, desto vigtigere bliver adgangsgrænser, kildekontrol, test, logning og klare stopkriterier. Sonnet 5 bør derfor forstås som et stærkere arbejdsled i en kontrolleret proces, ikke som en autonom beslutningstager.

Hvilke kilder ligger til grund?

Artiklen bygger på Anthropics lancering af Claude Sonnet 5, den officielle Claude-modeldokumentation og Anthropics beskrivelse af realtidsbeskyttelse mod farlig cyberbrug. Den lokale reguleringsvinkel er kontrolleret mod Europa-Kommissionens sider om AI-forordningen og EU’s databeskyttelsesregler.