Abonnér på vores nyhedsbrev

Succes! Tjek nu din e-mail

For at fuldføre abonnementet, klik på bekræftelseslinket i din indbakke. Hvis det ikke ankommer inden for 3 minutter, tjek din spam-mappe.

Ok, tak
GPT-5: anmeldt og analyseret

GPT-5: anmeldt og analyseret

OpenAI lovede en planetdræber med GPT-5, men leverede i stedet tåkrummende robotter og kedelige benchmarks. Hypet er dødt, AGI er ikke lige rundt om hjørnet, og AI-branchen lærer Apple-lektionen.

Peter Svarre profile image
by Peter Svarre

Det tog Apples iPhone mere end 10 år at gå fra at være et hypet livstilsprodukt til at være et kedeligt og almindeligt teknologiprodukt. Nu har OpenAI gjort det samme med ChatGPT på blot to et halvt år.

Siden ChatGPT blev lanceret i november 2022, er den snakkesalige AI gået fra at være et produkt, der blev lanceret med bragende overskrifter i alverdens medier, til at være et produkt, der modtages med et lunkent ”mnjaa, ok, meget fint…”

I sidste uge lancerede OpenAI deres utroligt længe ventede version 5. Lanceringen har været ventet i flere år, og er blevet forsinket adskillige gange. OpenAI har flere gange mere end antydet, at det ville været et teknologisk kvantespring, og mange i teknologiverdenen forventede, at GPT-5 ville være det sidste afgørende skridt i retning af AGI – altså en kunstig intelligens, der på mange måder er lige så intelligent som mennesker.

OpenAIs CEO postede sågar et par dage før lanceringen et billede af dødsstjernen fra Star Wars – øjensynligt for at antyde, at GPT-5 ville være en planetdræber, der ville sætte alle andre konkurrenter ud af spillet med en lammende dødsstråle. 

OpenAI says latest ChatGPT upgrade is big step forward but still can’t do humans’ jobs
Though GPT-5 model has better coding and writing abilities it is not yet able to ‘continuously learn’

Sam Altman havde bare lige glemt, at det ikke gik så godt for dødsstjernen. Den blev som bekendt sat ud af spillet af en gruppe undertippede rebeller og eksploderede i et sandt festfyrværkeri. Hverken OpenAI eller GPT-5 eksploderede i sidste uge, men hvor lanceringen skulle have været en sejrsfest for en virksomhed, der står til at blive vurderet til en værdi af 500 milliarder dollars, blev det mildest talt lidt af en fuser.

OpenAI claims new GPT-5 model boosts ChatGPT to ‘PhD level’
GPT-5’s release comes as tech firms continue to compete in an effort to claim the world’s most advanced AI.

Tåkrummende robotter

Allerede under selve den videotransmitterede produktlancering kunne man mærke, at der var noget galt. Man havde forsøgt at skabe et uformelt og afslappet studie, hvor OpenAIs produktfolk kunne fortælle om det nye produkt, men i stedet for casual Silicon Valley-hygge mødte seerne en flok stive robotter, der krampagtigt forsøgte at fremstå afslappede mens de lirede deres udenadlærte manuskripter af.

@techcrunch

Watch Sam Altman reveal GPT-5 as OpenAI showcases what's next for its new flasgship model.

♬ original sound - TechCrunch - TechCrunch

Tåkrummende for publikum men måske meget forståeligt, når man ved, at en enkelt lille bøf eller fortalelse kan reducere virksomhedens potentielle markedsværdi med hundredvis af milliarder af kroner. 

GPT-5: Key characteristics, pricing and model card
I’ve had preview access to the new GPT-5 model family for the past two weeks (see related video and my disclosures) and have been using GPT-5 as my daily-driver. It’s …

Men måske skyldtes krampagtigheden i virkeligheden, at produktlanceringen reelt set ikke havde noget nyhedsværdigt indhold. Vi har efterhånden vænnet os til, at OpenAI-lanceringer indeholder mind blowing nye features såsom konverserende assistenter med sexede Scarlett Johansson stemmer, der kan hjælpe desperate forældre med at udregne børnenes andengradsligninger.

Denne lancering havde ingen lækre features, men derimod en masse kedelige tekniske benchmarks, der skulle dokumentere, at GPT-5 var bedre end konkurrenterne på forskellige parametre. Problemet er naturligvis, at teknologivirksomhederne notorisk er kendte for at manipulere disse benchmarks, og det viste sig da også efter lanceringen, at flere benchmarks var tvivlsomme, og at andre vigtige benchmarks (hvor GPT-5 ikke klarede sig så godt) var udeladt fra præsentationen. 

På trods af den manglende nyhedsværdi af selve lanceringen, var der dog flere interessante konklusioner, man kunne udlede af begivenheden:

AGI not so much

For det første kan vi nu for alvor konkludere, at AGI eller superintelligens ikke er lige rundt om hjørnet. Sam Altman har adskillige gange udtalt, at de var på vippen til at skabe en AI, der kan måle sig med mennesker, men lanceringen af GPT-5 viser med al tydelighed, at det er hyberbolsk marketing-snak, som tjener ét formål – nemlig at tiltrække de absurd høje investeringer, som OpenAI har brug for. Forstå mig ret – OpenAI er en imponerende virksomhed og GPT-5 er stadig et helt utrolig brugbart produkt for mange mennesker, men den er ikke på vippen til at gøre mennesker overflødige.

GPT-5 Hands-On: Welcome to the Stone Age
We’re excited to publish our hands-on review from the developer beta.

Disrupterne disruptes

For det andet understregede lanceringen også, at den definitivt vigtigste use case for store sprogmodeller er kodning. Flere eksperter har efter lanceringen bekræftet, at GPT-5 er markant bedre til at kode end tidligere GPT-versioner. Folk i teknologiverdenen har travlt med at fortælle hele verden, at vi alle bliver arbejdsløse, men det er ikke usandsynligt, at massearbejdsløshed primært bliver et problem i teknologisektoren. Disrupterne bliver selv disruptet.

Markant billigere

For det tredje lærte vi, at pris nu er blevet en afgørende faktor i konkurrencen mellem de store AI-virksomheder. Ikke så meget prisen, som almindelige mennesker betaler for at chatte med ChatGPT, men den pris som andre udviklere og virksomheder betaler for at bygge deres egne løsninger oven på OpenAIs modeller (API-adgang). OpenAI havde nemlig valgt at sænke prisen betragteligt for API-adgang, så GPT-5 nu på mange punkter er markant billigere sammenlignet med konkurrenterne. Hvis man betaler 20 dollars om måneden for at skrive lidt artikler med ChatGPT, kan pris virke lidt underordnet, men for de virksomheder, som bygger store løsninger med millioner af brugere ovenpå OpenAI’s modeller, kan små prisforskelle akkumulere til millionregninger.

Akronymoprydning 

For det fjerde må man konkludere, at OpenAI nu betragter ChatGPT som et rigtigt produkt, som fortjener et interface, som er brugervenligt og overskueligt. OpenAI har længe fungeret som en rendyrket AI-virksomhed, som sprøjtede cutting-edge nye modeller ud til brugerne direkte fra laboratoriet. Med det resultat, at ChatGPT blev mere og mere uoverskueligt og esoterisk indforstået for eksperter, der kunne afkode betydningen af akronymer som GPT-4o mini og GPT 3.5 Turbo. Efter lanceringen har OpenAI ryddet op i alle de uoverskuelige modelnavne, og (i skrivende stund) tilbyder de som default en model (auto) som selv vælger om den skal tænke dybt, overfladisk eller hurtigt over en forespørgsel. Derudover kan man så skippe det automatiske valg og selv diktere om man vil have modellen til at tænke hurtigt eller dybt. 

image.png

The New ChatGPT Resets the AI Race
With GPT-5, OpenAI is making its strongest effort yet to hook users.

Speed is of the essence

Ud over brugervenlighed blev det også klart, at AI-modellernes hastighed er blevet et konkurrenceparameter. I starten var vi så benovede over AI-modellernes evne til at skrive og lave billeder, at vi godt kunne tolerere at vente nogle sekunder og nogle gange minutter på deres svar. Men i takt med, at brugen af AI-modeller bliver mere og mere integreret i folks arbejdsliv, begynder hastighed at være en faktor. Hvis man bruger en sprogmodel et par gange om dagen, kan man godt vente lidt på den, men hvis man bruger den et par gange i minuttet, så har hvert sekund betydning. Og meget tyder på, at OpenAI faktisk har fået GPT-5 til at være væsentligt hurtigere end tidligere – også når den skal tænke dybere over brugernes spørgsmål. 

Hallucinationer – bug eller feature?

Endelig er der spørgsmålet om hallucinationer. Her påstod OpenAI til lanceringen, at de markant havde reduceret procentdelen af tilfælde, hvor GPT-5 opfinder usandfærdige svar ud af den blå luft. Mange eksperter har dog sidenhen kritiseret disse tal, og mine egne små tests viser, at hallucinationer stadig er et reelt og betydningsfuldt problem i GPT-5. Jeg bad f.eks. GPT-5 om generere et CV for mig, hvilket resulterede i, at jeg blev cand.mag. i stedet for cand.scient.pol., og at den ene af mine tre bogtitler var ganske fiktiv. Og det på trods af, at disse data er frit tilgængelige adskillige steder på internettet. Konklusionen er, at hallucinationer nok må betragtes mere som en feature end en bug i sprogmodeller. De er med andre ord ikke et problem, man kan slippe af med ved at tweake sprogmodellerne af den simple årsag, at sprogmodeller er bygget på en arkitektur og et princip som betyder, at de altid vil hallucinere. 

GPT-5 prompting guide | OpenAI Cookbook
GPT-5, our newest flagship model, represents a substantial leap forward in agentic task performance, coding, raw intelligence, and steera…

Intet nyt er godt nyt

Så samlet set er der mange grunde til at være skuffet over lanceringen af GPT-5. Men man kunne også vende den undervældende lancering på hovedet og sige, at det faktisk er godt ny for de mennesker og virksomheder, som er storforbrugere af OpenAIs modeller. Lanceringen viste nemlig, at der er benhård og reel konkurrence på markedet for sprogmodeller, hvilket betyder at forbrugerne i sidste ende vil få bedre og billigere AI-løsninger i hænderne. Lanceringen viste også, at vi kan begynde at slappe lidt af i forhold til de overdrevne forventninger om, hvad vi kan forvente i morgen. I stedet kan vi fokusere på, hvad AI-modeller kan i dag og bruge dem til at bygge nyttige, brugervenlige og etiske løsninger. Og endelig viste lanceringen, at robotterne nok alligevel ikke udkonkurrerer menneskeheden i morgen. Og det er da alligevel en nyhed, der er værd at tage med fra en ellers nyhedsfattig lancering.

ChatGPT-5 underwhelming you? Here’s what it can do that older models couldn’t—and where other AI chatbots still shine
OpenAI had glowing things to say about ChatGPT-5. Users aren’t as convinced.

Læs mere

What’s the Deal With GPT-5?
While OpenAI’s long-awaited new model may not impress everyone, there are still a few ways it’s a sign of things to come.
GPT-5 is here. Now what?
The much-hyped release makes several enhancements to the ChatGPT user experience. But it’s still far short of AGI.
The Anatomy of a GPT-5 Prompt: | How to Prompt | 95 comments
The Anatomy of a GPT-5 Prompt: 1. Role Define a clear role for the model to adopt. 2. Task State exactly what you want it to do. Be explicit about the desired action or outcome. 3. Context Give the model everything it needs to perform well. Include background details, constraints, examples. 4. Reasoning Instruction Prompt it to think through the problem. Request that GPT-5 explain its reasoning, or follow a logical COT before giving the final answer. 5. Output Format Specify how you want the answer presented. List the format clearly (bullet points, numbered steps, tables, narrative paragraphs). 6. Stop Conditions Set boundaries for the response. This could mean limiting the length, ending at a certain step. To read the full breakdown about GPT-5, go to: https://lnkd.in/dqA5FBfR | 95 comments on LinkedIn
OpenAI says latest ChatGPT upgrade is big step forward but still can’t do humans’ jobs
Though GPT-5 model has better coding and writing abilities it is not yet able to ‘continuously learn’

https://platform.openai.com/chat/edit?models=gpt-5&optimize=true

GPT-5 represents OpenAI’s most capable and nuanced model yet. It advances the state of the art in language modeling while signaling a shift toward intelligent software agents.
For users and developers alike, GPT-5 is an opportunity to do more—but also a call to think harder about what “intelligence” should mean in machines, and how we want to shape their role in society.

Peter Svarre profile image
af Peter Svarre

Subscribe to New Posts

CROC

Succes! Tjek nu din e-mail

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, tak

Læs mere