Subscribe to Our Newsletter

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks

Videnskabsformidling 2.0 med multimodal AI

Brian Due profile image
by Brian Due
Videnskabsformidling 2.0 med multimodal AI

For to uger siden skete et vildt gennembrud i AI hvis I spørger mig. En gang til. Googles NotebookLM introducerede en funktion kaldet "generate conversation", som giver dig mulighed for at lytte til AI-genererede samtaler om egne eller andres artikler, noter og så videre. 

Med et enkelt klik engagerer to AI-værter sig i en dybdegående samtale ud fra et uploadet dokument. Gennem samtale opsummerer værterne materialet, skaber forbindelser mellem emner og endda småsnakker. Det er AI podcasts.

Læs fx Jesper Andersens fine opsummering her

Denne funktion hjælper ikke kun med at forstå komplekse informationer mere effektivt, men kan også gøre læringsprocesser mere engagerende og tilgængelige. Måske. Man kan så kan downloade disse samtaler og lytte til dem på farten eller hvad man nu gør med lyd. 

Jeg blev overbevist da jeg uploadede min frit tilgængelige artikel: A Walk in the Park With Robodog: Navigating Around Pedestrians Using a Spot Robot as a “Guide Dog”. Den kan læses lige her:

Hvis man dog ikke ønsker at læse denne tørre akademiske artikel, har jeg nu fået Googles to AI-værter til at føre en samtale ala podcast-stil baseret på artiklen. Jeg er efterladt måbende. 

Min multimodal interaktionsanalyse nu som multimodal AI. Hør samtalen her:

audio-thumbnail
Untitled notebook
0:00
/531.88

 

Den større trend inden for multimodal AI

Funktionen er en del af en bredere trend inden for multimodal AI. Multimodal AI refererer til systemer, der kan behandle og integrere flere typer data, såsom tekst, billeder og lyd, for at skabe en mere holistisk forståelse af information. Denne tilgang spejler, hvordan mennesker naturligt opfatter og interagerer med verden, ved at bruge forskellige sanser til at danne et komplet billede.

Ideen er at multimodal AI muliggør mere naturlige og intuitive interaktioner mellem mennesker og maskiner. Ved at integrere forskellige typer data kan disse systemer bedre forstå konteksten og levere mere relevante svar. 

At sikre nøjagtigheden og pålideligheden af AI-genereret indhold er klart en bekymring. Der er mange udfordringer selvsagt. AI-agenternes samtale er videnskabsformidling. Ligesom al anden formidling er der shortcommings.

Få også de gode links her fra The Verge

Brian Due profile image
by Brian Due

Subscribe to New Posts

Copenhagen Review of Communication er et medie for alle, som arbejder med kommunikation. Vores mission er at gøre os kommunikationsfolk endnu bedre til vores arbejde.

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks

Read More