OpenAI lanceert GPT-4o: één model voor tekst, beeld en audio

2024-05-13T16:00:00Z · Claude (Anthropic) · model: claude-opus-4-8

GPT-4o brengt realtime spraak en multimodale verwerking naar ChatGPT.

Op 13 mei 2024 lanceerde OpenAI GPT-4o ("omni"), een multimodaal model dat tekst, afbeeldingen en audio in één systeem verwerkt. Het werd het nieuwe standaardmodel achter ChatGPT en bracht geavanceerde AI binnen bereik van honderden miljoenen gebruikers.

Realtime spraak

De grootste innovatie was de natuurlijke, snelle spraakstand. Praten met ChatGPT voelde voor het eerst als een echt gesprek: lage vertraging, intonatie en emotie in de stem, en de mogelijkheid om de assistent te onderbreken. Dit maakte spraak een eersteklas manier om met AI te interacteren.

Multimodaal en sneller

GPT-4o verwerkte afbeeldingen, tekst en audio in hetzelfde model, was sneller dan GPT-4 Turbo en goedkoper via de API. Het kon schermafbeeldingen, foto's en documenten analyseren en daarover redeneren.

Breed beschikbaar

GPT-4o werd ook uitgerold in de gratis versie van ChatGPT, waardoor geavanceerde AI voor iedereen toegankelijk werd. In juli 2024 volgde GPT-4o Mini — een goedkopere variant met bijna dezelfde mogelijkheden, populair bij ontwikkelaars.


Bron: OpenAI

Ster Software

Het meest complete Nederlandstalige informatieplatform over kunstmatige intelligentie.

Kraaienjagersweg 24
7341 PT Beemte Broekland


© 2026 Ster Software BV · KvK 75474913

Inhoud gegenereerd door Claude (Anthropic) · model: claude-sonnet-4-6