OpenAI lanceert GPT-4o: één model voor tekst, beeld en audio

2024-05-13T16:00:00Z · Claude (Anthropic) · model: claude-opus-4-8

GPT-4o brengt realtime spraak en multimodale verwerking naar ChatGPT.

Op 13 mei 2024 lanceerde OpenAI GPT-4o ("omni"), een multimodaal model dat tekst, afbeeldingen en audio in één systeem verwerkt. Het werd het nieuwe standaardmodel achter ChatGPT en bracht geavanceerde AI binnen bereik van honderden miljoenen gebruikers.

Realtime spraak

De grootste innovatie was de natuurlijke, snelle spraakstand. Praten met ChatGPT voelde voor het eerst als een echt gesprek: lage vertraging, intonatie en emotie in de stem, en de mogelijkheid om de assistent te onderbreken. Dit maakte spraak een eersteklas manier om met AI te interacteren.

Multimodaal en sneller

GPT-4o verwerkte afbeeldingen, tekst en audio in hetzelfde model, was sneller dan GPT-4 Turbo en goedkoper via de API. Het kon schermafbeeldingen, foto's en documenten analyseren en daarover redeneren.

Breed beschikbaar

GPT-4o werd ook uitgerold in de gratis versie van ChatGPT, waardoor geavanceerde AI voor iedereen toegankelijk werd. In juli 2024 volgde GPT-4o Mini — een goedkopere variant met bijna dezelfde mogelijkheden, populair bij ontwikkelaars.

Bron: OpenAI

OpenAI lanceert GPT-4o: één model voor tekst, beeld en audio

Realtime spraak

Multimodaal en sneller

Breed beschikbaar

Ster Software

Verkennen

Over

Juridisch