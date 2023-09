San Francisco (awp/afp) – OpenAI sa mandag at de hadde utstyrt ChatGPT-programmet for kunstig intelligens (AI) med stemme og syn for å gjøre det «mer intuitivt».

Grensesnittet som er blitt populært av generativ AI (i stand til å produsere tekst, bilder og annet innhold gjennom en enkel forespørsel på dagligspråk) vil snart kunne behandle forespørsler som inneholder bilder og også chatte muntlig med brukerne.

De vil for eksempel kunne ta et bilde av et monument og «ha en samtale med ChatGPT» om bygningens historie, eller til og med vise programvaren hva som er i kjøleskapet deres slik at det kan foreslå en oppskrift, foreslår han. OpenAI i en pressemelding.

Andre mulige brukstilfeller avhengig av oppstart: hjelpe barna med å gjøre leksene sine (for eksempel ved å ta et bilde av et matematisk problem) eller til og med be chatboten fortelle dem en historie før de legger seg.

Disse nye verktøyene vil bli rullet ut i løpet av de neste to ukene til abonnenter av ChatGPT Plus, den betalte versjonen av chatboten, eller kundeorganisasjoner av tjenesten.

Selskapet annonserte det kommende tillegget av disse funksjonene i mars i fjor, under presentasjonen av GPT-4, den nyeste versjonen av språkmodellen, teknologien som chatGPT er basert på.

GPT-4 er multimedia, i den forstand at den kan behandle andre data enn tekst eller datakode.

Suksessen til ChatGPT siden slutten av 2022 har ført til et stort kappløp for generativ kunstig intelligens blant teknologigiganter, med Google og Microsoft i spissen.

Men den raske distribusjonen av disse fortsatt svært dårlig regulerte programmene vekker også mye bekymring, spesielt fordi de har en tendens til å «hallusinere», det vil si å finne opp svar fra bunnen av.

«Visjonsmodeller byr på nye utfordringer, fra hallusinasjoner til å få folk til å stole på programmets bildetolkning i høyrisikodomener,» erkjente OpenAI i sin mandagsuttalelse.

Oppstarten hevder å ha «testet modellen» på emner som ekstremisme og vitenskapelig kunnskap og har bruksområder i det virkelige liv og tilbakemeldinger fra brukere for å forbedre.

Han begrenset videre ChatGPTs evner til å «analysere folk» fordi grensesnittet «ikke alltid er nøyaktig og disse systemene må respektere folks personvern.»

Strømmeplattformen Spotify annonserte også mandag et samarbeid med OpenAI for å oversette podcaster direkte med AI.

Kringkastinger tatt opp på engelsk vil nå være tilgjengelig på andre språk «samtidig som høyttalerens særegne vokalegenskaper opprettholdes,» sa tjenesten i en uttalelse.

Det svenske selskapet sørger for at OpenAIs nye stemmegenereringsteknologi «reproduserer stilen til den originale høyttaleren, noe som gir mulighet for en mer autentisk, mer personlig og mer naturlig lytteopplevelse enn tradisjonell dubbing.»

afp/rp