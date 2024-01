I 2023 ble verden erobret av ChatGPT-bølgen: for allmennheten var det «endelig en kunstig intelligens som snakker til meg», bokstavelig talt. For første gang er dette en type verktøy som ser ut til å forstå våre forespørsler, som formulerer svar, som husker historien til samtalen, som kan omformulere om nødvendig, osv. Evner langt utover hva selv eksperter forventet et år eller to tidligere.

Disse egenskapene ble muliggjort takket være betydelige fremskritt i den såkalte LLM, Store språkmodellergigantiske datakonstruksjoner med mer enn hundre milliarder parametere (GPT 3.5 ble annonsert i 175 B – for «milliard» – en milliard parametere). Det var noe nesten magisk der: de såkalte «emergent» egenskapene dukket opp med økende parametere og plutselig ble AI i stand til å løse visse typer problemer som GPT 2 med sin 1,5 B var ganske ute av stand til … Kappløp for ren kraft Dette lanserte de store aktørene (OpenAI, Google, Microsoft, Meta, men også bredt finansierte startups som Anthropic, Mistral, etc.) inn i kappløpet om ren energi: kostnadene for infrastrukturen som er nødvendig for å utvikle nye teknologier ble estimert til titalls millioner , slike gigamodeller. På den annen side har vi i flere måneder nå funnet mange dyder i forenklede, noe «beskjærte» modeller. Vi ser dermed at det er mulig å lage versjoner av gode generelle modeller på 70 B og til og med gå ned til 7 B samtidig som man i stor grad bevarer ytelsen til modellene. Det er nå mulig (og interessant) å designe SLM (Små språkmodeller), spesielt hvis de er dedikert til et bestemt domene eller applikasjonsklasse. Vi kommer dermed frem til modeller som kan fungere på stasjonære datamaskiner, eller til og med på smarttelefoner, uten å måtte koble til nettverket, for å få raskere, mer spesifikke eller mer konfidensielle svar… Roald Sieberath Entreprenør, Noshaq-investor, gjesteprofessor ved UCLouvain og UNamur, og president for Digital Agency (Digital Wallonia)