Europa užurbano radi na proizvodnji vlastitih chatbotova s umjetnom inteligencijom kako bi spriječila tehnologiju proizvedenu u SAD-u da preplavi europska gospodarstva, kulturu, pa čak i same jezike, piše Politico.
Od Madrida do Sofije, zemlje Europske unije pokrenule su i podržale niz inicijativa čiji je cilj stvaranje chatbotova koji doista tečno govore lokalne jezike.
Nezaustavljiv napredak u SAD-u
Najnovija AI tehnologija koja pokreće alate poput popularnog ChatGPT chatbota ovisi o "modelima jezika" ili LLM-ovima, sustavima sposobnima za razgovor. Jezik je srž ovih inovacija, a EU, u kojoj se kojoj govore 24 službena jezika, od litvanskog do malteškog, želi da ta tehnologija u obzir uzme kulturne sadržaje i neobičnosti.
"Mark Twain ne bi trebao izbrisati Stendhala", rekao je francuski ministar gospodarstva Bruno Le Maire na jednom tehnološkom događaju u Cannesu u veljači. "Ne želimo se zadovoljiti samo engleskim, ne želimo da naš jezik oslabe algoritmi i AI sustavi", rekao je.
Sjedinjene Države predvode trenutni val inovacija. Tu su ChatGPT OpenAI-ja, Microsoft te Google sa svojim modelom Gemini. Anthropic, Meta i xAI Elona Muska također su u utrci za izradu vodećih modela.
Europa lovi korak
Brzina američke industrije zabrinula je europske vlade. Boje se ponavljanja dominacije koju su američke tvrtke imale u počecima doba društvenih medija i interneta.
Od akademskih pothvata do masterplanova i startupova koje sponzoriraju vlade te timova neovisnih programera, Europa se bori protiv kalifornijskih tehnoloških divova. Samo u prošloj godini 13 europskih zemalja najavilo je ili poduzelo korake za razvoj lokalnih modela usmjerenih na njihove lokalne jezike, pokazalo je istraživanje.
Većina postojećih projekata pokušava nadoknaditi nedostatke u računalstvu i financiranju u odnosu na SAD, oslanjajući se na golemu zajednicu programera.
"Imati modele na lokalnom jeziku također znači potaknuti više ljudi u vašoj zemlji da kodiraju i razvijaju više AI proizvoda", rekao je Carlos Romero Duplá, bivši španjolski diplomat koji je pregovarao o zakonu AI-ja u EU, a sada je konzultant u Bruxellesu.
Utjecaj na kulturu
Za neke zemlje, poput Španjolske, modeli na vlastitom jeziku mogli bi pomoći u jačanju njihovog utjecaja u kulturno i povijesno povezanim dijelovima svijeta. Madrid, koji financira stvaranje LLM-a koji može govoriti španjolski na temelju korpusa visokokvalitetnog španjolskog sadržaja za obuku AI-ja, vidi tehnologiju u nastajanju kao područje za bližu suradnju s latinoameričkim zemljama.
Borba za LLM-ove na vlastitom jeziku dolazi u trenutku kada je kulturna industrija u žestokoj i, neki kažu, egzistencijalnoj borbi s tehnološkim tvrtkama oko kulturnih sadržaja uključujući filmske scenarije, medijske arhive, pa čak i autorska prava nad glasovnim otiscima glazbenih umjetnika.
Proteklih mjeseci OpenAI je bio zauzet sklapanjem poslova s međunarodnim medijskim brendovima poput Axela Springera, vlasnika novina na njemačkom jeziku Bild i Welt te francuskog dnevnika Le Monde, kreirajući niz visokokvalitetnih sadržaja na stranim jezicima.
U svom govoru u Cannesu, Le Maire je predložio stvaranje cjenovno kontroliranog europskog jedinstvenog tržišta za podatke kako bi se spriječilo bogate američke tehnološke divove da nadmaše europske AI tvrtke za pristup svakom komadiću vrijednog sadržaja.
Primat engleskog jezika
Francuska je također predvodila stvaranje Alt-EDIC-a, EU konzorcija od 12 zemalja posvećenog suradnji unutar bloka na razvoju LLM-a na europskim jezicima.
Ironično, da bi bili istinski konkurentni, europski LLM-ovi i dalje će morati tečno govoriti engleski - koji je i dalje jezik većine svjetskih znanstvenih radova i nešto više od polovice stranica na svjetskoj mreži, prema organizaciji za online ankete W3Techs.
"Postoji neravnoteža snaga u smislu količine i kvalitete podataka o obuci: samo pogledajte koliko je velika engleska Wikipedia u usporedbi s njezinim verzijama na drugim jezicima", rekao je Sebastian Ruder, istraživač u kanadskoj višejezičnoj AI tvrtki Cohere.
Neki LLM-ovi proizvedeni u SAD-u govore i druge jezike osim engleskog, ali nemaju uvijek znanje i nijanse potrebne za dobro služenje lokalnim korisnicima.
Problem s prebacivanjem na materinski jezik
Za chatbotove dizajnirane za interakciju u cijelim razgovorima sa svima, od građana zemlje do klijenata tvrtke, to može stvoriti probleme. Procjena "kulturnog usklađivanja" iz kolovoza 2023. koju su proveli istraživači s University College Londona otkrila je da OpenAI i Google LLM nisu u skladu s kulturnim normama u zemljama uključujući Kinu, Saudijsku Arabiju i Slovačku - dok su prolazili testove za pridržavanje običaja SAD-a.
Kako umjetna inteligencija postaje ukorijenjena u svim aspektima naših društava, utjecaj takvih kulturnih sukoba mogao bi biti značajan. Kris Shrishak, tehnološki suradnik pri Irskom vijeću za građanske slobode, rekao je: "Američka tehnološka tvrtka može uvježbati svoj model na, recimo, litvanskom, ali to donosi gubitke. Tako da bi ga obično uvježbao na engleskom, a zatim napravio neka fina podešavanja", zaključio je.
Rješenje je, prema Ruderu, da europski programeri umjetne inteligencije obučavaju svoje botove i na svom jeziku i na engleskom, omogućujući tako LLM-u da iskoristi znanje kodirano na engleskom kada govori na domaćem jeziku.