Istraživanje: Polovicu novih članaka na internetu napisala umjetna inteligencija

BROJ članaka generiranih umjetnom inteligencijom na internetu nakratko je premašio broj onih koje su napisali ljudi, no te su se brojke u međuvremenu izjednačile, otkriva novo izvješće SEO tvrtke Graphite.
Stručnjaci već dugo strahuju da bi preplavljivanje interneta sadržajem stvorenim umjetnom inteligencijom moglo dovesti do toga da se veliki jezični modeli počnu "gušiti" u vlastitim podacima, što bi u konačnici moglo uzrokovati njihov kolaps. Izvješće Europola iz 2022. godine procijenilo je da će do 2026. čak 90% online sadržaja biti generirano umjetnom inteligencijom.
Prema analizi tvrtke Graphite, provedenoj na 65.000 URL-ova objavljenih između 2020. i 2025., postotak članaka generiranih umjetnom inteligencijom naglo je porastao nakon lansiranja ChatGPT-a 2023. godine.
Udio AI članaka u analiziranom uzorku nakratko je nadmašio one koje su napisali ljudi u studenom 2024., no od tada su te dvije brojke ostale otprilike jednake.
Metodologija istraživanja
Tvrtka Graphite je za analizu koristila AI detektor Surfer na nasumičnom uzorku URL-ova iz Common Crawla, otvorene baze podataka koja sadrži više od 300 milijardi web stranica. Stranice su imale datume objave između siječnja 2020. i svibnja 2025. Smatralo se da je članak generiran umjetnom inteligencijom ako je Surfer utvrdio da je 50% ili manje sadržaja napisao čovjek.
Treba naglasiti da je razlikovanje sadržaja koji je napisao AI od onog koji je napisao čovjek iznimno složen zadatak. Kako bi procijenio točnost Surfera, Graphite ga je testirao na vlastitom uzorku AI članaka te na skupu tekstova objavljenih prije pojave ChatGPT-a. Surfer je imao stopu lažno pozitivnih rezultata od 4,2% (ljudski tekst označen kao AI) i stopu lažno negativnih rezultata od 0,6% (AI tekst označen kao ljudski) za članke generirane pomoću GPT-4o.
Chatbotovi daju prednost tekstovima koje pišu ljudi
Čini se da i takozvane "farme sadržaja" shvaćaju kako tražilice i chatbotovi ne daju prednost materijalima koje je stvorila umjetna inteligencija. Graphite je utvrdio da je 86% članaka rangiranih u Google pretraživanju napisano od strane ljudi, a samo 14% generirano umjetnom inteligencijom.
Sličan obrazac vrijedi i za chatbotove. Čak 82% članaka koje su citirali ChatGPT i Perplexity napisali su ljudi, a samo 18% generirala je umjetna inteligencija. Kada se AI članci i pojave u Google pretraživanju, obično su rangirani niže od onih koje su napisali ljudi.
Ipak, istraživači su za Axios istaknuli kako je s današnjim alatima i definicijama nemoguće utvrditi točan omjer AI sadržaja. Ljudi sve više surađuju s umjetnom inteligencijom, zbog čega je teško odrediti gdje prestaje ljudski, a počinje strojni doprinos.
Glasnogovornik Googlea izjavio je za Axios kako postoji toliko različitih razina korištenja umjetne inteligencije u radu da je izazovno definitivno reći je li nešto generirano umjetnom inteligencijom ili ne. "U ovom trenutku, to je više simbioza nego dihotomija," rekao je Stefano Soatto, profesor računalnih znanosti na UCLA-u i potpredsjednik u Amazon Web Services.
Što podaci ne pokazuju
Važno je napomenuti da Common Crawl, iako je jedan od najvećih izvora podataka za treniranje AI modela, ne obuhvaća cijeli internet. Neke web stranice koje naplaćuju pristup, gdje sadržaj vjerojatno pišu ljudi, blokiraju Common Crawl. To bi moglo značiti da je udio članaka koje su napisali ljudi zapravo i veći nego što podaci Graphitea pokazuju.
Istraživanje Pew centra od prošlog tjedna pokazalo je da je entuzijazam za AI sažecima u pretraživanju skroman: samo 20% korisnika smatra ih iznimno ili vrlo korisnima, a svega 6% im u potpunosti vjeruje.

bi Vas mogao zanimati
Izdvojeno
Pročitajte još
bi Vas mogao zanimati