Autizam je neurorazvojni poremećaj koji utječe na ponašanje, socijalnu interakciju, govor i odnose – i pritom se najčešće prepoznaje u prve tri godine života. Rano prepoznavanje i intervencija mogu imati velik razvojni učinak, osobito kada se provode u razdoblju kada se mozak intenzivno razvija. Nova studija objavljena u časopisu BMJ Health & Care Informatics pokazuje kako napredne metode temeljene na AI i pristupima machine learning nad stvarnim podacima iz zdravstvenih potraživanja mogu predvidjeti dijagnozu autizam kod djece mlađe od 30 mjeseci.

Autori studije – znanstvenici s institucije The Pennsylvania State University – naglašavaju da bi model predikcije mogao znatno utjecati na strategije probira kod najmlađe djece. U globalnom kontekstu, procjenjuje se da je otprilike jedno od 100 djece dijagnosticirano s autizam. U Sjedinjenim Državama učestalost je rasla: od jednog na 150 djece 2000. godine prema podatcima organizacije Autism Society do jednog na 44 djeteta u 2021. prema podacima Autism Speaks. Istraživači podsjećaju – što ranije prepoznamo autizam, to ranije dijete može dobiti usluge koje dokazano poboljšavaju dugoročan ishod.

Kako AI predviđa autizam kod djece iz medicinskih podataka

Zašto je rano prepoznavanje ključno

Prema smjernicama i istaknutim saznanjima institucije NIH, intervencije koje započinju u predškolskoj dobi, dok je neuroplastičnost najizraženija, mogu pridonijeti značajnim pomacima u jeziku, adaptivnim vještinama i socijalnoj komunikaciji. Neka djeca koja rano i intenzivno dobiju podršku napreduju do te mjere da ih kasnije stručnjaci više ne smatraju unutar spektra – iako je važno razumjeti da je svako dijete jedinstveno i da autizam nije jednoličan entitet, nego spektar.

Standardni probir često se oslanja na opažanje ponašanja i razvojnih prekretnica. Međutim, ponašajni znakovi autizam ponekad postaju jasno vidljivi tek oko druge godine života ili kasnije. Ako je moguće iz medicinskih zapisa – primjerice iz prethodnih posjeta liječniku, dijagnoza komorbiditeta i propisanih terapija – izgraditi model koji detektira obrasce povezane s ranim rizikom, otvara se prostor za ciljane procjene i raniju podršku. Upravo je to središnja ideja rada koji spaja velike skupove podataka s metodama AI.

Koje su podatke koristili i kako su ih obradili

Autori su se oslonili na deidentificiranu bazu zdravstvenih potraživanja IBM MarketScan Commercial Claims and Encounters Database u razdoblju 2005-2016, koja obuhvaća više od 273 milijuna osiguranika. Za treniranje modela konstruirali su uravnoteženi uzorak: 10 000 djece s potvrđenom dijagnozom autizam i 10 000 djece bez autizam. Ovakav pristup omogućuje da algoritam pouzdanije uči obrasce koji razlikuju skupine – primjerice raspored posjeta pedijatru, kontakt s logopedima, prisutnost specifičnih dijagnoza, vrste terapija i slične pokazatelje koji se mogu naći u računima zdravstvenih osiguranja.

Podaci iz potraživanja nisu klinički zapisi u užem smislu – to su administrativni podaci nastali iz procesa naplate usluga. Ipak, oni sadrže dragocjene tragove: kodove dijagnoza, postupaka i lijekova, vremenske oznake događaja i uzorke korištenja usluga. Kada su takvi elementi strukturirani i očišćeni, machine learning može prepoznati obrazce koji izmiču ljudskom oku, osobito ako su signali suptilni i raspršeni tijekom vremena. To je posebno važno jer autizam može koegzistirati s drugim stanjima – primjerice s razvojnim kašnjenjima, senzornim poteškoćama ili gastrointestinalnim smetnjama – pa se slika rizika iscrtava iz niza slabijih pokazatelja, a ne iz jedne jedine stavke.

Modeli: od logistic regression do random forest

Kako bi procijenili sposobnost predikcije, istraživači su izgradili dva tipa modela. Prvi je bio linearni model logistic regression s regularizacijom metodom LASSO, koja pomaže odabrati najinformativnije značajke i spriječiti prenaučenost. Drugi je bio nelinearni ansamblski model random forest, dobro poznat po sposobnosti otkrivanja kompleksnih interakcija među varijablama bez pretpostavke o njihovim odnosima. Usporedba je otkrila da je random forest nadmašio logistic regression – što je i očekivano, jer šume odlučivanja bolje hvataju suptilne kombinacije čimbenika koje linearni pristupi modeliraju aditivno.

Rezultat je jasan: oba modela pokazala su obećavajuću točnost u predviđanju buduće dijagnoze autizam iz podataka koji su dostupni prije pojave većine najdojmljivijih ponašajnih simptoma. Praktično, to znači da bi zdravstveni sustavi mogli ranije istaknuti djecu za dodatne razvojne procjene – ne kao zamjenu za kliničku dijagnostiku, nego kao pametan filter koji pomaže pravilno usmjeriti resurse.

Što prediktivni modeli doista „vide”

Važno je razumjeti da algoritmi ne „vide” autizam sam po sebi – oni prepoznaju uzorke povezane s povećanom vjerojatnošću da će dijete kasnije dobiti dijagnozu autizam. Ti uzorci mogu uključivati kombinacije posjeta specijalistima, vrste terapija, obrasce propisanih lijekova koji se javljaju zajedno s razvojnim kašnjenjima, kao i učestalost određenih postupaka. Kada se takvi uzorci pojave dovoljno rano i u prepoznatljivoj kombinaciji, model izračunava viši rizik. U praksi bi to moglo potaknuti ranije uključivanje stručnjaka za razvojnu procjenu, logopeda i radnog terapeuta.

Za roditelje i skrbnike važno je naglasiti: prediktivni sustav nije dijagnoza. On je početak razgovora – obavijest da raspoloživi podaci sugeriraju potrebu za dubljim uvidom. Tako se autizam ne zamjenjuje statističkim rezultatom, nego se statistika koristi da bi djeca s najvećim rizikom što prije došla do stručnjaka. U vremenu kada su liste čekanja duge, ovakvo usmjeravanje može značiti raniji početak podrške tamo gdje je najpotrebnija.

Etika, pristranosti i transparentnost

Primjena AI u osjetljivim područjima – kao što je probir na autizam – mora biti praćena strogim etičkim okvirom. Prvo, valja razmotriti pristranosti ugrađene u podatke. Baze potraživanja odražavaju pristup zdravstvenoj skrbi, osiguravateljsku pokrivenost i obrasce korištenja usluga. Ako su neke skupine djece sustavno manje zastupljene u sustavu ili koriste druge tipove usluga, model bi mogao podcijeniti rizik u tim skupinama. Drugo, potrebno je osigurati transparentnost: zdravstveni djelatnici i roditelji trebaju razumjeti da je rezultat modela signal rizika – a ne pečat dijagnoze.

Sljedeći element je privatnost. Iako su podatci u studiji deidentificirani, svako buduće rješenje u praksi mora poštovati stroge standarde upravljanja podacima. To uključuje minimizaciju podataka, kontrolu pristupa i jasne protokole obavješćivanja roditelja. Povrh toga, sustavi bi trebali prolaziti redovite procjene pravednosti i performansi, kako bi se spriječilo da promjene u obrascima pružanja usluga s vremenom naruše valjanost modela.

Kako bi se takav sustav koristio u praksi

Zamislimo pedijatrijsku ordinaciju ili zdravstveni sustav koji periodično obrađuje pristigla potraživanja i generira rizične profile. Kada model označi povišen rizik za autizam, sustav automatski predlaže korake: strukturirani upitnik za roditelje, dodatni probir kod logopeda, termin za razvojnu procjenu. Time se „prvi korak” ne prepušta slučajnosti – umjesto toga, podaci sugeriraju gdje postoji najveći potencijalni dobitak od brže reakcije.

U idealnom scenariju, pedijatar prima jasan sažetak: koji su elementi najviše doprinijeli procjeni (npr. učestalost posjeta, kombinacije šifriranih dijagnoza, upućivanja), kako se rizik uspoređuje s dobnom skupinom i koji su preporučeni idući koraci. Iako random forest tradicionalno nije „najobjašnjiviji” model, danas postoje tehnike koje pomažu pružiti razumljiva tumačenja – primjerice lokalne važnosti značajki – bez izlaganja osjetljivih podataka.

Snage i ograničenja pristupa

Velika prednost korištenja potraživanja je obuhvat – ogromni uzorci omogućuju da model nauči suptilne obrasce. Druga prednost je vremenska dimenzija: događaji su vremenski označeni, pa se može procijeniti kako se rizik mijenja kroz rane mjesece života. No postoje i ograničenja. Potraživanja nisu dizajnirana za dijagnostiku; ona mogu propustiti informacije o obiteljskom kontekstu, ponašanju u kući ili vrtiću, kvaliteti interakcije – elementima koji su često ključni za razumijevanje kako se autizam manifestira kod pojedinog djeteta. Stoga se modeli trebaju promatrati kao alat za trijažu, ne kao konačna riječ.

Još jedno ograničenje jest generalizacija. Studija je koristila specifičnu bazu osiguranja u razdoblju 2005-2016. Obrasci pružanja usluga mijenjaju se tijekom vremena – primjerice, raste dostupnost skrining alatâ, mijenjaju se smjernice i razine svijesti – pa se performanse modela trebaju redovito revalidirati. Također, rezultati iz jedne zemlje ili osiguravateljskog sustava ne moraju se izravno prenositi na drugi – kulturne, organizacijske i regulatorne razlike mogu biti značajne.

Što znači „bolji” rezultat u stvarnom svijetu

Kada kažemo da je random forest nadmašio logistic regression, radi li se o praktično važnoj razlici? U kontekstu probira za autizam i javnog zdravstva, čak i umjereno poboljšanje točnosti može imati mjerljiv učinak. Manje lažnih negativnih nalaza znači da se manje djece s visokim rizikom provuče kroz sustav neprepoznato. Manje lažnih pozitivnih nalaza znači da se nepotrebno ne opterećuju resursi i obitelji. U praksi je ključno definirati pragove – na kojoj vrijednosti rizika predlažemo dodatni probir – i podesiti ih prema kapacitetima sustava i ciljevima programa.

Dodatno, modeli se mogu nadograđivati. Jedna mogućnost je kombinirati podatke iz potraživanja s drugim izvorima, primjerice sa standardiziranim rezultatima razvojnih skrininga ili s agregiranim bilješkama iz elektroničkih kartona. Druga mogućnost je koristiti prilagodljive modele koji se periodično dorađuju na novim podatcima. U oba slučaja ostaje temeljna mjera opreza: autizam se potvrđuje kliničkom procjenom, dok je algoritam usmjerivač.

Uloga roditelja i stručnjaka

Roditelji su često prvi koji primijete rane signale – primjerice odstupanja u kontaktu očima, ograničen repertoar igara ili kašnjenja u jeziku. Kada sustav označi povišen rizik, suradnja roditelja i liječnika postaje presudna. Pažljivo objašnjenje što rezultat znači i što ne znači pomaže izbjeći nepotreban strah. Za stručnjake, jasnoća u komunikaciji jednako je važna kao i sama tehnologija: terminologija treba biti razumljiva, koraci izvedivi, a podrška dostupna. Uz takav okvir, autizam se ne stigmatizira – naprotiv, obitelji dobivaju strukturiran put do usluga.

Metodološke napomene o izradi modela

Regularizirani linearni modeli poput LASSO korisni su kada postoji velik broj potencijalnih značajki, jer potiču rješenja s manje parametara i lakšim tumačenjem. Međutim, ako odnos između značajki i ishoda nije linearan ili je uvjetovan interakcijama (npr. učinak dviju dijagnoza zajedno veći je od zbroja zasebnih učinaka), modeli poput random forest često imaju prednost. Šume odlučivanja formiraju ansambl stabala koja glasaju – rezultat je prosjek ili većina – čime se smanjuje varijanca i poboljšava generalizacija.

Kod evaluacije, bitno je koristiti podatke koji nisu viđeni tijekom treniranja, kao i provesti analize osjetljivosti. Balansiranje skupa (10 000 prema 10 000) pojednostavljuje učenje, no u stvarnim populacijama autizam je rjeđi; stoga je u implementaciji važno testirati ponašanje na neuravnoteženim uzorcima i koristiti mjere poput krivulje osjetljivosti i specifičnosti, kao i metrika koje bolje odražavaju učinak na rjeđe ishode.

Od istraživanja do sustava: koraci implementacije

Validacija u novim populacijama. Prije upotrebe, model treba neovisno provjeriti na drugačijim uzorcima – primjerice u drugim regijama ili osiguravateljima – kako bi se potrdila stabilnost performansi i izbjegla preoptimistična očekivanja.
Odabir praga rizika. Prag se može prilagođavati ciljevima: ako je cilj „ne propustiti”, preferira se veća osjetljivost; ako su resursi ograničeni, podešava se prema većoj preciznosti.
Integracija u tijek rada. Sustav bi trebao automatski stvarati uputnice, obavijesti i obrasce za dodatni probir. Tehnički, to znači stabilnu integraciju s bazama potraživanja i sigurnu razmjenu podataka.
Praćenje i audit. Nakon implementacije slijedi kontinuirano praćenje pristranosti, performansi i učinaka na ishode – što uključuje redovita izvješća i mehanizme za korekciju.

Ovi koraci pomažu da tehnologija bude dosljedna svrsi: bržem putu do podrške za djecu kod koje se autizam može rano prepoznati. Kada se proces uredi kao ciklus poboljšanja – učenje, implementacija, mjerenje, prilagodba – sustav postaje otporniji na promjene u praksi i populaciji.

Šira slika: autizam, podaci i budućnost skrbi

Veliki zdravstveni sustavi generiraju masivne količine podataka. Spajanje tih podataka s metodama AI može premostiti jaz između pojave ranih signala i povratne informacije stručnjaku. No jednako je važno zadržati humanističku nit. Autizam nije samo statistika – to je stvarni život obitelji, djece i zajednica. Tehnologija je vrijedna kada podržava taj život: kada smanjuje čekanje, kada pomaže postavljati prava pitanja, kada omogućuje da terapija započne prije nego što bi inače započela.

Konačno, napredak se mjeri ne brojem modela, nego promjenom u pristupu. Ako pedijatar dobije raniji signal i lakše procijeni treba li uputiti dijete na detaljniju procjenu, ako obitelj dobije jasnu uputu što poduzeti – tada su podaci ispunili svoju svrhu. U tom okruženju, autizam se susreće s organiziranim, empatičnim i pravodobnim odgovorom sustava.

Što ova studija jest, a što nije

Ova studija jest primjer kako se iz velike baze potraživanja – 2005-2016, uzorak 10 000 naprema 10 000 – može naučiti obrazac rizika za autizam prije nego što se pojave najočitiji simptomi. Ona nije klinička potvrda niti zamjena za stručnu procjenu. Utemeljena je na američkom osiguravateljskom kontekstu i zahtijeva oprez pri prijenosu u druge zdravstvene sustave. No ona nudi putokaz: ako se snažni podaci spoje s metodologijom i etikom, može se stvoriti automatizirani rani signal koji usmjerava pažnju – točno tamo gdje je najpotrebnija.

U praksi, implementacija bi se trebala osloniti na jasne protokole, obuke za zdravstvene djelatnike i komunikacijske materijale za roditelje. Kada su ti elementi usklađeni, autizam više ne ovisi samo o tome hoće li netko „primijetiti” – podaci pomažu da ga sustav vidi ranije i da obitelji dobiju podršku u pravom trenutku.

Napomena: Ovdje opisani nalazi sažimaju objavljeni rad i brojeve koje su naveli autori, uključujući prevalenciju jedno od 100 na globalnoj razini, kretanje u SAD-u od jednog na 150 u 2000. do jednog na 44 u 2021., te informacije o razdoblju 2005-2016 i uzorku 10 000 prema 10 000. Ti podatci služe za ilustraciju kako se AI i machine learning mogu koristiti za raniji signal rizika za autizam – uz pretpostavku odgovorne i transparentne primjene.