Az egészségügyi területen való mesterséges intelligencia fejlesztés során gyakran találkozunk a jó minőségű, címkézett adatok beszerzésének problémájával. A nyílt adatbázisokban sok kép van, de ezek nem használhatók fel egy komoly egészségügyi MI fejlesztéséhez. Ahhoz például, hogy egy bőrbetegségről készült kép az algoritmus számára oktató anyag lehessen, három, egymástól független orvosnak kell megerősítenie, hogy a képen tényleg az adott betegség található. Ugyanez igaz például a radiológiára, és minden orvosi képalkotási eljárásra is. Rengeteg idő és költség ez egy többszázezres adathalmaz esetén. Ráadásul ha véletlenül rossz adaton tanítjuk be az algoritmust, rossz diagnózist kaphatunk is, amelyen emberéletek is múlhatnak
Az adathiány nem csak pénzügyileg megterhelő az ezzel foglalkozó vállalkozások és kutatók számára, hanem gátolja is a mesterséges intelligencia fejlődését. Ez a kihívás arra inspirálta az AIP Labs magyar MI fejlesztőcsapatot, hogy új és kreatív megoldásokat találjanak. A fejlesztők rájöttek arra, hogy képesek olyan fejlett, úgynevezett generatív mesterséges intelligenciát gyártani, amely meglévő adatokból, újabb adatokat képes generálni. Tehát, már meglévő bőrbetegségek képéből, eltérő, de ugyanazon betegségekről szóló szintetikus képeket tud készíteni. Ezzel a megoldással, számtalan problémát ki lehet küszöbölni, így azt is, hogy egyes ritka betegségekről nagyon kevés képi anyag áll rendelkezésre. Az AIP Labs kutatói tanulmányt is közöltek eredményeikről, amiről a nemzetközi sajtó is beszámolt.
Valódi vagy szintetikus képek?
Felmérések szerint egyre több betegre egyre kevesebb orvos jut világszerte, a várólisták pedig egyre nőnek. Ezért kulcskérdéssé válik az egészségügy fenntarthatósága szempontjából, hogy az MI át tudja-e venni részben az orvosok munkáját, és segíteni őket a gyors diagnózis alkotásban.
A bőrbetegségek detektálásához és egyéb orvosi diagnózisalkotáshoz a gépi tanulásnak rengeteg adatra van szüksége, különösen címkézett képekre. Nem maga a fotó a kulcs, hanem a képekhez rendelt címkék, amelyek segítik a gépi tanulást. Bőrgyógyászat területén tehát nem is a bőrbetegségről szóló kép az érték, hanem az, hogy tudjuk, a képen biztosan mondjuk ekcéma látható. Na de mi van akkor, ha nincs elegendő címkézett adat, vagyis nincs annyi kép egy-egy ritka betegségről, amely elegendő ahhoz, hogy a diagnosztikai MI-t betanítsa?
Ekkor jön képbe a generatív mesterséges intelligencia, amit az AIP Labs fejlesztett. Az AIP generatív modellje valós képeken tanul, majd létrehoz olyan képeket, amelyek hasonlítanak a valódiakra. Az AIP által használt megoldás egy úgynevezett diffúziós modell, ami a valós adatokból származó információkat felhasználva hoz létre szintetikus képeket. A szintetikus képek gyakran segíthetnek más, a cég által fejlesztett képfelismerő egészségügyi mesterséges intelligenciák teljesítményének javításában, különösen, ha nincs elegendő mennyiségű címkézett adat. Ritka bőrbetegségek esetén, mint a majomhimlő, aminek felismerése kulcskérdés lett, így egy kis számú adatsorból gyorsan lehet nagy számú adatsort csinálni, amelyet az orvosi validáció után fel lehet használni a gépi tanuláshoz.
Az AIP Labs csapata abban is különleges, hogy nemcsak rájött egy forradalmi megoldásra, de ki is fejlesztette saját digitális dermatológiai rendszerét az AIP Derm-et, amelyet Magyarországon már több tízezer ember használ. A bőrgyógyászati diagnózishoz és recepthez elég egy képet feltölteni, amire órákon belül meg is jön az eredmény. Az ilyen generatív modellek pedig segítenek abban, hogy a digitális bőrklinika orvosai minél pontosabb diagnózisokat tudjanak adni.