Be to, tyrėjai suprato, jog retas depresija sergantis pacientas norėtų savo veido įrašu dalintis viešai. Priešingai nei smegenų elektrinės veiklos (EEG) ar balso duomenys, veidas – tiesiogiai asmenį identifikuojanti informacija.
„Negalime pažeisti pacientų privatumo, o ir tolimesniam naudojimui mūsų pasirinktų duomenų derinimas yra perspektyvesnis“, – tvirtina KTU informatikos fakulteto (IF) profesorius.
Mokslininkas pabrėžia, jog jie nėra medicinos ekspertai, todėl tyrimo atlinkti tiesiogiai su pacientais negali. Dėl šios priežasties visi duomenys buvo gauti iš MODMA (angl. Multimodal Open Dataset for Mental Disorder Analysis) duomenų rinkinio. EEG duomenys buvo renkami ir įrašinėjami penkias minutes, dalyviams būnant budriems, ramybės būsenoje, užmerkus akis ir nejudant.
Atliekant garso tyrimo eksperimentines užduotis pacientai dalyvavo klausimų ir atsakymų sesijoje bei keliose veiklose, orientuotose į skaitymą ir paveikslėlių apibūdinimą, siekiant užfiksuoti jų natūralią kalbą ir kognityvinę būklę.
DI turės išmokti diagnozę pagrįsti
Surinkti EEG ir garso signalai buvo transformuoti į spektrogramas, leidžiančias duomenis pavaizduoti vizualiai. Kad šiuos duomenis būtų galima palyginti, buvo pritaikyti specialūs filtrai triukšmui pašalinti ir panaudotas modifikuotas „DenseNet-121“ giluminio mokymosi modelis, gebantis atpažinti depresijos požymius vaizduose. Kiekvienas vaizdas atspindėjo signalų pokyčius laikui bėgant, EEG parodė smegenų veiklos bangų formas, o garsas – dažnių ir intensyvumo pasiskirstymą.
Į šį modelį buvo įtrauktas pasirinktinis klasifikavimo sluoksnis, apmokytas skirstyti duomenis į sveikų arba depresija sergančių žmonių klases. Vertinant sėkmingą klasifikaciją ir buvo įvertintas programos tikslumas.
Ateityje šis DI modelis galėtų pagreitinti depresijos diagnostiką ar ją net paversti nuotoline bei sumažinti subjektyvių vertinimų riziką. Tam reikalingi tolimesni klinikiniai tyrimai bei programos tobulinimai, tačiau R. Maskeliūnas teigia, jog susiduriama ir su iššūkiais.
„Pagrindinė tokių tyrimų problema – duomenų trūkumas, nes žmonės nenori atsiverti, dalintis“, – teigia jis.
Kitas svarbus KTU Multimedijos inžinerijos katedros profesoriaus paminėtas aspektas yra tai, jog nepakanka vien gero tikslumo sukurtam DI algoritmui, nes gydytojas turi suprasti, kas lėmė tokį diagnostinį rezultatą. „Algoritmas dar turi išmokti suprantamai paaiškinti diagnozę“, – šypsosi mokslininkas.
R. Maskeliūno teigimu, su šia problema susiduriama ne vienoje srityje dėl didėjančio poreikio taikyti DI ten, kur priimami sprendimai tiesiogiai veikia žmones, pavyzdžiui, sveikatos priežiūroje, finansuose ir teisinėje sistemoje.
Todėl dabar populiarėja XAI (angl. explainable artificial inteligence) paaiškinamoji dirbtinio intelekto technologija, siekianti naudotojui atskleisti, kodėl modelis priima konkrečius sprendimus, taip padidinanti pasitikėjimą DI.
Straipsnis „Multimodal Fusion of EEG and Audio Spectrogram for Major Depressive Disorder Recognition Using Modified DenseNet121“ paskelbtas žurnale „Brain Sciences“ ir jį galima rasti čia.