Sebrant: Le reti neurali Yandex aiuteranno i medici a fare diagnosi. L'uso delle reti neurali artificiali per la diagnosi precoce del diabete mellito Articolo sulle reti neurali in medicina

Sebrant: Le reti neurali Yandex aiuteranno i medici a fare diagnosi.  L'uso delle reti neurali artificiali per la diagnosi precoce del diabete mellito Articolo sulle reti neurali in medicina

Nell'URSS, l'intelligenza artificiale in medicina è stata studiata dalla fine degli anni '70 - presso l'Istituto di cibernetica dell'Accademia ucraina delle scienze e presso l'Istituto di informatica applicata di Mosca. L'accademico Alexander Kuleshov, rettore dell'Istituto di scienza e tecnologia di Skolkovo, sta attualmente lavorando su questo argomento.

In Occidente, il supercomputer IBM Watson è diventato l’apice di tali sviluppi. È in grado di analizzare le cartelle cliniche e identificare potenziali rischi per un particolare paziente. Il sistema fornisce inoltre supporto informativo agli oncologi, aiutandoli a scegliere le opzioni terapeutiche. In questo modo migliora la competenza dei medici: IBM Watson accompagna le sue conclusioni con collegamenti ad articoli scientifici e casi clinici rilevanti. Ora questa piattaforma aiuta a effettuare diagnosi in 16 centri oncologici negli Stati Uniti e in Canada.

L'altro giorno, gli esperti russi hanno discusso del futuro dell'intelligenza artificiale in medicina in una conferenza su Yandex, organizzata dal portale MedAboutMe. Rusbase ha scritto le tesi più importanti su come gli specialisti IT aiuteranno i medici domestici a trattarci meglio.

In che modo le reti neurali possono aiutare la medicina?

Yandex non utilizza ancora i suoi risultati in medicina, ma sa già quali benefici può portare. Il fatto è che il compito di analizzare suoni e immagini è molto diffuso nella diagnostica medica: si tratta di raggi X, ultrasuoni, risonanza magnetica, esami del sangue, ecc. Puoi insegnare a una rete neurale a rilevare patologie meglio di infermieri e assistenti di laboratorio esperti. La macchina impara continuamente 24 ore su 24, non si stanca e non si ammala.

Tutto ciò può essere fatto in modo molto efficiente e, soprattutto, da remoto (ad esempio, nel centro medico della capitale). Questa tecnologia porterà la diagnostica ad un altro livello. Ciò non richiede la creazione di nulla di nuovo, è sufficiente adattare gli algoritmi e l'hardware esistenti. E l'intelligenza artificiale, che sostituirà il medico, farà diagnosi e predirà le epidemie: questo è già dopodomani (Andrey Sebrant, Direttore marketing di Yandex Services).

Dal 2010 in Russia sono stati aperti 500 centri vascolari, ma gli specialisti formati sono pochi. Hanno davvero bisogno dell'elaborazione meccanica dei tomogrammi, che li aiuterà a prendere decisioni più velocemente e in modo più corretto. Se si determina correttamente il tipo di ictus (più di 100 in totale) entro tre ore, il 90% dei pazienti ritorna a una vita piena. Il ritardo porta alla morte o all'invalidità con una riabilitazione costosa. Se combini le tecnologie Yandex con i protocolli di assistenza medica, puoi ridurre drasticamente la mortalità dovuta a ictus. Tutto ciò che serve per questo è la volontà e gli sforzi organizzativi. (Oleg Simakov, membro del consiglio di esperti del Ministero della Salute sull'uso delle TIC nel settore sanitario).

La principale causa di morte nel mondo sono le malattie cardiovascolari. I sentimenti di dolore al cuore si manifestano molto più tardi delle loro cause. È possibile prevedere le crisi ipertensive con l'aiuto dei sensori, ma non possono essere indossati per molto tempo: dopo un paio di giorni inizia l'irritazione della pelle dagli elettrodi. Inoltre, quando si indossano i sensori, si verificano molte interferenze e rumori che rendono difficile la diagnostica. È necessario passare dai sensori esterni a quelli invasivi, ma questo è costoso. Il medico curante non può guardare continuamente il monitor. Abbiamo bisogno di una rete neurale che analizzi la frequenza cardiaca e rilevi l’ischemia. Inoltre, dovrebbe essere formato sui dati di ogni singolo paziente. (Oleg Simakov).

Dove posso ottenere dati medici per la formazione sull’IA?

Lo Stato ha il monopolio sulle informazioni mediche, ma non esiste un modo per raccoglierle e archiviarle adeguatamente. È improbabile che voglia condividere i dati accumulati con il mercato, ma la loro elaborazione richiede grandi investimenti. Ad esempio, il progetto IBM Watson spende circa 6 miliardi di dollari all’anno in ricerca e sviluppo. Il Ministero della Salute non dispone di tali budget, quindi è necessario un partenariato pubblico-privato per analizzare i dati medici dei russi (Konstantin Gorbach, responsabile del settore sanitario presso IBM).

Finora in Russia non esistono dati idonei all’elaborazione da parte dell’intelligenza artificiale. Oggi nel Paese ci sono 38 milioni di cartelle cliniche elettroniche, ma sono state compilate secondo diversi classificatori, il che complica la loro analisi. Inoltre, la FASO e il Ministero della Salute dispongono di 80 istituti di ricerca medica, ognuno dei quali ha cercato di creare il proprio ventaglio di informazioni. L’analisi delle cartelle cliniche integrate (quando diverse istituzioni mediche combinano i loro dati sulla stessa persona) rivelerebbe malattie determinate geograficamente, ad esempio, malattie polmonari a Kemerovo e Vorkuta (Oleg Simakov).

L'altro giorno si è saputo che il braccialetto fitness per la prima volta ha salvato la vita di una persona. I dati del gadget hanno aiutato i medici a scegliere le giuste tattiche terapeutiche. Di solito devono fare affidamento sulla storia del paziente. Sono pochissimi i dispositivi medici registrati in Russia in grado di trasmettere letture a distanza. Sono molto difficili da registrare per utilizzarli per il monitoraggio sanitario. È necessario superare le barriere burocratiche. L’anno scorso nel mondo c’erano circa 22.000 gadget sanitari (Oleg Simakov).

Quando l'intelligenza artificiale diventerà un medico a tutti gli effetti?

Per essere definita medico elettronico, l’intelligenza artificiale ha bisogno di riflessione ed empatia, cioè di etica. Inoltre, nel campo della formalizzazione dell'etica non ci sono stati meno progressi che nell'elaborazione delle immagini. La comprensione di come programmare l’etica e di come vengono prese le decisioni è molto avanzata (Vladislav Shershulsky, Direttore dei programmi di cooperazione tecnologica Microsoft in Russia).

Per creare un’intelligenza artificiale universale, non è sufficiente una buona formulazione del problema, quindi viene risolto a pezzi. Anche se questi frammenti sono molto interessanti: la vittoria dell'IA in Go è una storia di intuizione artificiale di altissima qualità. E in Yandex, all'algoritmo è stato insegnato il senso della bellezza. Il problema di creare un'intelligenza artificiale a tutti gli effetti non sta tanto nelle risorse, ma nel fatto che non possiamo impostare un compito (Andréj Sebrant).

Nonostante la competenza insuperabile, IBM Watson è solo un assistente e il processo decisionale spetta alla persona. La questione non è una diagnosi, ma una responsabilità per il paziente (Konstantin Gorbach).

Quando sarà consentita la telemedicina in Russia?

Quest'anno. Ora gli esperti stanno lavorando al testo della legge federale sulla telemedicina (modifiche alla 323-FZ). Il documento legittima le consultazioni a distanza e il monitoraggio dei pazienti (gli avvocati sono categoricamente contrari alle cure e alla diagnosi a distanza). Se il disegno di legge sarà presentato alla Duma di Stato entro due settimane, sarà adottato nella sessione primaverile. (Oleg Simakov).

In che modo la realtà virtuale aiuta la medicina?

La realtà virtuale viene utilizzata per formare i medici in questo momento. Le operazioni dei migliori chirurghi sono state filmate per molto tempo, ma il pubblico non le vede dalla posizione di un medico. E nel casco virtuale puoi vedere tutti i movimenti in prima persona. Il grado di immersione è tale che le nuove tecniche chirurgiche verranno assimilate molto più velocemente. Il risultato sono vite salvate (Andréj Sebrant).

Facoltà: informatica e informatica
Dipartimento: sistemi di monitoraggio informatico
Specialità: monitoraggio ambientale ed economico informatico
Argomento della tesi magistrale:
"Trasmissione nascosta di grandi quantità di informazioni tramite stegocoding di file WAV"
Consulente scientifico: Gubenko Natalya Evgenievna, Professore associato, Ph.D.

Abstract della relazione al convegno "Monitoraggio informatico e tecnologie dell'informazione 2008" sul tema "Applicazione delle reti neurali in medicina"

L'uso delle reti neurali in medicina è solitamente associato a sistemi per la diagnosi e la diagnosi differenziale delle malattie. Tuttavia, una rete neurale addestrata non solo sa riconoscere gli esempi, ma memorizza anche informazioni piuttosto importanti. Pertanto, uno dei campi di applicazione più seri delle reti neurali è l'interpretazione dei dati medici. La ricerca di schemi profondi tra i dati ricevuti e i processi patologici inizia a restare indietro rispetto allo sviluppo di metodi sempre più nuovi, quindi l'uso delle reti neurali per questo scopo può essere estremamente vantaggioso.

Le reti neurali sono sistemi non lineari che consentono una classificazione dei dati molto migliore rispetto ai metodi lineari comunemente utilizzati. Applicati alla diagnostica medica, consentono di aumentare significativamente la specificità del metodo senza ridurne la sensibilità.

Una caratteristica distintiva delle reti neurali è che non sono programmate: non utilizzano alcuna regola di inferenza per fare una diagnosi, ma sono addestrate a farlo tramite esempi. In questo senso, le reti neurali non sono affatto come i sistemi esperti, il cui sviluppo negli anni ’70 ebbe luogo dopo la temporanea “vittoria” dell’Intelligenza Artificiale sull’approccio alla modellazione della memoria, al riconoscimento di schemi e alla generalizzazione, che si basava sullo studio dell’organizzazione neurale del cervello.

Uno dei più noti sistemi esperti sviluppati, il cui funzionamento si basava sulla conoscenza estratta dagli esperti e sull'implementazione di procedure di inferenza, era il sistema MYCIN. Questo sistema è stato sviluppato a Stanford all'inizio degli anni '70 per diagnosticare lo shock settico. La metà dei pazienti morì entro un giorno e i medici riuscirono a rilevare la sepsi solo nel 50% dei casi. MYCIN sembrava essere un vero trionfo della tecnologia dei sistemi esperti, poiché era in grado di rilevare la sepsi nel 100% dei casi.

Un esempio di programma diagnostico è il pacchetto cardiodiagnostico sviluppato da RES Informatica insieme al Centro Ricerche Cardiologiche di Milano. Il programma consente una cardiodiagnostica non invasiva basata sul riconoscimento degli spettri del tacogramma. Il tacogramma è un istogramma degli intervalli tra i battiti cardiaci successivi e il suo spettro riflette l'equilibrio delle attività del sistema nervoso simpatico e parasimpatico umano, che cambia specificamente in varie malattie.

In un modo o nell'altro si può già affermare che le reti neurali si stanno trasformando in uno strumento per la cardiodiagnostica: in Inghilterra, ad esempio, vengono utilizzate in quattro ospedali per prevenire l'infarto del miocardio.

Uno dei settori principali in cui si lavora attualmente sull’uso delle reti neurali è la diagnosi del cancro al seno. Questa malattia è la causa della morte di una donna su nove. Il rilevamento del tumore viene effettuato durante l'analisi radiografica iniziale del seno (mammografia) e la successiva analisi di un pezzo di tessuto tumorale (biopsia). Nonostante esistano regole generali per differenziare le neoplasie benigne da quelle maligne, secondo la mammografia, solo dal 10 al 20% dei risultati della successiva biopsia chirurgica confermano realmente la presenza di cancro al seno. Ancora una volta, abbiamo a che fare con un caso di specificità del metodo estremamente bassa.

I ricercatori della Duke University hanno addestrato una rete neurale a riconoscere le mammografie di tessuto maligno sulla base di otto caratteristiche che i radiologi comunemente affrontano. Si è scoperto che la rete è in grado di risolvere il problema con una sensibilità di circa il 100% e una specificità del 59% (rispetto al 10-20% dei radiologi). Quante donne con tumori benigni possono essere salvate dallo stress di fare una biopsia utilizzando questa rete neurale!

Le reti neurali possono essere utilizzate anche per prevedere l’effetto di vari trattamenti in fase di sviluppo. Sono già stati utilizzati con successo in chimica per prevedere le proprietà dei composti in base alla loro struttura molecolare. I ricercatori del National Cancer Institute negli Stati Uniti hanno utilizzato le reti neurali per prevedere il meccanismo d’azione dei farmaci utilizzati nella chemioterapia antitumorale. Si noti che ci sono milioni di molecole diverse che devono essere studiate per la loro attività antitumorale. Per risolvere un problema simile sono state utilizzate anche le reti Kohonen. Queste reti neurali auto-organizzate e non supervisionate hanno suddiviso le sostanze in un numero sconosciuto di cluster e hanno quindi consentito ai ricercatori di identificare sostanze con nuovi meccanismi d'azione citotossici.

La diagnostica e la cura delle malattie oncologiche, nonché lo sviluppo di nuovi farmaci, rappresentano senza dubbio il più importante ambito di applicazione delle tecnologie delle reti neurali. Recentemente, tuttavia, tra i ricercatori e i medici è cresciuta la consapevolezza che i futuri progressi dovranno essere strettamente legati allo studio delle cause molecolari e genetiche delle malattie.

Non è un caso che nell'aprile 1997 gli esperti del National Institutes of Health (USA) abbiano formulato raccomandazioni per rafforzare la ricerca relativa all'identificazione delle cause del cancro e allo sviluppo volto a prevenire le malattie. Per molto tempo, le reti neurali sono state utilizzate attivamente nell'analisi delle sequenze di DNA genomico, in particolare per il riconoscimento dei promotori, regioni che precedono i geni e si legano alla proteina RNA polimerasi, che avvia la trascrizione. Sono utilizzati per differenziare le regioni codificanti e non codificanti del DNA (esoni e introni) e per prevedere la struttura delle proteine.

I modelli predittivi di rete neurale possono essere utilizzati nella demografia e nell'organizzazione sanitaria. È stato creato un sistema esperto per prevedere se una persona (di età pari o superiore a 55 anni) morirà nei prossimi 10 anni. La previsione viene effettuata sulla base dei risultati delle risposte a 18 domande del questionario. Il questionario comprendeva domande quali razza, sesso, età, cattive abitudini, stato civile, reddito familiare. 4 domande su 18 rivelano l'indice di massa corporea in diversi periodi della vita del rispondente. L'indice è calcolato come rapporto tra peso e altezza al quadrato (un indice superiore a 27 kg/m2 è considerato obeso). Una maggiore attenzione a questo indicatore indica la sua importanza per la prognosi della vita.

Letteratura

  1. Neuroinformatica / A.N. Gorban, V.L. Dunin-Barkovsky, A.N. Kirdin e altri - Novosibirsk: Scienza. Impresa siberiana dell'Accademia delle scienze russa, 1998. - 296s.
  2. S.Korotkiy Reti neurali: disposizioni di base
  3. E. Monakhova, "Neurochirurghi" di Ordynka, PC Week/RE, n. 9, 1995

La ricerca e lo studio di algoritmi impliciti che consentono di accumulare e quindi utilizzare automaticamente l'esperienza nella formazione [5.3] va avanti da più di 100 anni [5.4]. Tuttavia, i primi seri tentativi di creare reti neurali furono fatti negli anni '40 e '50, quando W. McCulloch e W. Pitts avanzarono le principali disposizioni della teoria del cervello. Con l'avvento dei computer economici, si è verificato un netto balzo in avanti in quest'area, che all'inizio degli anni '80 si è trasformata in un'intera scienza: la neuroinformatica [5.5, 5.6, 5.7].

I compiti impliciti della medicina e della biologia sono diventati un campo ideale per l'applicazione delle tecnologie delle reti neurali, ed è in quest'area che si osserva il successo pratico più sorprendente dei metodi neuroinformatici.

Consideriamo alcune delle applicazioni di reti neurali più interessanti per la biologia e la medicina, create da vari autori e scuole.

Di grande interesse per l'assistenza sanitaria pratica sono i sistemi per la diagnosi e la diagnosi differenziale delle malattie. Allo stesso tempo, per il processo decisionaleè possibile utilizzare un'ampia varietà di dati: anamnesi, esame clinico (si stanno creando sistemi diagnostici esperti, limitati solo a questo insieme [5.8]), risultati di test di laboratorio e metodi funzionali complessi. L'elenco delle aree della medicina in cui le nuove tecnologie hanno iniziato ad essere applicate è estremamente ampio e continua a crescere.

Uno dei settori più intensamente sviluppati è l’uso delle reti neurali in cardiologia.

L'Italia ha sviluppato un'evoluzione estremamente interessante sistema esperto per la diagnosi e il trattamento dell’ipertensione arteriosa [5.9]. Il sistema include tre moduli di rete neurale e le risposte di alcuni vengono immesse in input per altri. All'inizio dello studio, al paziente viene misurata la pressione sistolica e diastolica ogni mezz'ora durante il giorno. Viene calcolata la media dei dati per ogni ora. Si forma così una matrice di 48 valori di pressione arteriosa (24 ciascuno per sistolica e diastolica). Successivamente, il primo modulo, costituito da due reti neurali a tre strati (ognuna delle quali ha 2 neuroni di input, 4 "nascosti" e 24 di output), sulla base dei dati sul campo e sull'età del paziente, calcola simili "corretti" valori e li confronta con quelli reali. Parallelamente, il secondo modulo (rete neurale a due strati con 17 neuroni di input e 4 neuroni di output), sulla base dei dati clinici (sintomi, anamnesi), calcola le possibili combinazioni di farmaci antipertensivi che possono essere utilizzati per trattare questo paziente. I dati prelevati dagli output di entrambi i moduli, insieme ai dati clinici, vengono immessi nell'input dell'ultimo, terzo modulo (rete neurale a 6 strati). Questo modulo opera con 4 gruppi di farmaci antipertensivi (diuretici, beta-bloccanti, inibitori dell'angiotensina, calcio-antagonisti). L'obiettivo è assegnare un programma giornaliero (orario) affinché i pazienti possano assumere farmaci per ciascuno (se necessario) di 4 gruppi. Pertanto, questo modulo ne ha 96 neuroni in uscita(4 farmaci x 24 ore). Da ciascuno neurone di uscita viene prelevata la dose corrispondente ad un farmaco prescritto per una determinata ora della giornata. Naturalmente, in una situazione reale, la maggior parte dei dati di output è zero. Pertanto, viene creato per il paziente un regime di trattamento ottimale per l'ipertensione. Va notato che il sistema tiene conto di alcune caratteristiche dei pazienti che assumono farmaci, ad esempio la difficoltà di assumere farmaci durante la notte (prescrive una dose notturna solo in casi estremi), il divieto di prescrivere farmaci diuretici durante la notte.

Una caratteristica distintiva del sistema è la capacità dell'utente (medico) di trasferire la propria esperienza alla rete neurale. Per fare ciò, i creatori del programma hanno previsto un blocco speciale che visualizza sullo schermo del computer le curve giornaliere della pressione sanguigna e invita il medico a inserire nel computer un regime giornaliero per l'assunzione di farmaci antipertensivi nelle dosi che ritiene necessarie. L'esempio inserito viene inserito nel database. In qualsiasi momento puoi iniziare l'apprendimento delle reti neurali con nuovi esempi.

È in corso un complesso di studi sull'utilizzo delle reti neurali per la diagnosi dell'infarto miocardico [5.13,5.14,5.15]. L'autore fornisce dati sulla sensibilità (77,7%) e specificità (97,2%) del test della rete neurale. In [5.16], inoltre, utilizzando una rete neurale, è stato stabilito il significato diagnostico dei parametri clinici nella diagnosi di infarto miocardico.

Le reti neurali vengono utilizzate dai terapisti per diagnosticare le malattie del fegato in base ai dati di laboratorio derivanti dallo studio delle funzioni epatiche [5.19]; diagnosi differenziale delle malattie del fegato [5.20] e della colecisti mediante ecografia [5.21].

I neuroprogrammi possono funzionare con successo con dati medici relativi a categorie soggettive, ad esempio in psichiatria [5.22]. La valutazione dei dati soggettivi consente di riconoscere i sintomi mentali e di diagnosticare e studiare alcuni complessi di sintomi psichiatrici.

L’attuale problema della diagnosi delle neoplasie maligne potrebbe ricevere un nuovo livello di comprensione con l’inizio dell’uso dei neuroalgoritmi. Pertanto, nel lavoro [5.23], viene mostrata un'accuratezza dell'80% nella diagnosi precoce dei melanomi cutanei, una delle malattie più maligne.

Uno dei campi di applicazione più seri delle reti neurali è l'interpretazione dei dati medici. Negli ultimi anni si è assistito ad un rapido sviluppo di nuovi strumenti diagnostici e terapeutici. Allo stesso tempo, c'è una "seconda ondata" di studio e utilizzo di metodi antichi e antichi e, al contrario, di applicazione delle ultime innovazioni tecniche. Spesso entrambi i metodi, se utilizzati, forniscono al medico un'ampia varietà di dati. Ciò solleva il problema della loro interpretazione competente e corretta. La ricerca di schemi profondi tra i dati ricevuti e i processi patologici inizia a restare indietro rispetto allo sviluppo di metodi sempre più nuovi, quindi l'uso delle reti neurali per questo scopo può essere estremamente vantaggioso.

entro 5 punti di questa onda, la rete neurale valuta lo stato del rene sinistro.

Un problema classico in cardiologia è l'interpretazione degli elettrocardiogrammi, che richiede una notevole esperienza da parte del medico. I dipendenti dell'Università di Glasgow (Gran Bretagna) stanno conducendo ricerche sull'uso delle reti neurali per la diagnostica ECG dell'infarto del miocardio [5.25]. I dati di ingresso per le reti sono i parametri selezionati dell'elettrocardiogramma a 12 canali e del vettorecardiogramma a 12 canali (lunghezza dei poli, distanza tra i poli). I ricercatori hanno addestrato un numero enorme di reti neurali (167 reti per la diagnosi di infarto miocardico della parete anteriore e 139 reti per infarto della parete inferiore) su un set di dati di 360 elettrocardiogrammi. Le reti addestrate hanno poi testato un campione separato con risposte note (493 casi). Allo stesso tempo, è stato utilizzato un metodo logico (con un algoritmo predeterminato) per ottenere una serie separata di risposte sul campione di prova. Quindi sono stati confrontati i risultati del test del campione con le migliori reti neurali e l'utilizzo di un algoritmo logico. Dal confronto è emerso che in molti casi la sensibilità e la specificità del test della rete neurale si sono rivelate superiori a quelle del metodo logico. Gli autori giungono alla giusta conclusione che nei casi in cui è ancora possibile costruire un algoritmo logico per risolvere un problema, è ragionevole combinare entrambi gli approcci nei sistemi esperti.

Interpretazione 59% ).

7 luglio 2017 alle 22:30

Le reti neurali diagnosticano i problemi cardiaci in modo più accurato rispetto ai medici

  • Medgadget,
  • Salute geek,

Il fattore umano spesso causa problemi. Questo vale per la produzione, le situazioni quotidiane, la guida e, naturalmente, la medicina. L'errore di un medico può significare la perdita della salute o addirittura la vita di un paziente, e i medici commettono errori non di rado. Anche un professionista di altissimo livello può commettere errori: dopo tutto, uno specialista può essere stanco, irritato e concentrato su un problema peggiore del solito.

In questo caso, le macchine possono venire in soccorso. Lo stesso sistema cognitivo IBM Watson, ad esempio, è abbastanza ben gestito con il lavoro in campo medico (oncologia, lettura di radiografie, ecc.). Ma ci sono altre soluzioni proposte da ricercatori indipendenti. Una di queste soluzioni è stata creata dagli scienziati di Stanford guidati da Andrew Angie, noto specialista di intelligenza artificiale nel suo campo.

Lui e i suoi colleghi hanno sviluppato un sistema in grado di diagnosticare l'aritmia cardiaca da un cardiogramma, e un computer lo fa meglio di un esperto. Stiamo parlando di una rete neurale che, dopo l'allenamento, è in grado di diagnosticare l'aritmia con un elevato grado di precisione. Allo stesso tempo, il computer funziona non solo in modo più affidabile, ma anche più veloce della rete neurale, in modo che il compito di analizzare le immagini mediche e i risultati dell’ECG possa essere trasferito al computer dopo la “finitura” finale del sistema. Il medico può solo verificare il funzionamento della piattaforma software e hardware interessata e agire in base alla diagnosi finale.

Questo progetto dimostra quanto il computer possa cambiare la medicina migliorando diversi aspetti di questo campo. Le reti neurali stanno già aiutando i medici a diagnosticare il cancro della pelle, il cancro al seno e le malattie degli occhi. Ora è il turno della cardiologia.

"Mi piace molto la rapidità con cui le persone accettano l'idea che il deep learning possa aiutare a migliorare l'accuratezza della diagnosi di un medico", afferma Angie. Egli ritiene inoltre che le possibilità dei sistemi informatici non si limitino a questo, ma possano essere utilizzate in molti altri settori.

Il team di Stanford ha trascorso molto tempo ad addestrare la rete neurale in modo che il sistema potesse identificare anomalie nei dati ECG. Allo stesso tempo, l'aritmia è una malattia molto pericolosa, può portare alla morte improvvisa per arresto cardiaco. Il problema è che l’aritmia non è così facile da rilevare, quindi i pazienti con sospetta aritmia a volte devono indossare un sensore ECG per diverse settimane. E anche dopo, potrebbero non esserci dati sufficienti per diagnosticare le deviazioni.

Come accennato in precedenza, la rete neurale doveva essere addestrata e sull'esempio di indicatori reali dei pazienti ospedalieri. Gli specialisti di Stanford non sono stati in grado di raccogliere diverse decine di migliaia di misurazioni ECG da soli, quindi hanno invitato iRhythm, un'azienda che produce gadget ECG portatili, a collaborare con loro. L'azienda ha fornito 30.000 registrazioni di 30 secondi dei risultati delle misurazioni del muscolo cardiaco di pazienti affetti da varie forme di aritmie. Per aumentare la precisione dell'algoritmo e per confrontare i risultati del computer con i risultati della diagnostica medica, sono stati utilizzati altri 300 record. Sono stati analizzati simultaneamente sia dalla macchina che dai medici. Quindi i risultati sono stati valutati da una giuria speciale, che comprendeva 3 cardiologi extraclasse.

L’apprendimento profondo di una rete neurale è iniziato “alimentando” un’enorme quantità di dati. Successivamente è stata utilizzata la messa a punto per migliorare la precisione della diagnostica.

Oltre agli specialisti sopra citati, altri gruppi utilizzano il machine learning per creare sistemi in grado di diagnosticare le aritmie. Ad esempio, Eric Horowitz, amministratore delegato di Microsoft Research (lui stesso è un medico) e i suoi colleghi lavorano più o meno nella stessa direzione degli specialisti di Stanford. Secondo loro, le reti neurali possono davvero migliorare la qualità dell’assistenza medica per i pazienti, aiutando i medici a dedicare meno tempo alla routine e più alla ricerca di trattamenti efficaci per i loro pazienti.


È vero, non si parla ancora dell'implementazione su larga scala delle reti neurali negli ospedali di tutto il mondo. Questa direzione è agli inizi, ma si sta sviluppando sempre più velocemente. Gli ospedali negli Stati Uniti, in Europa e in altri paesi stanno adottando nuove tecnologie, lavorando con nuovi metodi di diagnosi delle malattie. Il problema principale in termini di diffusione di queste tecnologie è che le reti neurali rappresentano una sorta di “scatola nera”. Gli specialisti inseriscono i dati e ottengono un determinato risultato. Ma come è stato ottenuto questo risultato, quali algoritmi e in quale sequenza sono coinvolti, potrebbero non essere pienamente compresi dagli stessi creatori di tali sistemi. Se le reti neurali potessero essere rese più trasparenti e il principio del loro funzionamento potesse essere facilmente spiegato ai medici, il tasso di diffusione di questa tecnologia sarebbe molto più elevato.

tag:

  • reti neurali
  • medici
  • medicinale
Aggiungere etichette

Reti neurali in medicina

Reti neurali per compiti diagnostici

Dolore acuto al petto. Un'ambulanza trasporta il paziente al pronto soccorso, dove il medico di turno deve fare una diagnosi e stabilire se si tratta davvero di un infarto miocardico. L'esperienza dimostra che la percentuale di pazienti che hanno avuto un infarto tra quelli ricoverati con sintomi simili è piccola. Tuttavia, non esistono ancora metodi diagnostici accurati. L'elettrocardiogramma a volte non contiene segni evidenti della malattia. E quanti parametri delle condizioni del paziente possono in un modo o nell'altro aiutare a fare la diagnosi corretta in questo caso? Oltre quaranta. Può il medico del pronto soccorso analizzare rapidamente tutti questi indicatori, insieme alle loro relazioni, per prendere una decisione sull'invio del paziente al reparto di cardiologia? In una certa misura, le tecnologie delle reti neurali aiutano a risolvere questo problema.

Le statistiche sono le seguenti: il medico diagnostica correttamente l'infarto miocardico nell'88% dei pazienti e fa erroneamente questa diagnosi nel 29% dei casi. Ci sono troppi falsi allarmi (sovradiagnosi). La storia dell'uso di vari metodi di elaborazione dei dati per migliorare la qualità della diagnosi risale a decenni fa, ma i migliori hanno contribuito a ridurre il numero di casi di sovradiagnosi solo del 3%.

Nel 1990, William Bakst dell'Università della California a San Diego ha utilizzato una rete neurale - un percettrone multistrato - per riconoscere l'infarto del miocardio in pazienti che si presentavano al pronto soccorso con dolore toracico acuto. Il suo obiettivo era creare uno strumento che possa aiutare i medici che non sono in grado di far fronte al flusso di dati che caratterizza la condizione del paziente ricoverato. Un altro obiettivo potrebbe essere quello di migliorare la diagnostica. Il ricercatore ha reso il suo compito più difficile perché ha analizzato i dati solo dei pazienti che erano già stati indirizzati al reparto di cardiologia. Bakst ha utilizzato solo 20 parametri, tra cui età, sesso, sede del dolore, risposta alla nitroglicerina, nausea e vomito, sudorazione, sincope, frequenza respiratoria, frequenza cardiaca, precedenti attacchi cardiaci, diabete, ipertensione, distensione della vena giugulare, una serie di parametri Caratteristiche dell'ECG e presenza di cambiamenti ischemici significativi.

La rete era accurata al 92% nel rilevare l'infarto miocardico e produceva solo il 4% di falsi allarmi, confermando erroneamente l'invio di pazienti senza infarto al reparto di cardiologia. Quindi, esiste un fatto di applicazione riuscita delle reti neurali artificiali nella diagnosi della malattia. Ora è necessario spiegare in quali parametri viene valutata la qualità della diagnosi nel caso generale. Supponiamo che su dieci persone che hanno realmente avuto un infarto, il metodo diagnostico possa rilevare la malattia in otto. Quindi la sensibilità del metodo sarà dell'80%. Se prendiamo dieci persone che non hanno un infarto e il metodo diagnostico lo sospetta in tre persone, la percentuale di falsi allarmi sarà del 30%, mentre una caratteristica aggiuntiva - la specificità del metodo - sarà del 70 %.

Un metodo diagnostico ideale dovrebbe avere sensibilità e specificità al cento per cento: in primo luogo, per non perdere una sola persona veramente malata e, in secondo luogo, per non spaventare le persone sane. Per assicurarti, puoi e dovresti provare prima di tutto a garantire la sensibilità al cento per cento del metodo: non puoi perdere la malattia. Ma questo di solito si traduce in una bassa specificità del metodo: in molte persone i medici sospettano malattie di cui i pazienti in realtà non soffrono.

Reti neurali per compiti diagnostici

Le reti neurali sono sistemi non lineari che consentono una classificazione dei dati molto migliore rispetto ai metodi lineari comunemente utilizzati. Applicati alla diagnostica medica, consentono di aumentare significativamente la specificità del metodo senza ridurne la sensibilità.

Ricordiamo che la rete neurale che diagnostica un infarto ha funzionato con un ampio insieme di parametri, il cui impatto sulla diagnosi di una persona non può essere valutato. Tuttavia, le reti neurali sono state in grado di prendere decisioni basate sui modelli nascosti identificati nei dati multidimensionali. Una caratteristica distintiva delle reti neurali è che non sono programmate: non utilizzano alcuna regola di inferenza per fare una diagnosi, ma sono addestrate a farlo tramite esempi. In questo senso, le reti neurali non sono affatto come i sistemi esperti, il cui sviluppo negli anni ’70 ebbe luogo dopo la temporanea “vittoria” dell’Intelligenza Artificiale sull’approccio alla modellazione della memoria, al riconoscimento di schemi e alla generalizzazione, che si basava sullo studio dell’organizzazione neurale del cervello.

Uno dei più noti sistemi esperti sviluppati, il cui funzionamento si basava sulla conoscenza estratta dagli esperti e sull'implementazione di procedure di inferenza, era il sistema MYCIN. Questo sistema è stato sviluppato a Stanford all'inizio degli anni '70 per diagnosticare lo shock settico. La metà dei pazienti morì entro un giorno e i medici riuscirono a rilevare la sepsi solo nel 50% dei casi. MYCIN sembrava essere un vero trionfo della tecnologia dei sistemi esperti, perché era in grado di rilevare la sepsi nel 100% dei casi. Tuttavia, dopo una più stretta conoscenza di questo sistema esperto, i medici hanno migliorato significativamente i metodi diagnostici tradizionali e MYCIN ha perso la sua importanza, trasformandosi in un sistema educativo. I sistemi esperti "sono andati" solo in cardiologia - per l'analisi degli elettrocardiogrammi. Le complesse regole che costituiscono il contenuto principale dei libri sull'analisi clinica dell'ECG sono state utilizzate dai sistemi appropriati per emettere una conclusione diagnostica.

La diagnostica è un caso speciale di classificazione degli eventi e il più prezioso è la classificazione di quegli eventi che non sono presenti nel set di addestramento della rete neurale. Qui si manifesta il vantaggio delle tecnologie delle reti neurali: sono in grado di effettuare tale classificazione, generalizzando l'esperienza precedente e applicandola a nuovi casi.

Sistemi specifici

Un esempio di programma diagnostico è il pacchetto cardiodiagnostico sviluppato da RES Informatica insieme al Centro Ricerche Cardiologiche di Milano. Il programma consente una cardiodiagnostica non invasiva basata sul riconoscimento degli spettri del tacogramma. Il tacogramma è un istogramma degli intervalli tra i battiti cardiaci successivi e il suo spettro riflette l'equilibrio delle attività del sistema nervoso simpatico e parasimpatico umano, che cambia specificamente in varie malattie.

In un modo o nell'altro si può già affermare che le reti neurali si stanno trasformando in uno strumento per la cardiodiagnostica: in Inghilterra, ad esempio, vengono utilizzate in quattro ospedali per prevenire l'infarto del miocardio.

In medicina viene utilizzata anche un'altra caratteristica delle reti neurali: la loro capacità di prevedere sequenze temporali. È già stato notato che i sistemi esperti sono riusciti con successo nell'analisi dell'ECG. Anche le reti neurali sono utili in questo caso. Ki Zhenghu, Yu Henu e Willis Tompkins dell'Università del Wisconsin hanno sviluppato un sistema di filtraggio della rete neurale per gli elettrocardiogrammi in grado di sopprimere il rumore non lineare e non stazionario molto meglio dei metodi utilizzati in precedenza. Il fatto è che la rete neurale ha previsto bene il rumore in base ai suoi valori nei momenti precedenti. E il fatto che le reti neurali siano molto efficaci per prevedere sequenze temporali (come i tassi di cambio o le quotazioni azionarie) è stato dimostrato in modo convincente dai risultati del concorso di programmi predittivi indetto dall'Università di Santa Fe: le reti neurali hanno occupato il primo posto e hanno dominato tra i metodi migliori.

Possibilità di utilizzare reti neurali

L'ECG è un'applicazione privata, anche se estremamente importante. Tuttavia oggi esistono molti altri esempi di utilizzo delle reti neurali per le previsioni mediche. È noto che le lunghe code nei reparti di cardiochirurgia (da settimane a mesi) sono causate dalla carenza di unità di terapia intensiva. Non è possibile aumentarne il numero a causa dell'elevato costo delle cure di rianimazione (gli americani spendono il 70% dei fondi nelle ultime 2 settimane di vita in questo reparto).

L’unica via d’uscita è utilizzare i fondi disponibili in modo più efficiente. Supponiamo che le condizioni dei pazienti operati in un determinato giorno siano così gravi da richiedere una lunga degenza nel reparto di terapia intensiva (più di due giorni). Per tutto questo tempo i chirurghi rimarranno inattivi, perché non c'è nessun posto dove mettere i pazienti appena operati. È più saggio operare pazienti gravemente malati prima dei fine settimana o dei giorni festivi: in questi giorni le sale operatorie sono ancora chiuse, i chirurghi riposeranno e i pazienti guariranno in terapia intensiva. Ma all'inizio della settimana lavorativa è meglio operare quei pazienti che dovranno rimanere nel reparto di terapia intensiva solo per uno o due giorni. Quindi i letti nel reparto di terapia intensiva verranno liberati più velocemente e accoglieranno nuovi pazienti operati martedì e mercoledì.

La domanda è come indovinare chi dovrà rimanere a lungo nel reparto di terapia intensiva dopo l'operazione e chi no. Jack Too e Michael Guerier del St. Michael's Hospital dell'Università di Toronto hanno utilizzato le reti neurali per fare questa previsione. Come dati iniziali, sono state prese solo le informazioni sul paziente note nel periodo preoperatorio. Va notato che in studi precedenti che non utilizzavano reti neurali, importanti informazioni postoperatorie sono state utilizzate anche come fattori per un aumento del rischio di permanenza in terapia intensiva - varie complicazioni insorte durante l'intervento chirurgico.

Tu e Guerir hanno addestrato un percettrone a doppio strato per dividere i pazienti in tre gruppi a rischio, tenendo conto della loro età, sesso, stato funzionale del ventricolo sinistro, grado di complessità dell'operazione imminente e presenza di malattie concomitanti. Tra i pazienti identificati dalla rete come a basso rischio di ritardo in terapia intensiva, solo il 16,3% ha effettivamente trascorso più di due giorni in terapia intensiva. Allo stesso tempo, oltre il 60% delle persone identificate dalla rete come ad alto rischio ha mantenuto la prognosi sfavorevole.

Lotta contro il cancro

Abbiamo prestato particolare attenzione alle malattie cardiovascolari, poiché detengono la triste leadership nell'elenco delle cause di morte. Al secondo posto ci sono le malattie oncologiche. Uno dei settori principali in cui si lavora attualmente sull’uso delle reti neurali è la diagnosi del cancro al seno. Questa malattia è la causa della morte di una donna su nove.

Il rilevamento del tumore viene effettuato durante l'analisi radiografica iniziale del seno (mammografia) e la successiva analisi di un pezzo di tessuto tumorale (biopsia). Nonostante esistano regole generali per differenziare le neoplasie benigne da quelle maligne, secondo la mammografia, solo dal 10 al 20% dei risultati della successiva biopsia chirurgica confermano realmente la presenza di cancro al seno. Ancora una volta, abbiamo a che fare con un caso di specificità del metodo estremamente bassa.

I ricercatori della Duke University hanno addestrato una rete neurale a riconoscere le mammografie di tessuto maligno sulla base di otto caratteristiche che i radiologi comunemente affrontano. Si è scoperto che la rete è in grado di risolvere il problema con una sensibilità di circa il 100% e una specificità del 59% (rispetto al 10-20% dei radiologi). Quante donne con tumori benigni possono essere salvate dallo stress di fare una biopsia utilizzando questa rete neurale! Alla Mayo Clinic (Minnesota), la rete neurale ha analizzato i risultati dell'ecografia mammaria e ha fornito una specificità del 40%, mentre per le stesse donne la specificità della conclusione dei radiologi si è rivelata pari a zero. Non è forse vero che il successo dell'utilizzo delle tecnologie delle reti neurali non sembra affatto casuale?

Dopo il trattamento per il cancro al seno, è possibile la recidiva del tumore. Le reti neurali aiutano già a prevederli in modo efficace. Studi simili sono in corso presso la University of Texas Medical School. Le reti addestrate hanno dimostrato la loro capacità di identificare e tenere conto di relazioni molto complesse di variabili predittive, in particolare delle loro triple relazioni per migliorare la capacità predittiva.

Le possibilità di utilizzo delle reti neurali in medicina sono diverse e la loro architettura è diversa. Sulla base della previsione dei risultati a lungo termine del trattamento della malattia con un metodo o con l'altro, si può preferire uno di essi. Un risultato significativo nella prognosi del trattamento del cancro ovarico (una malattia che colpisce ogni settantesima donna) è stato ottenuto dal famoso specialista olandese Herbert Kappen dell'Università di Nimega (usa nel suo lavoro non percettroni multistrato, ma i cosiddetti Boltzmann Macchine - reti neurali per la valutazione delle probabilità).

Ecco un esempio di un altro tipo di cancro. I ricercatori di una scuola di medicina a Kagawa, in Giappone, hanno addestrato una rete neurale che ha previsto i risultati della resezione epatica in pazienti con carcinoma epatocellulare con dati preoperatori quasi privi di errori.

Presso l'Istituto Troitsk per l'innovazione e la ricerca sulla fusione (TRINITI), nell'ambito di un progetto per la creazione di sistemi di consulenza su reti neurali implementato dal Ministero della Scienza, è stato sviluppato un programma di rete neurale che seleziona un metodo di trattamento per il cancro della pelle basocellulare (basalioma ) sulla base di una prognosi a lungo termine di recidiva. Il numero di casi di basalioma - una malattia oncologica dei bianchi con pelle sottile - rappresenta un terzo di tutte le malattie oncologiche.

La diagnosi di una delle forme di melanoma - un tumore, che a volte è difficile da distinguere dalla forma pigmentata del basalioma, è stata implementata utilizzando il simulatore di rete neurale multineurone sviluppato presso il Centro di calcolo della SOAN a Krasnoyarsk sotto la guida di A.N. Gorban.

Le reti neurali possono essere utilizzate anche per prevedere l’effetto di vari trattamenti in fase di sviluppo. Sono già stati utilizzati con successo in chimica per prevedere le proprietà dei composti in base alla loro struttura molecolare. I ricercatori del National Cancer Institute negli Stati Uniti hanno utilizzato le reti neurali per prevedere il meccanismo d’azione dei farmaci utilizzati nella chemioterapia antitumorale. Si noti che ci sono milioni di molecole diverse che devono essere studiate per la loro attività antitumorale. I ricercatori del Cancer Institute hanno diviso i farmaci antitumorali conosciuti in sei gruppi in base al loro meccanismo d’azione sulle cellule tumorali e hanno addestrato reti multistrato per classificare nuove sostanze e riconoscerne gli effetti. Come dati iniziali sono stati utilizzati i risultati degli esperimenti sulla soppressione della crescita cellulare di vari tumori. La classificazione della rete neurale consente di determinare quali tra le centinaia di molecole testate quotidianamente vale la pena studiare ulteriormente in esperimenti in vitro e in vivo molto costosi. Per risolvere un problema simile sono state utilizzate anche le reti Kohonen. Queste reti neurali auto-organizzate e non supervisionate hanno suddiviso le sostanze in un numero sconosciuto di cluster e hanno quindi consentito ai ricercatori di identificare sostanze con nuovi meccanismi d'azione citotossici.

Neurosistemi, genetica e molecole

La diagnostica e la cura delle malattie oncologiche, nonché lo sviluppo di nuovi farmaci, rappresentano senza dubbio il più importante ambito di applicazione delle tecnologie delle reti neurali. Recentemente, tuttavia, tra i ricercatori e i medici è cresciuta la consapevolezza che i futuri progressi dovranno essere strettamente legati allo studio delle cause molecolari e genetiche delle malattie.

Non è un caso che nell'aprile 1997 gli esperti del National Institutes of Health (USA) abbiano formulato raccomandazioni per rafforzare la ricerca relativa all'identificazione delle cause del cancro e allo sviluppo volto a prevenire le malattie. Per molto tempo, le reti neurali sono state utilizzate attivamente nell'analisi delle sequenze di DNA genomico, in particolare per il riconoscimento dei promotori, regioni che precedono i geni e si legano alla proteina RNA polimerasi, che avvia la trascrizione. Sono utilizzati per differenziare le regioni codificanti e non codificanti del DNA (esoni e introni) e per prevedere la struttura delle proteine.

Nel 1996 è stata fatta una scoperta sensazionale che collegava la ricerca fondamentale sulla genetica molecolare con il problema della patogenesi e del trattamento della malattia oncologica più comune: il cancro della pelle basocellulare. I ricercatori hanno scoperto un gene (PTC) nel nono cromosoma umano, le cui mutazioni, a differenza del gene p53, sono causate dall'esposizione alle radiazioni ultraviolette e sono la causa dello sviluppo del tumore. La chiave della scoperta è stata lo studio del cosiddetto gene patch, i cui cambiamenti hanno stimolato difetti di sviluppo nel moscerino della frutta e il fatto che i bambini che soffrono anche di difetti nello sviluppo osseo (sindrome del nevo basale) spesso hanno basaliomi multipli.

Ora genetisti e medici sono pieni di speranze di trovare un trattamento farmacologico per il basalioma o di utilizzare metodi di chirurgia genetica e di sostituire con essi metodi di trattamento spietati come il laser convenzionale, i raggi X e la criochirurgia. Le reti neurali potrebbero essere utili per questi studi? In particolare, possono essere utilizzati per valutare il possibile impatto di una particolare mutazione sul cambiamento delle proprietà delle proteine ​​corrispondenti o per valutarne il valore prognostico, ad esempio, per lo sviluppo di recidive del cancro al seno?

Se ciò potesse essere fatto, le reti neurali ridurrebbero significativamente l’area di ricerca per i biologi molecolari, che spesso conducono esperimenti molto costosi per valutare il ruolo delle mutazioni in una molecola di DNA. Ricordiamo che la crescita e la divisione cellulare incontrollata portano allo sviluppo di tumori maligni. Il genoma umano, che contiene informazioni su tutte le proteine ​​prodotte nel corpo, conta circa tre miliardi di nucleotidi. Ma solo il 2-3% di essi effettivamente codifica per proteine: il resto è necessario al DNA stesso per mantenere la struttura corretta, la replicazione e altre cose.

Nelle sequenze di DNA genomico si possono distinguere grossolanamente tre componenti: il primo contiene numerose copie di frammenti identici (DNA satellite); il secondo contiene sequenze moderatamente ripetitive sparse nel genoma; e nel terzo _DNA unico. Nel DNA satellitare, diverse copie sono rappresentate in modo diseguale: il loro numero varia da centinaia a milioni. Pertanto, sono solitamente ulteriormente suddivisi in mini e microsatelliti.

Sorprendentemente, la distribuzione dei microsatelliti sul genoma è così specifica che può essere utilizzata come analogo delle impronte digitali umane. Si ritiene inoltre che questa distribuzione possa essere utilizzata anche per diagnosticare varie malattie.

In forma nascosta, le ripetizioni delle sequenze nucleotidiche svolgono un ruolo importante nelle sequenze uniche del DNA. Secondo l'ipotesi di Francis Crick, l'evoluzione del DNA inizia da strutture quasi periodiche e, se riusciremo a trovare ripetizioni nascoste, scopriremo dove sono avvenute le mutazioni che hanno determinato l'evoluzione, ovvero troveremo sia i siti più antichi che quelli più importanti in quali mutazioni sono più pericolose. La distribuzione delle ripetizioni nascoste è anche strettamente correlata alla struttura e alla funzione delle proteine ​​codificate dalla sequenza corrispondente.

TRINITY ha sviluppato un sistema in cui le modifiche della rete neurale di Hopfield vengono utilizzate per cercare ripetizioni nascoste e valutare il ruolo delle mutazioni nelle sequenze di DNA. Si spera che questo approccio possa essere utilizzato per l'analisi spettrale generalizzata di sequenze di dati di forma molto generale, ad esempio per l'analisi di elettrocardiogrammi.

Le reti neurali camminano sul pianeta

La geografia dei gruppi di ricerca che utilizzano le reti neurali per sviluppare applicazioni mediche è molto ampia. Non c'è niente da dire sugli Stati Uniti: studi simili vengono condotti nelle università di ogni stato e la loro direzione principale è il cancro al seno. Perché ci sono le università: anche le accademie militari sono impegnate in questo. Nella Repubblica Ceca, Jiří Shima ha sviluppato la teoria dell'addestramento delle reti neurali che possono funzionare efficacemente con i cosiddetti dati di intervallo (quando non sono noti i valori dei parametri, ma l'intervallo del loro cambiamento), e li utilizza in vari campi medici applicazioni. In Cina, i ricercatori dell’Atomic Energy Institute hanno addestrato una rete neurale a distinguere tra pazienti con malattie lievi e gravi dell’epitelio esofageo e quelli con cancro esofageo sulla base dell’analisi elementare delle unghie.

In Russia, SINP MSU utilizza le reti neurali per analizzare le malattie degli organi uditivi.

Infine, in Australia, George Christ utilizzò la teoria delle reti neurali per costruire la prima ipotesi sulle cause della misteriosa sindrome della morte improvvisa di un neonato.

Invece di una conclusione

Naturalmente, l'articolo fornisce un elenco tutt'altro che completo di esempi di utilizzo delle tecnologie delle reti neurali artificiali in medicina. Sono rimaste da parte la psichiatria, la traumatologia e altre sezioni in cui le reti neurali vengono provate per il ruolo di assistente diagnostico e clinico. Naturalmente non tutto appare roseo nell’alleanza tra la nuova tecnologia informatica e l’assistenza sanitaria. I programmi di rete neurale sono talvolta estremamente costosi per un'implementazione diffusa in clinica (da migliaia a decine di migliaia di dollari) e i medici sono piuttosto scettici riguardo a qualsiasi innovazione informatica. La conclusione emessa dalla rete neurale deve essere accompagnata da spiegazioni o commenti accettabili.

Ma ci sono ancora motivi di ottimismo. Padroneggiare e applicare le tecnologie delle reti neurali è molto più semplice che studiare la statistica matematica o la logica fuzzy. Ci vogliono mesi anziché anni per creare un sistema medico di rete neurale. Sì, e i parametri sono molto incoraggianti: ricordiamo ancora una volta l'elevata specificità della diagnostica.

E un'altra speranza di cooperazione è la parola stessa "neurone". Eppure, è così ben noto ai medici ...

DEFINIZIONEOTTIMALEMISURARERETI NEURALIINVERSIONE

DISTRIBUZIONEATTRAVERSOCONFRONTOMEZZOVALORI

MODULIPESISINAPSI

Viene proposta una nuova "curva di apprendimento". grafico del modulo di peso medio

sinapsi sulla dimensione della rete neurale. Gli esperimenti mostrano che i minimi locali e

i risultati sugli asintoti di questo indicatore sono in buon accordo con le proprietà

curve di apprendimento tradizionali. Dipendenze degli errori di apprendimento e di generalizzazione da

la dimensione della rete neurale. L'indicatore può essere utilizzato per determinare l'ottimale

dimensione della rete in assenza di un campione di prova.

1. Compitodefinizioniottimalestrutturereti neurali

Quando si utilizzano reti neurali artificiali, un compito importante è

trovare la dimensione (struttura) ottimale della rete. così tanti strati nascosti

neuroni e neuroni in strati che daranno la massima capacità di generalizzazione, ad es.

minimo errore di generalizzazione, soprattutto in assenza di

campione di prova indipendente o l'impossibilità di dividere artificialmente il campione

dati per le parti di formazione e test a causa di dati totali insufficienti.

Pertanto, il paradigma delle "curve di apprendimento" è ampiamente utilizzato.

dipendenze dell'apprendimento e degli errori di generalizzazione dalla dimensione della rete neurale e dall'addestramento

campionamento. L'ottimo corrisponde ai minimi locali o ai momenti di uscita

grafici asintotici. Tecniche formali per estrapolare tali grafici

consentono inoltre di valutare il necessario ed il sufficiente per ottenere il massimo

capacità di generalizzazione, i volumi dei campioni di formazione nel caso dell'iniziale

volumi insufficienti di dati campione.

Un'altra classe di curve di apprendimento sono le dipendenze delle proprietà "interne".

reti neurali sulla sua dimensione, che vengono poi confrontate con la dinamica dell'errore di generalizzazione.

Opzioni. analisi della rappresentazione interna del problema,

la relazione teorica tra l'errore di apprendimento e la somma massima dei moduli dei pesi delle sinapsi,

arrivando al neurone della rete, criterio NIC che opera con gradienti del bersaglio

funzione e la matrice Hessiana della rete addestrata e consentendo di valutare la differenza tra

Errori di apprendimento e generalizzazione. Questi criteri lo rendono possibile

campione di prova indipendente.

Il documento propone una nuova versione della curva di apprendimento. dipendenza media

modulo del peso della sinapsi sulla dimensione della rete neurale. Più precisamente, negli esperimenti ulteriori

il valore della lunghezza del vettore dei pesi delle sinapsi della rete (calcolato in

norma euclidea) diviso per il numero totale di sinapsi, al fine di aumentare l'influenza

i maggiori pesi del modulo e la conseguente riassicurazione basata su

risultati sull’indesiderabilità di grandi pesi di sinapsi.

Questo criterio non è esaustivo in quanto c'è eterogeneità

insiemi di sinapsi di rete da strato a strato (per reti di piccole dimensioni è stato spesso osservato

differenza statistica tra i moduli medi e le varianze dei pesi delle sinapsi dell'output e

strato nascosto della rete). L'eterogeneità strutturale delle reti a strati è nota ed è già presa in considerazione dagli algoritmi di apprendimento, ma l'influenza di questo fatto non viene qui analizzata.

2. DatiPersperimentalecontrolliErisultati

Abbiamo preso 6 basi di dati reali con campioni di test indipendenti

(al fine di non introdurre errori nella stima dell’errore di generalizzazione mediante il metodo della suddivisione

campione di addestramento in parti di addestramento e di test). Database presi

AnnThyroid, cifre opt, cifre penna, satellite, navetta Statlog dal database UCI KDD

Repository http://kdd.ics.uci.edu/ e il database Gong disponibile sulla pagina

http://www-ee.uta.edu/eeweb/IP/training_data_files.htm. Tutti e 6 i compiti lo sono

compiti di classificazione con un insegnante per un certo numero di classi.

Tutti questi compiti hanno un significato significativo, da diverse migliaia a diversi

decine di migliaia di vettori, la dimensione del campione di addestramento. Questa condizione è necessaria per

garantendo la rappresentatività del campione (e, di conseguenza, l’esistenza di un chiaro

asintotici nell'apprendimento ed errori di generalizzazione dopo aver raggiunto e superato

rete neurale di dimensioni adeguate al compito) e l’assenza dell’effetto

riqualificazione con un ulteriore aumento delle dimensioni della rete neurale (rumore e distorsione in

il campione di addestramento, se presente, non può essere ricordato

rete neurale a causa di un numero significativo, con un campione di grandi dimensioni, di tali

false dichiarazioni e non casi isolati di tali false dichiarazioni).

Abbiamo utilizzato reti con uno strato nascosto, il numero di neuroni in cui

variava da 1 a 25. In ogni attività, per ciascuna dimensione della rete neurale, 25

reti (con diversi valori casuali iniziali delle sinapsi) le cui proprietà

poi mediata durante la costruzione delle curve di apprendimento.

Errori medi di apprendimento e generalizzazione (espressi come percentuale della quota

esempi risolti in modo errato nel volume del campione corrispondente);

Peso RMS di una sinapsi in una rete. indicatore proposto;

Massimo tra le somme dei neuroni dei moduli dei pesi delle sinapsi. indicatore.

Il numero di neuroni negli strati nascosti delle reti è tracciato lungo l'asse delle ordinate. Valori

vengono riscalati gli indicatori che riflettono le proprietà dei pesi delle sinapsi

portando nella gamma dei valori degli errori di apprendimento e della generalizzazione, che era

causato dalle limitazioni del programma di plottaggio (impossibilità di inserire due

bilancia). Attorno a ciascun punto è tracciata la varianza del corrispondente campione di 25

valori sperimentali.

Si può vedere che l'uscita del nuovo indicatore verso l'asintoto (e la stabilizzazione. tale

dispersione ridotta, in modo che i "baffi" attorno alla punta siano un po' chiusi dalla punta stessa).

è in ritardo rispetto alla resa degli errori di apprendimento e alla generalizzazione agli asintoti, ad es. un po'

riassicurato in termini di dimensione della rete richiesta, che può essere solo

accoglienza in base ai risultati teorici: aumento del numero dei percorsi

il segnale che passa attraverso la rete può ridurre i pesi massimi delle sinapsi dovuti

canali di riproduzione dove precedentemente era richiesta l'amplificazione.

L'indicatore rivela anche che l'errore di generalizzazione raggiunge il livello ottimale in tutti e due

casi di overfitting (problemi AnnThyroid, Gong), quando con crescita

la dimensione della rete, da un certo momento, l'errore di generalizzazione comincia nuovamente ad aumentare.

il momento della stabilizzazione e l’uscita dell’indicatore verso l’asintoto è leggermente in ritardo

rispetto al momento in cui si raggiunge l'errore minimo nell'attività AnnThyroid e nell'attività

Il minimo locale del gong con una dimensione della rete di 6 neuroni corrisponde esattamente

errore minimo di generalizzazione. L'indicatore nel compito Gong non ha una chiara

il comportamento estremo pronunciato è significativamente instabile su tutta la gamma

le dimensioni studiate della rete neurale. da 1 a 25 neuroni.__

Minimi locali dell'indicatore (sei neuroni per il compito Gong, tre per

Attività Opt cifre, due per l'attività Satellite) può anche indicare l'errore ottimale

generalizzazioni (il compito Gong) o livelli strutturali di complessità del compito (l’ultimo

coincide con le rotture nei grafici degli errori di apprendimento e di generalizzazione). Quest'ultimo può

consentire di individuare i momenti di passaggio dall’area di adeguatezza

modelli a parametri bassi della statistica classica (regressione lineare,

discriminante lineare o classificatore bayesiano basato sui punteggi

matrici di covarianza per ciascuna classe) alle aree di adeguatezza

modelli multiparametrici (reti neurali, approssimazioni polinomiali)

o metodi non parametrici (statistica non parametrica basata sul nucleare

approssimazioni delle densità di probabilità, metodo delle funzioni potenziali).

Inoltre, l'indicatore riduce la sua varianza su una serie di campioni un po' più velocemente di

la somma massima dei neuroni dei moduli di sinapsi pesa, che nel lavoro reale

consentire un minor numero di tentativi di addestramento per ciascuna dimensione

reti neurali, o addirittura senza la necessità di effettuare una media statistica delle proprietà

diverse reti neurali della stessa dimensione per ottenere un quadro chiaro sui grafici

come quelli presentati in questo lavoro.

Come si può vedere dai grafici sperimentali, quando si sceglie la dimensione ottimale

una rete che si basa solo sul valore dell’errore di apprendimento non è sufficiente. non può essere identificato

il verificarsi della riqualificazione della rete neurale, quindi, confrontando il comportamento di diversi

Gli indicatori (come è stato fatto nei grafici sopra) consentono di fare di più

confermare ragionevolmente la scelta della dimensione della rete neurale o vedere il possibile

l’esistenza di problemi (ad esempio, l’inadeguatezza del modello a causa del verificarsi

riqualificazione). La possibilità di fare a meno del test su un campione lo consente

addestrare la rete neurale sull'intero set di esempi disponibili, senza dividerlo in

formazione e frammenti di test, e ci si aspetta che ciò accada con un aumento del numero di corsi di formazione

Ad esempio, diminuirà anche il rischio di riqualificazione della rete neurale.

3. Conclusione

Viene proposta una nuova versione della curva di apprendimento. dipendenza

modulo del peso della sinapsi nella rete in base alla dimensione della rete neurale. È stato dimostrato sperimentalmente che con

utilizzandolo, è possibile determinare in modo affidabile la dimensione ottimale della rete,

fornendo un minimo errore di generalizzazione. L'indicatore ti consente di farne a meno

il calcolo dell'errore di generalizzazione su un campione di prova indipendente consente variazioni

scegliendo una norma (modulo di peso, radice quadrata media,.) e tenendo conto

eterogeneità strutturale della rete per massimizzare le capacità predittive.

Inoltre, questo criterio può essere applicato nella formazione della crescita

reti neurali, come reti neurali di correlazione a cascata, inoltre, come nella fase di selezione

neurone candidato addestrato per l'inserimento nella rete neurale (insieme all'uso

valore della funzione obiettivo per questo neurone) e dopo aver inserito il valore selezionato

neurone alla rete e la correzione di quest'ultima (non l'unico neurone candidato selezionato

viene inserito nella rete neurale e vengono inseriti alcuni dei migliori neuroni possibili

ciascuno nella propria copia della rete neurale e già queste copie completate vengono confrontate

stesso sia dal valore della funzione obiettivo che dall’indicatore proposto).





superiore