Nelle sezioni di Biologia molecolare e Citogenetica sono attualmente in corso progetti incentrati sulla caratterizzazione genetico-molecolare di forme di 1) ritardo mentale e autismo 2) patologie neurodegenerative dell’eta’ pediatrica o giovane-adulta. La sezione di biologia computazionale si sta concentrando da alcuni anni sull’applicazione di approcci innovativi per analizzare i dati di variabilità genetica nell’uomo.
Nell’ambito della ricerca su patologie con ritardo mentale sindromico e autismo da alcuni anni si lavora specificatamente su una patologia genetica rara del neurosviluppo: la Sindrome di Phelan McDermid (PMS, MIM 606232) caratterizzata principalmente da ritardo psicomotorio, assenza/grave ritardo del linguaggio, basso tono muscolare e in alcuni casi epilessia e disturbi lungo lo spettro autistico L’associazione tra l’ interruzione del gene SHANK3 e il fenotipo della sindrome da delezione 22q13 (PMS) e’ stata individuata per la prima volta da Bonaglia e colleghi (Bonaglia et al. 2001), ed e’fortemente supportata dall’osservazione che tutti i casi analizzati mostrano una delezione completa o parziale di SHANK3che porta al classico fenotipo neurologico della sindrome (Bonaglia et al, 2006). Un piu’ recente contributo scientifico ha ampliato la comprensione dei meccanismi molecolari alla base della delezione 22q13, con conseguenti benefici in termini di diagnosi e consulenza alle famiglie (Bonaglia et al,2011). Inoltre e’ stata descritta per la prima volta la storia clinica di tre pazienti di oltre quarantanni, i quali avevano ricevuto la diagnosi di Sindrome di Phelan-McDermid in eta’adulta (Bonaglia et al,2011). Questi dati sono di estrema importanza perche’ insieme a pochissimi altri riportati nella letteratura scientifica, pongono le basi per studi volti a capire l’evoluzione della sindrome.
Ad oggi e’ chiaro che il fenotipo neurologico classico della sindrome e’ dovuto a una delezione completa o parziale di SHANK3 (Bonaglia et al, 2006), mentre sono sconosciute le causa che determinano l’estrema variabilita’ gravita’dei sintomi della sindrome, parzialmente imputabili alle dimensioni della delezione 22q13. Dal momento che l’aploinsufficienza di SHANK3 non e’ in grado di spiegare questo fenomeno, si ipotizza l’esistenza di fattori modificatori addizionali che potrebbero essere di tipo stocastico, ambientale o genetico. I fattori modificatori piu’ ovvi sono le mutazioni/ polimorfismi nell’allele non deleto di un gene nella regione 22q13.
E’ in corso, pertanto, uno studio su una cinquantina di pazienti affetti da PMS che, mediante nuove tecnologie di sequenziamento del genoma (next-generation sequencing), ha come obbiettivo di spiegare le basi della variabilita’ clinica tra i pazienti mediante l’identificazione di varianti clinicamente rilevanti in SHANK3, in altri geni in 22q13 e negli interattori di SHANK3.
Infine, nel 2012 e’ stata fondata l’Associazione di genitori di pazienti affetti da questa patologia (AISPHEM ONLUS) e si e’ dato avvio alla costituzione di una biobanca di campioni biologici per la stessa.
Una seconda linea di ricerca si occupa di malattie del motoneurone ad insorgenza precoce ed in particolare di paraparesi spastiche ereditarie e forme di SLA giovanile. Negli ultimi anni e’ stata raccolta un’ampia casistica di campioni di pazienti con paraparesi spastica ereditaria sui quali si e’ effettuata dapprima l’analisi di mutazione per la definizione del difetto genetico. L’identificazione di numerose mutazioni nei molteplici geni implicati in questo gruppo di patologie ha portato a diverse pubblicazioni in questo campo che permettono di definire l’epidemiologia di alcune delle forme piu’ comuni di paraparesi spastica. Nel contempo questi risultati hanno posto le basi per un successivo lavoro di caratterizzazione biochimico molecolare delle proteine mutate, nella maggior parte dei casi, poco conosciute. Studi sono stati condotti su alsina, spastina, paraplegina e piu’ recentemente su spastizina responsabili di forme dominanti e recessive o sporadiche di paraparesi spastica definendo gli effetti patogenetici di alcune delle mutazioni identificate. Gli studi condotti in modelli cellulari neuronali in vitro e su neuroni primari di topo hanno contribuito alla definizione del ruolo svolto da queste proteine nella crescita e/o sviluppo del neurone e del motoneurone. Studi analoghi sono stati condotti su una proteina coinvolta in forme motoneuronali complesse e in forme di SLA giovanile, la senataxina definendo il ruolo di questa proteina nella crescita del neurite ed il meccanismo attraverso cui questo ruolo si svolge.
Parallelamente, sono in corso da anni studi sull’emiplegia alternante, una patologia neurologica molto rara per la quale il laboratorio ospita la biobanca di materiale biologico dal 2004. Il lavoro e’ stato svolto in stretta collaborazione con l’Associazione italiana per l’emiplegia alternante (AISEA). In questo ambito il laboratorio ha partecipato ad uno studio internazionale per l’identificazione del gene responsabile della patologia (Heinzen EL et al., 2012). La disponibilita’ del test genetico, l’ampia casistica di pazienti raccolti nella biobanca, il collegamento della stessa con altre biobanche europee tramite un network europeo sull’emiplegia alternante il cui avvio e’ stato finanziato dalla comunita’ europea, nell’insieme hanno dato vita ad uno studio di correlazione genotipo-fenotipo, e alla generazione di modelli cellulari per lo studio dei meccanismi patogenetici coinvolti.
L’attivita’ della sezione di Biologia Computazionale si sta concentrando da alcuni anni sull’applicazione di approcci innovativi per analizzare i dati di variabilità genetica nell’uomo. Tali approcci prevedono l’utilizzo di strumenti di genetica di popolazione per identificare geni o regioni geniche che sono stati sottoposti a selezione naturale, partendo dal presupposto che le forze selettive agiscono su un locus specifico appunto perché tale locus contiene una variante polimorfica funzionale e che tali forze lasciano un “segno” che può essere utilizzato per identificare le varianti selezionate. E’ noto che, durante la storia evolutiva dell’uomo, pathways specifici fondamentali per la sopravvivenza sono stati soggetti a pressione selettiva, ed è per questo che abbiamo applicato le metodiche di genetica di popolazione a geni di interesse biomedico quali, ad esempio, geni coinvolti nella regolazione della pressione arteriosa, nel pathway della coagulazione e fibrinolisi, nella regolazione metabolica.
Abbiamo inoltre studiato i geni coinvolti nella risposta immune e nell’autoimmunità. Ricerche svolte presso il nostro laboratorio e presso altri Istituti hanno dimostrato che le malattie infettive hanno agito come una potente forza selettiva sul genoma umano. Conseguentemente, il pattern di variabilità genetica nell’uomo è determinato anche dalla esposizione agli agenti patogeni subita dalle popolazioni umane in diverse aree geografiche. Ci occupiamo, quindi, di identificare le varianti sottoposte a pressione selettiva mediata da patogeni e valutare se siano coinvolte nel determinare maggiore suscettibilità alle infezioni o a malattie autoimmuni.
Il laboratorio di Biologia Computazionale ha iniziato inoltre a mettere a punto una serie di strumenti per l’analisi dei dati prodotti da due sequenziatori NGS recentemente acquisiti. Sfruttando le competenze e gli strumenti messi a punto nel corso degli scorsi anni, è stato possibile implementare software di analisi particolarmente avanzati. Particolare cura è stata posta nella configurazione di una infrastruttura hardware/software in grado di garantire, oltre alla suddetta flessibilità nelle analisi, la possibilità di mettere a disposizione dei diversi gruppi strumenti accessibili attraverso interfacce web relativamente semplici nell’utilizzo e che non richiedano conoscenze informatiche troppo avanzate. L’idea è quella di costruire una sistema che possa integrare informazioni di diversa natura (database di annotazioni, dati clinici, software per l’analisi funzionale) per rispondere in modo il più possibile intuitivo ai quesiti posti da ogni esperimento. I software a disposizione consentono di analizzare i dati da diversi punti di vista: l’analisi dell’effetto di una variante su di un trascritto viene effettuata valutandone la sua posizione, l’effetto sul prodotto proteico, sullo splicing e sull’espressione. Ciascuna di queste tipologie di analisi richiede l’accesso a database di annotazioni, motivi regolatori, fattori di trascrizione, nonché’ l’impiego di software specifici. Per un impiego efficace è necessario dunque avere a disposizione un sistema informatico in grado di correre diversi software contemporaneamente, garantendo l’accesso alle fonti di dati e integrando poi i risultati in tabelle di semplice lettura e consultazione. I progetti di ricerca del nostro laboratorio, quasi sempre di natura genome-wide, ci hanno consentito non solo di studiare algoritmi specifici per i diversi aspetti di queste analisi ma anche di sviluppare il software proprio tenendo conto di queste esigenze di flessibilità e integrazione. In particolare la libreria GeCo++, che è stata sviluppata nel nostro laboratorio come supporto a progetti di ricerca genome-wide, ha trovato una efficace applicazione nei problemi posti dal sequenziamento NGS e, in particolare dall’analisi terziaria dei risultati. In altre parole l’aver pensato in termini genome wide fin dal momento della prima versione del genoma umano, ci consente ora di affrontare le problematiche NGS in modo efficiente sia in termini di tempi di realizzazione degli strumenti di analisi che di risorse necessarie.