Posts Tagged ‘Biologia molecolare’

Gene, un secolo e mezzo di storia e problematiche

mercoledì, agosto 11th, 2010

Nel post precedente ho accennato a come la definizione che noi abbiamo di gene sia stata più volte modificata e rivoluzionata nel tempo. Volevo dedicare questo articolo alla storia del gene, alla sua scoperta e all’evoluzione del concetto che noi abbiamo di esso fino ai nostri giorni.
Nel 2003, il National Human Genome Research Institute ha iniziato un progetto volto a definire ed identificare ogni elemento funzionale presente nel nostro genoma. I risultati sono stati pubblicati su Nature in un articolo di 18 pagine dal titolo “Identification and analysis of functional elements in 1% of the Human Genome by the ENCODE pilot project”.
Ma prima, volevo tornare indietro nel tempo. Fino a quando? Fino alla seconda metà dell’800, quando due grandi lavori, indipendenti l’uno dall’altro, ipotizzarono l’esistenza di fattori che determinavano i caratteri di un individuo (oggi diremmo il fenotipo) e che questi erano ereditabili di generazione in generazione con delle modalità in parte prevedibili. Questi fattori erano discreti. Ovviamente sto parlando dei lavori di Mendel prima e Darwin poi. Questi lavori sono stati fatti con un’ottica completamente diversa: il lavoro di Mendel era un lavoro da genetista, quello di Darwin è ovviamente un lavoro sull’evoluzione. Non si sapeva ancora nulla sulla natura di questi fattori, e nulla si sarebbe saputo per molti anni ancora.
Sempre in questa metà di secolo, attorno al 1880 un biologo tedesco, Walther Flemming, scoprì i cromosomi (corpi colorati) come entità che si trasmettevano dalla cellula madre alle cellule figlie in egual numero. Sempre in questi anni vennero effettuati anche studi sulla fecondazione e sulla meiosi.
Ma ancora nulla si sapeva delle unità ereditabili, né si sapeva dove fossero né di cosa fossero costituite. Nel 1903 il biologo americano Walter Sutton ipotizzò che fossero i cromosomi i portatori fisici delle unità ereditarie e che questi caratteri ereditari esistono in coppie, così come in coppie esistono i cromosomi.
Pochi anni dopo il grande genetista americano Morgan spiegò il fenomeno della ricombinazione genetica e spiegò in questo modo i meccanismi dell’ereditarietà. Non solo, in base alla frequenza di ricombinazione riuscì anche a disegnare una mappa genetica, fissando in questo modo all’interno dei cromosomi i geni. Fino allora i geni, iniziavano già a chiamarsi così, erano stati piuttosto astratti, nessuno ne aveva mai visto uno, si sapeva che esistevano ma nulla di più. Morgan diede loro una posizione specifica e misurò anche le distanze tra un gene e l’altro (di questo ho parlato nell’articolo “Knock out”, nella parte scritta in corsivo; se vi interessa potete andarvela a leggere). Questa posizione venne chiamata Locus. I geni quindi esistevano, erano localizzati sui cromosomi in posizione fisse e venivano ereditati da una generazione all’altra. Ma ancora molto doveva essere scoperto. Tanto per cominciare erano davvero i geni a trasportare l’informazione? Sembrava di sì, ma mancava la prova fondamentale. Come erano organizzati questi geni? Qual’era la loro natura?
Quando si andò ad analizzare la natura dei cromosomi si scoprì che erano costituiti da due componenti, una chiamata nucleina e l’altra erano le proteine. La composizione della nucleina era innanzitutto di natura acida, e poi aveva una struttura decisamente molto più semplice rispetto alle proteine. Da qui nacque una disputa durata diversi decenni che vedeva contrapposti chi credeva che fosse la nucleina la responsabile della trasmissione ereditaria dei caratteri e chi invece le proteine. Questa disputa finì nel 1944 quando l’americano Avery, in uno degli esperimenti più importanti della biologia molecolare, dimostrò che era la nucleina la sostanza portatrice dell’informazione, in quanto, se estratta da batteri patogeni, era la sola in grado di “trasformare” dei batteri non patogeni in patogeni, anche a bassissime concentrazioni. Stranamente i risultati di Avery non destarono lo scalpore che ci si sarebbe atteso.
Sempre negli anni quaranta del secolo scorso nacque la famosa idea che ciascun gene dia origine ad uno specifico enzima.
Infine, negli anni 50 venne finalmente scoperta la struttura molecolare della nucleina, o DNA, da esperimenti sulla diffrazione di raggi X dagli arcinoti Watson e Crick.
Ora si avevano in mano importanti informazioni: I geni sono delle unità discrete costituite di DNA e localizzate in posizioni fisse sui cromosomi. Sono i responsabili della trasmissione ereditaria dei caratteri e ciascuno di loro contiene l’informazione per costruire una proteina.
Si iniziò a studiare il codice genetico, come cioè dal linguaggio dei quattro nucleotidi A, T, C e G si potesse arrivare al linguaggio delle proteine, costituite di amminoacidi. Si scoprì inoltre che tra il DNA e la proteina c’era un intermediario, l’RNA messaggero. Sono gli anni 60, gli anni del dogma centrale della biologia molecolare che enunciava che l’informazione passava dal DNA, all’RNA e quindi alle proteine. Attraverso un sistema di codifica ben determinato. Questo dogma ebbe vita breve con la scoperta dei retrovirus.
La definizione “un gene una proteina” però iniziava ad andare stretta già in quegli anni, perchè alcuni geni davano origine a degli RNA che però non venivano tradotti in proteine, ma davano origine ai ribosomi e agli RNA transfer.
Negli anni settanta si iniziò a scoprire come i geni erano organizzati e come venivano espressi e letti. Si iniziò quindi a definire gene una sequenza funzionale compresa tra un codone di inizio ed uno di fine. Una cosiddetta ORF, una open reading frame. Il concetto di open reading frame si basa sul fatto che i geni vengono letti a gruppi di tre nucleotidi, o codoni, ciascuno dei quali codifica per un amminoacido. Perciò una sequenza:

CATGCCAATTAGCTAA

Può essere letta: CAT-GCC-AAT-TAG-CTA-A… oppure ..C-ATG-CCA-ATT-AGC-TAA , oppure ancora: ..CA-TGC-CAA-TTA-GCT-AA.. Ci si ferma qua perchè slittando di un altro nucleotide ancora si finisce nel primo caso.
Siccome la seconda lettura possiede un ATG e un TAA che sono rispettivamente il codone di inizio e uno dei codoni di fine, molto probabilmente è la lettura giusta. Da notare che non ci sono solo questi tre modi per leggere una sequenza, ma ci sono anche i rispettivi per leggere la sequenza complementare. Per questo si dice che una sequenza si può leggere in sei modi diversi.
Contemporaneamente si sviluppavano degli algoritmi per predire se una sequenza potesse essere o meno una ORF. L’inizio della bioinformatica.
La definizione di gene dovette essere ancora cambiata in seguito alla scoperta degli esoni e degli introni e dello splicing alternativo (leggersi l’inizio dell’articolo precedente). La ORF non era più continua, ma interrotta dagli introni e inoltre poteva dare origine a proteine diverse. Diciamo che si potrebbe dire un gene molte proteine. Ma comunque sarebbe scorretto, perchè per proteina si intende un prodotto funzionale, mentre spesso i geni codificano per delle subunità di una proteina, che da sole non hanno alcuna funzione. Quindi si potrebbe correggere con un gene (o ORF) codifica una serie di prodotti funzionali, proteine o RNA. Una definzione di gene che tenga conto di questa realtà è “un locus di esoni cotrascritti”
Veniamo ai giorni nostri. Attualmente si tende a definire un gene in base alla sua sequenza. una definizione potrebbe essere, in lingua originale  “a locatable region of genomic sequence, corresponding to a unit of inheritance, which is associated with regulatory regions, transcribed regions and/or other functional sequence regions” Traducibile con “una regione localizzabile della sequenza genomica, corrispondente ad un’unità ereditaria che è associata a regioni regolatrici, a regioni trascrivibili e/o altre sequenze funzionali” (Pearson 2006).
Con questa definizione tuttavia si hanno dei problemi. Infatti, sebbene nessuna definizione prima d’ora enunciata parlasse delle sequenze regolatrici, includerle nella definizione potrebbe essere problematico, visto che molte sequenze regolatrici sono estremamente distanti dalla regione codificante. In questo modo si avrebbe un’idea di gene “diluita” nel genoma e non compatta in un singolo locus.
Un altro problema che si fa avanti è la scoperta che in moltissimi casi i geni sono sovrapposti, dividono cioè la stessa sequenza di DNA, ma posseggono diverse reading frame.  Sono geni letti in maniera sfalsata, quindi.
Come vedete, non esiste una definizione di Gene che sia completamente senza problemi.
Ma veniamo, finalmente, al famoso ENCODE project, di cui parlavao all’inizio. Siamo finalmente arrivati alle ultime battute. Questo progetto aveva lo scopo di definire ed identificare ogni elemento funzionale presente nel nostro genoma. Cosa hanno ottenuto?
Innanzitutto, se per funzionale si intende che viene trascritto, una grande quantità di trascritti provenienti da regioni non identificate prima come geni è stata rivelata. Di questo problema mi sono occupato diffusamente nell’articolo “Dark Matter”, materia oscura, perchè di questo si tratta. Trascritti di cui non riusciamo a dare una spiegazione funzionale.
Inoltre, in contrasto con la definizione di gene come unità fisica definita nello spazio e separata dagli altri tende a cadere sia in base alla scoperta dei geni sovrapposti, sia perchè in questo modo si formano delle ampie regioni genomiche in cui sono raggruppati molti geni sovrapposti senza possibilità di definire una regione genica ed intergenica con sicurezza.
Insomma, sembra quasi che, ad un secolo e mezzo di distanza la definizione di Gene non possa più rispondere ai recenti (più o meno) sviluppi delle biologia molecolare. I ricercatori del ENCODE-project hanno provato a scendere a compromessi e hanno provato a definire un gene così:

“The gene is a union of genomic sequences encoding a coherent
set of potentially overlapping functional products.”

Il gene è un unione di sequenze genomiche codificanti un set coerente di prodotti funzionali potenzialmente sovrapposti.
Sembra una definizione abbastanza semplice, tuttosommato. Io mi aspettavo qualcosa di più complesso, ma sembra funzionare lo stesso. è Semplice, concisa e lineare. A volte le cose semplici sono le più corrette.
Vediamo se funziona:
-in caso di geni continui, la definizione si riduce alla classica definizione di gene che sappiamo: una sequenza di DNA che codifica per un prodotto funzionale, RNA o proteina.
-Per i geni discontinui e/o sovrapposti funziona, perchè è considerato come unione di sequenze codificanti che possono anche essere sovrapposte.
-Anche lo splicing alternativo sembra essere spiegato, in quanto parla di prodotti finali, quindi possono essere anche molteplici.
-Le regioni regolatrici non sono incluse nella definizione. Qui secondo me è stata una scelta. Se fossero state incluse però, avrebbero complicato ulteriormente la questione.

Riconosco che è una questione davvero complicata. Alcune cose non sono chiare nemmeno a me. Comunque la mia intenzione era quella di darvi un’idea di come le cose siano andate complicandosi sempre di più. Ma credo sia proprio questo il bello! alla prossima.

Per scrivere questo articolo mi sono basato in parte sul seguente articolo: “Mark B. Gerstein, Can Bruce, Joel S. Rozowsky, et al., What is a gene, post-ENCODE? History and updated definition, Genome Res, 2007 17: 669-681″

Splicing alternativo: come complicare qualcosa che è già complicato

martedì, agosto 10th, 2010

Uno degli annosi dilemmi della biologia molecolare, molti anni fa, era la correlazione tra complessità dell’organismo e dimensioni del genoma. Un organismo complesso, si pensava, doveva possedere un altissimo numero di geni, mentre un organismo meno complesso poteva accontentarsi di un numero di geni più modesto. Ovviamente, da bravi presuntuosi quali siamo, l’essere umano doveva averne, come minimo, un centinaio di migliaia. Non di meno.
La stima che venne eseguita, però, parlava di ben altre cifre: circa 25-30’000 geni. Se poi si andavano a guardare altri esseri viventi si scopriva che il moscerino della frutta ne possiede circa 15 mila e un vermiciattolo (il nematode C. elegans) circa 20 mila. Brutta storia. E’ chiaro che non si può tentare di spiegare la complessità con dei semplici numeri o con delle mere classifiche.

Alla fine degli anni settanta venne inoltre confutata la definizione di gene classica che la maggior parte di noi conosce “Un gene = Una proteina” con la scoperta dello splicing alternativo.
La scoperta dello splicing alternativo poteva essere una spiegazione alternativa alla complessità degli organismi. Cos’è lo splicing alternativo? E ancora prima, cos’è lo splicing?
La scoperta dei geni interrotti, negli eucarioti, è stato il primo passo per comprendere lo splicing. I geni degli eucarioti non sono costituiti da una sequenza codificante lineare e ininterrotta, dal codone di inizio a quello di stop. Sono costituiti da pezzi codificanti interrotti da pezzi non codificanti. I primi pezzi vengono chiamati esoni, i secondi introni. Quando il gene viene trascritto, viene trascritto tutto quanto esoni più introni. In media, nell’uomo, ogni gene è costituito da 9 esoni e 8 introni. Ma è soltanto una media. Il gene ErbB4, nell’uomo, ha 28 esoni, e non è neanche quello che ne ha di più.
Il trascritto così formato non può essere subito tradotto in proteina, per ovvi motivi: i ribosomi hanno bisogno di leggere una ORF (open reading frame, nota come cornice di lettura) continua, non saltellante. Per questo l’RNA messaggero appena formato viene subito processato. Il processamento o processing avviene sempre nel nucleo e consta di tre fasi: il Capping, la Poliadenilazione e lo Splicing.
Il capping consiste nell’aggiunta all’inizio dell’RNA (al 5′) di una 7-metil guanosina, ma non attraverso il solito legame 3′-5′, ma con l’insolito 5′-5′. Questo cap ha il compito di proteggere l’RNA dalla degradazione e di regolare il trasporto dello stesso fuori dal nucleo per la traduzione.
Funzione simile ha la poliadenilazione, ovvero l’aggiunta di qualche centinaio di residui di adenosina alla fine del trascritto (3′).
Veniamo allo splicing. Questo processo consiste nel staccare selettivamente gli introni e unire conseguentemente gli esoni, formando così il trascritto maturo che potrà essere tradotto.

Il meccanismo dello splicing è estremamente complesso e non starò a parlarne, perché credo che per chi non studi espressamente biologia molecolare non sia interessante (se però, nonostante questi avvertimenti, vorrete saperne di più chiedete pure!). Quello che mi limiterò a dire è che possono esistere due forme di splicing, uno per così dire autonomo, ovvero che non necessita elementi esterni, ed uno guidato da un complesso macchinario formato da proteine ma soprattutto da RNA stesso, ovviamente non codificante. E’ questo uno dei casi in cui è l’RNA non le proteine ad avere un ruolo da catalizzatore. L’altro caso è ovviamente il ribosoma. Il ribosoma e lo spliceosoma (ovvero il macchinario che catalizza lo splicing, sì lo so che è una parola orribile) possono essere delle vestigia del cosiddetto RNA world, precedente alla comparsa del DNA.
La domanda che vi potete essere posti è: come si riesce a distinguere un esone da un introne, e soprattutto come si riesce ad individuare correttamente la fine di un esone e l’inizio di un introne. Non è così semplice. Innanzitutto, studi comparativi (ovvero che prendevano in esame un gran numero di sequenze) hanno tracciato dei profili più o meno conservati di giunzione esone-introne. Ovvero di quella manciata di nucleotidi a cavallo tra la fine di un esone e l’inizio di un introne e viceversa.

La figura evidenzia un sito di splicing al 5′ e un altro al 3′ dell’introne, entrambi sono fondamentali per il distacco dell’introne e la congiunzione degli esoni.
Vi potrete chiedere se questa sequenza sia fissa ed immutabile per tutti i geni. Il diagramma che vi metterò ora vi darà la risposta:

Come si interpreta? Le dimensioni delle lettere sono proporzionali alla loro frequenza, quindi, ad esempio, nella posizione 7 dell’introne (il settimo nucleotide dall’inizio dell’introne) tutti i nucleotidi sono equivalenti, questo ci fa presupporre che non sia una posizione utile allo splicing, mentre nella posizione -1, 1 e 2 abbiamo quasi esclusivamente GGT. Questi devono essere i nucleotidi più importanti perché più conservati. Seguiti dalla A in -2 e in 3 e 4 e dalla G in 5. Sembra strano che così pochi nucleotidi bastino a garantire la specificità richiesta.
Abbiamo altre sequenze però, come il tratto di polipirimidine (py tract) e il punto di ramificazione. Numerose malattie genetiche e tumori sono dovuti a difetti nello splicing, si stima che siano circa il 15%.
Ma veniamo ora allo splicing alternativo. E’ questo un fenomeno molto interessante e consiste nella possibilità per un gran numero di geni di dare origine a diversi prodotti, o isoforme, alcune correlate funzionalmente tra loro, altre invece completamente diverse. Lo splicing alternativo non è un eccezione, è la regola. Si stima che più del 70% dei geni nell’uomo vada incontro a questo fenomeno (ci sono stime diverse, ovviamente in base alle tecniche utilizzate per ottenerle). Come è possibile arrivare a questo? Il modo più comune, forse, è quello di eliminare uno o più esoni dal trascritto primario, generando così un’isoforma più corta; oppure trattenendo un introne tra due esoni, anziché eliminarlo; o anche, grazie alla presenza di siti di splicing alternativi, la formazione di esoni/introni di diversa lunghezza. Normalmente distinguiamo esoni e introni costitutivi e sono esoni e introni sempre presenti/assenti nel trascritto maturo. Esistono poi i cosiddetti esoni/introni opzionali che possono o meno venire inclusi. Inoltre ci sono dei casi in cui la presenza nel trascritto maturo di un esone implica necessariamente l’assenza di un altro esone, in questo caso parliamo di esoni mutualmente esclusivi. Questo ovviamente può generare una varietà enorme di trascritti. Ci sono geni anche con decine di varianti diverse, ciascuna delle quali darà origine a proteine diverse. Quindi non solo il concetto del gene è stravolto (e venne stravolto molte volte ancora, per gli interessati ho da consigliare un ottimo articolo sull’evoluzione del concetto di gene negli anni) ma anche si riuscì a capire come da un numero relativamente modesto di geni si generasse una varietà così grande di proteine. La domanda da farsi ora è: cosa decide se un esone/introne debba essere incluso o meno? E’ un discorso estremamente complesso che vede in gioco un numero molto alto di fattori. Cercherò di semplificarlo al meglio.
Ci sono all’interno degli esoni e degli introni delle sequenze, anche molto lunghe, che vengono distinte in due classi: gli splicing-enhancers (SE) e gli splicing-silencers (SS). Queste sequenze giocano un ruolo fondamentale. Vengono riconosciute da numerose proteine (delle RBPs, RNA-binding-proteins) le quali possono influenzare lo splicing. In che modo? Vediamolo.
Le sequenze SE possono essere introniche od esoniche; a queste sequenze si legano delle proteine appartenenti alla famiglia SR (serin-rich, ricche di serina, un amminoacido), a loro volta queste proteine reclutano sul trascritto immaturo i componenti dello spliceosoma (il macchinario che catalizza lo splicing). Lo spliceosoma riconosce i siti di splicing 5′ e 3′ (vedere la figura due), in questo modo lo splicing può avvenire attraverso l’eliminazione dell’introne e la congiunzione degli esoni, secondo lo schema classico. Se in un trascritto immaturo funzionassero soltanto le sequenze SE, per forza di cose tutti gli esoni sarebbero tenuti e tutti gli introni eliminati.
Per far sì che ci possa essere lo splicing alternativo, ci sono anche le SS. Queste sequenze legano alte proteine, le quali coprono fisicamente sia le SE sia i siti di splicing 5′ e 3′ , in questo modo lo spliceosoma non può legarsi. Questo cosa comporta? Semplicemente che l’esone nel quale le SS sono attive, non verrà riconosciuto dallo spliceosoma, il quale si legherà alle sequenze di splicing più vicine a monte e a valle dell’esone; la regione compresa tra queste due sequenze, quindi con l’esone compreso verrà trattata come se fosse un introne e verrà eliminato dal trascritto.
Il tutto si gioca sull’equilibrio tra SS e SE e sulle proteine che legano queste sequenze. In base alla prevalenza di una famiglia di proteine sull’altra si avrà la ritenzione o l’eliminazione dell’esone. In questo quadro, potrebbe essere influente anche la velocità alla quale il trascritto viene sintetizzato dall’RNA polimerasi, perchè in questo modo alcune sequenze potranno essere disponibili con tempi diversi e potranno competere tra di loro.

Da quanto detto se ne deduce che:

*Un esone può venire incluso o escluso dal trascritto maturo in base all’equilibrio SE-SS.
*Due esoni mutualmente esclusivi saranno regolati in base alle competizione tra le loro sequenze e i loro siti di splicing. Supponiamo di avere un esone A e un esone B, ciscuno con le sue SE e SS. Nel caso degli esoni mutualmente esclusivi, le sequenze dell’uno “influenzano” il destino dell’altro. Per cui, ad esempio, se l’esone A riesce a legare più proteine di B sulle sue ES, esclude l’esone B, e viceversa. Ovviamente prendete con le pinze il “riesce”, non è una gara, è soltanto una questione di equilibrio.
Lo splicing alternativo è, come dicevo, molto diffuso. Una cosa che è importante sapere è che è anche tessuto-specifico. Questo significa che tessuti diversi esprimono isoforme diverse dello stesso gene attraverso splicing alternativi.  Infatti l’analisi dello splicing in diversi tessuti permette di stabilirne l’origine. Come è possibile manatenere splicing diversi in tessuti diversi? Molto spesso è dovuto all’espressione di fattori di splicjng diversi da tessuto a tessuto e questo determina eventi di splicing specifici. Il sistema nervoso è forse il tessuto che presenta il più alto grado di splicing alternativo tessuto specifico. Anche all’interno dello stesso sistema nervoso ci sono aree con diversi pattern di splicing.

Voglio concludere questo papiro con un esempio estremo di splicing alternativo. Questa volta non sarà l’essere umano ‘esempio, ma il nostro amico Drosophila.  Il moscerino, durante lo sviluppo del suo sistema nervoso esprime una proteina chiamata “Dscam”. Questa proteina, espressa sui neuroni in via di sviluppo, è un recettore appartenente alla famiglia CAM (cell-adhesion-molecules), è quindi una proteina che media l’adesione cellula-cellula. Il gene di questa proteina è forse il più complesso gene che si sia mai visto, avendo ben 38016 varianti di splicing, solo lui. Se la drosophila ha circa 15 mila geni, solo dscam ha più varianti che tutti i suoi geni messi assieme. Questo perchè il gene in questione ha tre esoni, il 4, il 6 e il 9 che hanno rispettivamente 12, 48 e 33 varianti mutualmente esclusive, quindi soltanto una variante per esone è mantenuta nel trascritto maturo. Non ho fatto il calcolo combinatoriale, per cui non so dirvi se vengono effettivamente 38 mila e passa varianti, ma confido che chi l’ha fatto l’abbia fatto giusto.  Spaventoso, vero? Non solo spaventoso, direi anche meraviglioso. Alla faccia di chi crede che solo l’uomo e i mammiferi sono degni di essere studiati. Ciascun neurone esprime una sola variante di splicing, e questo è necessario per mantenere l’identità neuronale stessa. Non credo che esistano due neuroni con la stessa isoforma Dscam. Non è ancora chiaro se la scelta venga fatta casualmente.

Spero di essere stato interessante, nonostante la lunghezza dell’articolo. come sempre se avete domande fatele! se desiderate saperne di più chiedete, posso consigliarvi numerosi articoli. Se notate errori, per favore, fatemelo sapere nei commenti. Alla prossima e Buone vacanze!


Imprinting!

domenica, marzo 7th, 2010

Nonostante il titolo, non dovreste lasciarvi ingannare oramai, perchè dovreste sapere dove vado a parare di solito. Questo non è un post di etologia, ma di biologia molecolare e genetica.
Fino a qualche anno da si riteneva che in un organismo le due metà del patrimonio genetico derivanti dai due genitori contribuissero egualmente, ma si è scoperto che non è così. Per un gruppo di geni fare parte della linea materna o paterna è di fondamentale importanza per la sua futura attività.
L’imprinting è un termine che comunque è stato mutuato dall’etologia e indica proprio questo aspetto: un piccolo insieme di geni sono espressi esclusivamente dalla linea materna o dalla linea paterna e mai dall’altra. Non è incredibile? Questo fenomeno non è casuale, nel senso che geni che hanno un imprinting materno (che sono cioè espressi soltanto dall’allele di derivazione materna) conservano lo stesso imprinting in tutti gli organismi della stessa specie e probabilmente anche nelle specie affini. Molti dei geni “imprinted” nell’uomo, ad esempio, hanno lo stesso imprinting anche nel topo! In generale il fenomeno dell’imprintig è abbastanza conservato in tutti i mammiferi, ma è stato osservato ovunque negli eucarioti.
Non so se riusciate a comprendere la portata del fenomeno. Come diavolo possono essere distinti i geni in base linea parentale di appartenenza? Come è possibile che sempre lo stesso allele venga espresso? Sembra ovvio che non può essere questione di diversità di sequenza, perchè gli alleli sono in teoria identici.
Quindi ci deve essere qualcos’altro all’origine di questo strano fenomeno che viene trasmesso di generazione in generazione. Ci deve essere un modo per marcare il DNA in modo da poter identificare i geni in questione e soprattutto questa marcatura deve essere trasmessa di generazione in generazione.
A questo punto devo introdurre un concetto abbastanza complicato e che se anche all’inizio sembrerà che non c’entri nulla con quanto ho appena detto, in realtà è un passaggio fondamentale.
Tutti conosciamo il codice genetico, ma pochi conoscono il codice epigenetico. Il termine epigenetica indica un insieme di fenomeni che in qualche modo “stanno sopra” la genetica. Cosa vuol dire stare sopra? Non che sia più importante, ma soltanto che mentre il codice genetico si basa sulle sequenze nucleotidiche, le quali codificano informazioni ben precise come ben sappiamo, il codice epigenetico è un codice che non si basa sulle sequenze ma su altri elementi che adesso in breve spiegherò.
Questi elementi possono essere a carico del DNA stesso, come la metilazione (aggiunta di un gruppo -CH3) su entrambi i filamenti delle citosine in contesto CG; oppure possono essere a carico di una famiglia di proteine che interagiscono direttamente e fisicamente con il DNA e influenzano in modo determinante la trascrizione ed altri processi: gli istoni.
Cerco di spiegarmi meglio; il codice epigenetico è una sorta di linguaggio (come il codice genetico) e porta informazioni ben precise e fondamentali per lo sviluppo e la corretta funzione di una cellula. Questo linguaggio è costituito da un “alafabeto” che consiste principalmente in metilazione delle citosine in 5-metil-citosina quando le C sono precedute e/o seguite da una G. Questa metilazione avviene su entrambi i filamenti ad opera di una famiglia di enzimi chiamati DNMT (DNA-metil-transferasi). La metilazione sembra una modificazione insignificante, ma in realtà influenza pesantemente la struttura e la funzione del DNA.Diverse proteine si legano alle sequenze metilate e fanno in modo che il DNA assuma una conformazione densa e compatta e pressochè inattiva (eterocromatina). La metilazione non è l’unico elemento epigenetico, ma è l’unico ad interessare direttamente il DNA. Le altre modificazioni interessano delle proteine che sono strettamente associate al DNA gli istoni. Gli istoni sono le proteine che più frequentemente troviamo associate al DNA, il quale si avvolge letteralmente sopra. A seconda di come sono modificati gli istoni, il DNA può essere rilassato e attivo, oppure compatto ed inattivo. Però cosa si intende per compatto e per rilassato? Il DNA è approssimativamente un filo, quando è ripiegato tante volte su se stesso ed associato molto strettamente agli istoni allora è compatto; quando si trova in questo stato il DNA è inattivo perchè le proteine che sono necessarie alla trascrizione non riescono a legarsi all DNA stesso. Se invece il DNA è lineare è attivo perchè non ci sono ostacoli alla trascrizione.
Concentriamoci sulla metilazione delle citosine. Questa è l’unica modificazione che viene trasmessa e mantenuta da una cellula all’altra durante la divisione, ed è la responsabile della memoria cellulare! Cosa vuol dire? Vi siete mai chiesti come faccia una cellula già differenziata rimanere tale dopo la divisione cellulare? Come fa una cellula a sapere da che cellula deriva? Ricordatevi che una cellula quando si divide, replica e condensa tutti i cromosomi e li divide equamente tra le cellule figlie; queste ultime, una volta separate, decondensano i cromosomi e pertanto potrebbero in teoria decondensare ed attivare anche regioni che normalmente non dovrebbero essere attive in una cellula di quel tipo e diventare altre cellule. Come fanno a sapere cosa attivare e cosa no? Ok, mi direte voi, dal contesto e dal tessuto in cui si trova (se si trova in mezzo a epatociti diventerà epatocita); non è errata come risposta, ma non è sufficiente. E’ la metilazione che guida la memoria cellulare. Regioni metilate ed inattive nella cellula madre, saranno tenute metilate anche nelle cellule figlie, ad opera delle DNMT. Una cellula replica il suo DNA in maniera semiconservativa, pertanto le due copie di DNA che si formano avranno un filamento “vecchio” della cellula madre ed il complementare è invece appena sintetizzato. Pertanto le cellule figlie avranno soltanto un filamento di DNA che continua ad essere metilato,  quello della madre, mentre il complementare no! le DNMT riconoscono lecitosine in contesto CG metilate solo su un filamento e le metilano anche nel filamento complementare, mantenendo così intantta la meoria cellulare. Interessante non è vero???
Ok, spero di non avervi confuso le idee con questa digressione. Spero non abbiate perso il punto principale, ovvero l’imprinting. Ci eravamo chiesti quale “marcatura” potesse essere in grado di differenziare un allele dall’altro e che fosse in grado di trasmettersi lungo le generazioni. Come avrete già capito, questa marcatura è proprio la metilazione delle citosine. A questo punto si apre un problema. E’ noto che durante lo sviluppo embrionale sono le cellule staminali embrionali che danno origine all’individuo. Le cellule staminali embrionali (CSE) sono dedifferenziate e possono dare origine a qualsiasi cellula. Questo è possibile perchè il DNA dello zigote non appena c’è stata la fecondazione va incontro ad un ampio riarrangiamento e viene praticamente “demetilato” per cancellare la memoria cellulare e dare origine alle CSE. A questo seguirà una ondata di metilazione “de novo” che permetterà alle cellule di differenziarsi man mano che procede lo sviluppo. Non si conoscono ancora bene i meccanismi di questa nuova ondata di metilazione, però sta di fatto che se le metilazioni originali vanno perdute, come si fa a ristabilire l’imprinting nel modo corretto? Questo è possibile perchè non tutte le metilazioni vanno perdute, e tra le metilazioni che rimangono, ci sono quelle che regolano l’imprinting e pertanto questo viene conservato durante le generazioni.
Ora che abbiamo capito la logica che ci sta dietro, vediamo come sono regolati questi “imprinted genes”.  E’ stato notato che c’è una regione di DNA che può anche essere condivisa da più geni che può essere metilata o non metilata. Questa regione che può anche essere molto lunga è chiamata ICR (imprinted control region). E’ questa regione che è differentemente marcata tra le due linee parentali. Se è metilata su una linea non è metilata nell’altra. Solitamente le regioni metilate sono inattive, quindi la ICR metilata sarà un segnale di silenziamento genico.  Il discorso è però più complicato, perchè esistono due tipi di ICRs, ma non mi sembra il caso di addentrarmi ulteriormente.. mi sembra di aver messo già troppa carne al fuoco.

Spero di essere stato chiaro e non confusionario. spero di aver reso l’idea di quello che volevo dire! Se avete domande ovviamente siete caldissimamente invitate a farle. Così pure se volete semplicemente commentare o criticare!

Confini e Territori

giovedì, febbraio 18th, 2010

Molto spesso nei libri di testo di biologia molecolare si trova pochissimo spazio dedicato a fenomeni che mi sembrano di grandissima rilevanza nella comprensione di molti processi. Probabilmente questo è dovuto al fatto che sovente non si hanno sufficienti informazioni, oppure se ce ne sono appaiono contraddittorie.
In questo piccolo intervento volevo parlare di una cosa secondo me di un interesse sconvolgente: l’organizzazione tridimensionale del genoma. Detto così non mi sembra di essere stato molto chiaro; cercherò di rifarmi qui di seguito.
Probabilmente molti di voi sono a conoscenza del fatto che la più grande unità organizzativa del genoma, eucariotico per lo più, è il cromosoma. Negli eucarioti ciascun cromosoma occupa un particolare volume nel nucleo cellulare chiamato territorio cromosomale e quel che più importa questo territorio, nel nucleo di una cellula in interfase, non è casuale.
Diversi lavori, tra cui uno in particolare a cui mi sto riferendo, hanno dimostrato che i diversi cromosomi di topo hanno un posizionamento tessuto-specifico all’interno del nucleo cellulare, con i cromosomi particolarmente ricchi di geni disposti verso il centro e quelli poveri di geni verso la periferia. Solitamente, inoltre, la maggior parte dei cromosomi disposti in periferia, erano per la maggior parte condensati in eterocromatina (e quindi trascrizionalmente inattivi).
La disposizione specifica dei cromosomi ha ancora degli aspetti poco chiari. Funzionalmente sembrerebbe servire per ottimizzare la regolazione dell’espressione genica, facendo in modo che geni che devono essere trascritti simultaneamente si trovino nella stessa area, aumentando così le probabilità che la trascrizione non solo avvenga, ma anche nei tempi corretti. Questo perché i geni trascritti intensamente si localizzano nelle cosiddette “fabbriche di trascrizione” (trascriptional factories suona meglio) che sono zone in cui la concentrazione di RNA polimerasi II e di fattori di trascrizione è particolarmente alta. Queste factories sembrano essere meno dei geni attivamente trascritti, pertanto è utile alla cellula localizzare tutti i geni utili in queste zone.
L’aspetto veramente interessante secondo me viene adesso: diversi geni, ma sarebbe più appropriato dire diversi loci, possono in qualche modo allontanarsi dal territorio del cromosoma di appartenenza, pur facendone ancora parte! Non so se sono stato chiaro; immaginate di avere dei gomitoli (supponendo che ciascun gomitolo sia fatto da un unico filo molto lungo e altamente convoluto) posizionati e fissi: questi sono i nostri cromosomi; ora prendete un ansa di filo di un gomitolo e tiratela in modo da farla districare dal resto per avere un loop fisicamente distante dal gomitolo di appartenenza, ma senza che ne sia staccato.
Quindi i cromosomi non solo non sono più entità fisse e statiche, ma i loro territori e i loro confini non sono più così netti come si pensava!
Alcuni cluster di loci, dove per cluster si intende gruppo, pur trovandosi su cromosomi differenti, riescono ad allontanarsi dal territorio di appartenenza, avvicinarsi, ed essere trascritti insieme, soprattutto se sono geni la cui funzione è correlata. Inoltre, che questo evento, di cui ci sono ancora diversi lati oscuri, sia almeno in parte correlato all’attivazione/repressione trascrizionale sembra essere dimostrato dal fatto che, inibendo la RNA polimerasi II, diminuisce significativamente.
Un fenomeno molto interessante che si è osservato, inoltre, riguarda il cromosoma X inattivato. Forse alcuni di voi sapranno che in cellule in cui è presente più di un cromosma X, (quindi negli esseri umani esclusivamente nelle femmine), solo uno di questi è attivo, mentre l’altro (o gli altri) è inattivato in maniera pressochè irreversibile. L’inattivazione del cromosoma X in più avviene attraverso una condensazione del DNA molto accentuata (eterocromatina); questa condensazione fa sì che i geni in questione non vengano trascritti. Quello che si è notato è che alcuni loci del cromosoma X inattivato sfuggono a questa condensazione proprio perché “scappano” dal territorio cromosomale. In questo modo evitano il silenziamento e sono belli attivi. Questo porta a dire due cose: la prima è che i geni, i loci in generale, non sono fissi, si muovono, si spostano all’interno del nucleo (pur rimanendo sempre al loro posto nel cromosoma); se questo movimento sia attivo o passivo non si sa. Al momento ignoro anche se sono stati scoperti dei “motori molecolari” che eseguono questo spostamento.
La seconda cosa, forse ancora più importante è che spesso si tende ad ignorare una cosa in biologia: il contesto spazio/temporale. Gli eventi, i processi che si svolgono sono influenzati sia dal tempo (nel senso che un evento non ha le stesse probabilità di avvenire in ogni istante, ma avrà dei momenti in cui le probabilità saranno maggiori o minori) che dallo spazio: in questo caso abbiamo visto come l’attivazione dei geni sia dovuta al luogo ed al momento in cui si vengono a trovare. Questo sembra banale, però io personalmente non ho quasi mai visto sui testi un accenno a queste due variabili, che pure, voglio dire, sono di fondamentale importanza.

Come sempre, spero di non avervi annoiato. Scrivete commenti e se avete qualsiasi osservazione o critica da fare, fatela!

Al prossimo post (chissà, magari varierò un po’ ..)

Dark matter

martedì, febbraio 2nd, 2010

Sì.. lo so che sotto esami sarebbe meglio concentrarsi sullo studio, ma è più forte di me!

Il titolo di questo post è molto chiaro (o forse no?). Parliamo di materia oscura, ma non la materia oscura dell’universo.. di quella se ne occupano i fisici.. Ma parliamo della materia oscura del genoma. Interessante analogia. Questo, devo dirlo subito, non sarà un post in cui troverete spiegazioni, perchè spiegazioni al momento non ce ne sono, ma solo ipotesi. Questo post più che altro è fatto di domande.

Il genoma è una struttura molto complessa, il cui funzionamento non è del tutto chiaro. Direi anzi che sappiamo pochissimo su come funziona! Dai batteri fino a noi, il genoma ha subito un’evoluzione che l’ha portato, non solo ad ingrandirsi, ma anche ad incorporare sequenze dal significato per ora ignoto.

Qui trovate un elenco di alcuni organismi, dai lieviti fino a noi, ordinati secondo le dimensioni del genoma, espresse in megabasi Mb (1Mb= 10^6 basi).
Una tale differenza di dimesioni non è però linearmente proporzionale nè al numero di geni presenti, nè alla complessità dell’organismo.

E’ chiaro che c’è qualcosa che non va. Qualche calcolo che non torna.  Noi abbiamo circa 30 mila geni, un nematode 19000. un moscerino 13000. Per non parlare della densità genica. La densità genica del lievito è più di 40 volte la nostra.  Perchè questo? Perchè, come dicevo prima, il genoma nel corso dell’evoluzione ha acquisito moltissime sequenze non codificanti, dal significato ignoto, che fino a qualche anno fa veniva chiamato DNA spazzatura (Junk-DNA). Da cosa è composto questo DNA non codificante?

Sequenze regolatrici (promotori, enhancers), introni, sequenze altamente ripetute (satelliti, minisatelliti, microsatelliti), trasposoni (sequenze che si spostano all’interno del genoma), sequenze di origine virale e così via. Il tutto rende il DNA codificante appena l’1.5% di tutto il genoma!
Ci sono diverse teorie al riguardo. Secondo la teoria del gene egoista, questo sarebbe DNA parassita che sfrutta il DNA funzionante per propagarsi; secondo altri rappresenta un meccanismo di difesa: una mutazione ha molte più probabilità di generarsi in queste sequenze non codificanti, che nei geni.

Comunque si credeva che queste sequenze non solo non codificassero per proteine, ma che non venissero neppure trascritte. Del resto non aveva senso che fosse il contrario. La trascrizione è un meccanismo complessissimo, altamente regolato e soprattutto dispendioso dal punto di vista energetico. Non ha senso che vengano trascritte sequenze inutili.
Tuttavia, qualcosa ci deve essere sfuggito, perchè con le moderne tecniche di analisi del trascrittoma (tiling arrays, RNA-seq) si è scoperto proprio quello che non ci saremmo mai aspettati: molte sequenze di RNA si allineano perfettamente con sequenze genomiche non codificanti. Perchè mai, se è inutile, viene trascritto? Forse del tutto inutile non è. Forse abbiamo sbagliato noi, forse dovremmo evitare di chiamare inutile ogni cosa che non sappiamo cosa faccia.
E’ proprio questa la materia oscura a cui fa riferimento il titolo: sequenze di RNA trascritte non codificanti che aspettano ancora di essere classificate.
Ci sono delle ipotesi che tentano di inquadrare questo fenomeno, che ovviamente andranno verificate:

->Artefatti biologici: (per artefatto si intende comunemente errore) ovvero originano da una trascrizione non specifica e a bassa intensità del DNA, e siccome le il DNA non codificante è la maggior parte, la statistica la dice lunga.

->Geni non codificanti: Ci sono prove sperimentali che indicano che questa trascrizione inspiegata sia comunque in parte regolata, e questo suggerisce che i non-coding RNAs abbiano qualche funzione regolativa (del resto sono già noti alla comunità scientifica i micro-RNA e compagnia bella).

->Nuovi geni codificanti: Si ipotizza che ci possano essere dei geni ancora da scoprire e che questi vengano trascritti. Oppure possono essere degli pseudogeni che oramai hanno perso la loro funzione originaria.

Concludo con una nota. E’ normale che con le tecniche di analisi moderne e con il supporto della biologia computazionale le conoscenze che avevamo sul Genoma e sulla biologia in generale vangano stravolte. Semplicemente cambia il modo con cui vengono presi ed analizzati i dati e tutte le cose che prima davamo per certe ora vengono messe in discussione. In fondo tutti i dati che avevamo acquisito prima che le più moderne tecniche venissero messe a punto soffrivano di un grande difetto: il bias; tipico errore che si commette spesso quando si fanno esperimenti andando a cercare ciò che si vuole trovare, ignorando tutto il resto che magari non ci aspettiamo che ci sia e quindi non cerchiamo neppure. E’ normale che si trovassero solo trascritti di geni codificanti perchè non ci saremmo mai aspettati di trovare altro. Del resto le tecniche ancora non permettevano di fare altrimenti.

Se avete domande, suggerimenti, osservazioni critiche, insomma, se volete dire la vostra, non tiratevi indietro!

Induction of Pluripotent Stem Cells from Mouse Embryonic and Adult Fibroblast Cultures…

mercoledì, ottobre 21st, 2009

Rieccomi spuntare dall’oltretomba! sono qui per scrivere un post su un argomento che mi ha colpito, nonchè affascinato molto, e vorrei condividerlo con voi.

L’argomento riguarda, come potete dedurre dal titolo, le cellule staminali, e mi è venuto in mente leggendo questo articolo:

Induction of Pluripotent Stem Cells

Prima di inziare, illustrerò brevemente cosa sono. Le cellule staminali (stem cells in inglese) sono delle cellule che non hanno ancora intrapreso nessuna via di differenziamento cellulare e sono in grado di dare forma a tutti i tipi cellulari di un organismo, se messe in un opportuno contesto. Sono in grado di dividersi e di rinnovarsi continuamente. Sono famose le cellule staminali embrionali, ma forse non tutti sanno che esistono popolazioni di cellule staminali anche in organismi adulti. Le potenzialità della ricerca in questo campo sono immense.. e le applicazioni che ne potrebbero derivare lo sono ancora di più. Non bisogna comunque dimentica i dibattiti etici sull’argomento.

Pochi anni fa, nel 2006, si è dimostrato, e quell’articolo ne è la prova, che delle cellule staminali possono essere derivate da delle cellule non staminali, attraverso un processo di de-differenziamento. Una scoperta stratosferica, perchè si pensava che il processo fosse irreversibile, e che ha permesso anche di scoprire alcuni dei meccanismi molecolari che inducono e mantengono la totipotenza.
L’esperimento è stato condotto da un gruppo di ricerca giapponese, ed ha ricavato cellule totipotenti da fibroblasti di topo, andandando ad attivare alcuni geni. Adesso vediamo come hanno lavorato.
Avevano in coltura delle cellule di topo già differenziate, i fibroblasti. Hanno svolto una ricerca, soprattutto bibliografica, per individuare quali fossero i geni fino ad ora conosciuti che erano conivolti nella staminalità delle cellule. Secondo questa ricerca, 24 geni si sono rivelati essere particolarmente decisivi. Partendo dal presupposto che questi geni all’interno della cellula differenziata non venissero espressi, hanno pensato bene di reintrodurli tutti assieme attraverso una tecnica di knock-in, che assieme a quella del knock-out meriterebbe da sola un post che forse prima o poi scriverò. Quindi alla fine della fiera, in queste cellule sono stati inseriti artificialmente questi geni, di modo che venissero espressi. E magia, le cellule diventavano staminali. Il passo successivo è stato quello di andare a vedere quali di questi 24 geni fossero critici per il mantenimento della totipotenza, ed uno per volta sono andati ad eliminare questi geni, per vedere gli effetti (uno dei modi migliori per studiare il ruolo di una cosa è quello di eliminarla e vedere cosa succede). ben quattro geni su ventiquattro si sono rivelati essere critici: Oct3/4, Sox2, c-Myc and Klf4. Senza anche solo uno di questi infatti, le cellule non diventavano totipotenti.
Lo stesso esperimento è stato poi condotto nel 2007 su cellule umane ed ha condotto agli stessi risultati. Capite bene che questo, oltre ad essere un passo importante nella comprensione dei meccanismi molecolari e genetici della staminalità, apre le porte ad una caterva di future applicazioni anche mediche, senza andare a scomodare gli embrioni e senza che filosofi e teologi possano brontolare (perdonatemi la frecciatina).
Ovviamente molto deve essere ancora fatto, però i risultati sembrano essere incoraggianti.

Se avete domande, dubbi o precisazioni da fare, ovviamente scrivete tutto nei commenti!

Alla prossima!