Biologia molecolare

You are currently browsing articles tagged Biologia molecolare.

Di certo non parlo di un argomento nuovo od innovativo, ma state pur sicuri, e lo capirete leggendo l’articolo, che si tratta di un pilastro della biologia cellulare e molecolare in cui si continua a fare moltissima ricerca. È estremamente interessante, secondo me, anche per chi non studia direttamente queste cose ma ha comunque un interesse. Direi di procedere, anche perché è un argomento estremamente esteso quello dei recettori e dei loro ligandi.
Al giorno d’oggi, per comunicare con persone lontane da noi ci basta collegarci ad internet e connetterci a Skype o a Messenger, in questo modo le informazioni passano dal mittente al destinatario o ai destinatari ad una velocità elevatissima, linea ADSL permettendo. Possiamo anche però comunicare a voce, anche se ovviamente a distanze decisamente più ravvicinate. La nostra civiltà è basata sulle telecomunicazioni, pensate cosa accadrebbe se improvvisamente non potessimo più comunicare. Una catastrofe. Bene, Mutatis Mutandis possiamo fare le stesse considerazioni sugli organismi viventi, in particolar modo quelli pluricellulari. Perché non credo di sorprendervi quando vi dico che i sistemi cellulari tra loro comunicano. Bene cerchiamo di capire come e perché.La comunicazione è fondamentale in un organismo complesso; fondamentale perché serve per coordinare tutte le funzioni in modo da garantire l’omeostasi. Gli organismi animali hanno sviluppato diversi modi per rendere possibile questa comunicazione interna, questa sorta di Intranet. E’ nota a tutti, ad esempio, la comunicazione nervosa, su cui non intendo tanto soffermarmi, ma che merita due parole. La comunicazione nervosa è una comunicazione a metà strada tra la comunicazione a distanza e quella ravvicinata. È a distanza perché molto spesso riguarda elementi posti a grande distanza tra di loro, ad esempio il neurone motore il cui corpo cellulare è situato nel midollo spinale e la fibra muscolare del dito mignolo della mano sinistra. Ma è anche ravvicinata perché la cellula nervosa raggiunge tramite l’assone il suo obiettivo. E’ una comunicazione che si esplica in due fasi, una prima fase in cui viene generato un impulso nervoso, ovvero un segnale elettrico, che viaggia lungo l’assone ad una data velocità, che dipenderà dal diametro dell’assone e dalla sua mielinizzazione, e da una fase chimica in cui viene rilasciato il neurotrasmettitore (acetilcolina in questo caso). E’ proprio in questa fase che l’informazione passa dal mittente al destinatario, il quale deve essere in grado di riceverla, elaborarla e comportarsi di conseguenza. Chiedo scusa sin da ora se in queste mie parole sembra esserci un certo intenzionalismo. Non è così. Ovviamente stiamo parlando di elementi privi di coscienza che fanno tutto automaticamente. La fibra muscolare non sa di stare ricevendo un’informazione, non sa di elaborarla. Tutto avviene come in una cascata. Questo spero sia chiaro.
Oltre alla nervosa, abbiamo altri tipi di comunicazioni, quelle a breve distanza che prendono il nome di comunicazione paracrina ed autocrina e quelle a lunga distanza che prendono il nome di comunicazione endocrina (da non confondere, per chi studia biologia, con i meccanismi di secrezione ghiandolare: merocrina, apocrina ed olocrina).
I primi due sono meccanismi identici, ma mentre nel primo caso i destinatari sono cellule negli immediati paraggi, nel secondo caso il destinatario è la cellula stessa che emette il segnale. Sono entrambi metodi che non utilizzano il circolo sanguigno sistemico come mezzo di trasporto dell’informazione, ma al massimo il microcircolo. L’endocrinia, invece, si basa sull’utilizzo del circolo sistemico per veicolare il messaggio anche a grandi distanze, in questo caso i messaggeri si definiscono ormoni.
Bene, resta da stabilire una questione. In tutti questi casi come viene trasmesso il messaggio? Qui entriamo nel cuore dell’argomento, perché in tutti i casi entrano in gioco messaggeri chimici, molecole più o meno piccole di varia natura che possono essere rilasciate dal mittente nell’ambiente circostante e raggiungono il target per semplice diffusione oppure attraverso il circolo ematico. Parliamo quindi di molecole che vagano libere, ma ci sono dei casi in cui queste molecole non vengono liberate ma rimangono fissate alla membrana della cellula mittente ed operano attraverso un contatto diretto tra cellula mittente e cellula ricevente.In tutti i casi, quindi, siamo di fronte a molecole che vengono prodotte e secrete e che hanno un’attività biologica. E’ proprio nella loro attività biologica che risiede la comunicazione cellulare. Per compiere questa attività biologica le molecole, che d’ora in poi chiamerò genericamente con il nome di Ligandi, devono legarsi ad un recettore. Cos’è un recettore? Un recettore è una proteina espressa dalla cellula ricevente e che lega con specificità variabile un particolare ligando. Per far sì che Ligando e Recettore si incontrino, generalmente quest’ultimo è esposto sulla membrana cellulare (ma con alcune importantissime eccezioni come i recettori per gli ormoni steroidei) ed è composto da uno o più domini extracellulari (che legano il ligando), uno o più domini transmembrana (che lo ancorano alla membrana) e uno o più domini intracellulari che permettono la trasduzione del segnale, di cui parlerò tra non molto. Ovviamente, nella complessità del mondo biologico ci saranno numerosissime eccezioni a questo schema, ma resta comunque utile per capire la funzione del recettore. Il recettore può essere presente in due stadi, attivo e inattivo (ovviamente ci sono situazioni intermedie). In genere in assenza di ligando il recettore è inattivo mentre legato al suo ligando si attiva.A cosa serve il recettore? Un recettore è il primo step per la decodifica del messaggio. Infatti di per sé il ligando non contiene nessun’informazione, è soltanto una molecola. Diventa biologicamente importante soltanto quando si lega al suo recettore e lo attiva. Ma è il recettore attivato a trasdurre l’informazione alla cellula ricevente. Senza recettore il ligando servirebbe a poco, mentre il recettore molto spesso può essere attivato ugualmente anche da ligandi diversi, generalmente esogeni, chiamati agonisti. La morale è: non è importante tanto il ligando, quanto il recettore al quale il ligando si lega. Lo stesso ligando genera infatti risposte diverse legandosi a recettori diversi. Inoltre in alcuni tumori sono stati scoperti diversi recettori mutati attivi anche senza il proprio ligando.
E quando il recettore si attiva cosa succede? Qui si entra in un capitolo estremamente complesso quanto importante che è la trasduzione del segnale. Come dice il nome, è quel processo che porta e decodifica il segnale generato dal recettore attivato all’interno della cellula la quale verrà influenzata da questo segnale tanto più questo sarà forte e prolungato. L’obiettivo finale solitamente è l’attivazione di numerosi fattori di trascrizione e la variazione dell’espressione genica (ma potrebbe anche essere la morte stessa della cellula se il recettore attivato è un recettore di morte, vedere l’articolo sull’apoptosi “La signora della Morte”).
La trasduzione del segnale è quanto di più complicato e affascinante ci possa essere. Quando la studio mi sembra di vedere in azione i singoli elementi. Decine, centinaia, migliaia di attori entrano in scena modificandosi a vicenda, attivandosi, inibendosi. Non posso entrare nel dettaglio e non posso soffermarmi a lungo su questo capitolo, anche se me ne dispiace, perché altrimenti verrebbe fuori un discorso troppo lungo. Quello che mi interessa dire è che:
1) L’attivazione di un recettore nella maggioranza dei casi consiste in un cambiamento della sua conformazione, ovvero nel modo in cui i singoli residui amminoacidici che compongono la/e catena/e proteica/he sono disposti nello spazio tridimensionale
2) Il recettore attivato generalmente attiva un secondo messaggero (perchè il primo è il ligando), AMP ciclico, DiacilGlicerolo e Inositolo-3-fosfato sono i più importanti, o attiva altre proteine, in genere chinasi (enzimi che trasferiscono sui loro bersagli gruppi fosfato). I secondi messaggeri a loro volta attivano o inibiscono numerose altre proteine, amplificando così il segnale (l’AMP ciclico attiva ad esempio la proteina PKA, che è una chinasi che a sua volta potrà attivare od inibire altre proteine, il Diacilglicerolo attiva ad esempio la PKC, un’altra chinasi, e l’inositolo-3-fosfato attiva delle proteine canale che fanno aumentare la concentrazione dello Ione calcio, anch’esso un importante messaggero interno..ecc..).
3) Il segnale in questo modo viene amplificato, perché un singolo recettore potrà generare moltissime molecole di secondo messaggero, le quali a loro volta attiveranno/inibiranno tantissime altre proteine e continuando così si generano delle cascate di reazioni.
4) cascate di segnale diverse possono integrarsi più o meno precocemente sinergizzandosi o antagonizzandosi.
5) Quasi sempre il termine ultimo è l’attivazione o l’inibizione della trascrizione genica.
6) Quello che può apparire confusionario e disordinato ai nostri occhi è in realtà un processo ordinato e orchestrato elegantemente in modo che ogni elemento sia al posto giusto nel momento giusto e nella giusta concentrazione.

In questo modo la cellula “sente e risponde” ai segnali provenienti dell’esterno e si adatta. Fenomenale, no?
Ma ritorniamo al complesso Ligando-Recettore. Voglio pararvi un po’ più a fondo di questa fortunata coppia.
Prendiamo Il classico modello di recettore, quello esposto in membrana. E’ una proteina, che può essere multimerica (ovvero composta da diverse subunità) o monomerica ma non è detto. Ha almeno un sito di legame per il suo ligando specifico, ma può avere anche altri siti di legame per cosiddetti modulatori allosterici, ovvero molecole che si legano in siti diversi da quello del ligando (quindi non competono con esso, dopo vediamo cosa significa competere) ma influenzano comunque l’attività del recettore.
Molto spesso esiste una relazione tra concentrazione del ligando ed effetto (dove per effetto si intende una variazione funzionale rispetto all’assenza di ligando). Questa relazione in molti casi può essere spiegata dall’equazione:

Dove E è l’effetto, Emax è l’effetto massimo ottenibile, [L] è la concentrazione di ligando e Kd è la concentrazione di ligando alla quale si ha E=50% (per i più esperti è l’equivalente della costante di Michaelis-Menten nella cinetica enzimatica, ma la stessa equazione è equivalente a quella usata per determinare la velocità degli enzimi).
Se proviamo a mettere sugli assi cartesiani la curva ottenuta da quest’equazione mettendo nelle ascisse il log[L] e nelle ordinate E otteniamo una curva come la seguente:

All’inizio, anche con variazioni alte di [L] si ha uno scarso aumento di E, poi per piccoli aumenti di [L] si ha un esponenziale aumento di E, infine si ritorna in una situazione simile a quella di partenza. Emax è l’effetto ottenuto con tutti i siti del recettore saturati. Per cui non importa se aggiungiamo altro ligando, l’effetto non aumenta.
Vi starete domandando perché ci sono tre curve. Questo sarà chiaro ora. Se oltre al nostro ligando proviamo ad aggiungere concentrazioni crescenti di una molecola che, pur legandosi al recettore nello stesso sito di legame del ligando, non lo attiva (lo chiamiamo antagonista) otteniamo, per concentrazioni maggiori di antagonista, uno shift verso destra della curva concentrazione/effetto; La spiegazione è che essendo l’antagonista un competitore del nostro ligando (compete con esso per legarsi nello stesso sito di legame) ci vorranno concentrazioni maggiori di ligando per ottenere lo stesso effetto. Aumenta quindi sia [L] sia la KD, ma non si hanno variazioni dell’Emax, che rimane sempre 100.

Ci sarebbero tante altre considerazioni da fare (ad esempio cosa succede alla curva in caso di un antagonista non competitivo, in questo caso otteniamo sempre uno shift verso destra della curva, ma otteniamo un abbassamento dell’Emax), ma credo di aver già messo tanta carne al fuoco.
Come sempre, se avete domande, se ci sono errori, se siete curiosi e volete approfondire un argomento, scrivete nei commenti!!

Un ringraziamento va ad Alice per il grafico :)

Tags: , , , , , , , , , , ,

Nel post precedente ho accennato a come la definizione che noi abbiamo di gene sia stata più volte modificata e rivoluzionata nel tempo. Volevo dedicare questo articolo alla storia del gene, alla sua scoperta e all’evoluzione del concetto che noi abbiamo di esso fino ai nostri giorni.
Nel 2003, il National Human Genome Research Institute ha iniziato un progetto volto a definire ed identificare ogni elemento funzionale presente nel nostro genoma. I risultati sono stati pubblicati su Nature in un articolo di 18 pagine dal titolo “Identification and analysis of functional elements in 1% of the Human Genome by the ENCODE pilot project”.
Ma prima, volevo tornare indietro nel tempo. Fino a quando? Fino alla seconda metà dell’800, quando due grandi lavori, indipendenti l’uno dall’altro, ipotizzarono l’esistenza di fattori che determinavano i caratteri di un individuo (oggi diremmo il fenotipo) e che questi erano ereditabili di generazione in generazione con delle modalità in parte prevedibili. Questi fattori erano discreti. Ovviamente sto parlando dei lavori di Mendel prima e Darwin poi. Questi lavori sono stati fatti con un’ottica completamente diversa: il lavoro di Mendel era un lavoro da genetista, quello di Darwin è ovviamente un lavoro sull’evoluzione. Non si sapeva ancora nulla sulla natura di questi fattori, e nulla si sarebbe saputo per molti anni ancora.
Sempre in questa metà di secolo, attorno al 1880 un biologo tedesco, Walther Flemming, scoprì i cromosomi (corpi colorati) come entità che si trasmettevano dalla cellula madre alle cellule figlie in egual numero. Sempre in questi anni vennero effettuati anche studi sulla fecondazione e sulla meiosi.
Ma ancora nulla si sapeva delle unità ereditabili, né si sapeva dove fossero né di cosa fossero costituite. Nel 1903 il biologo americano Walter Sutton ipotizzò che fossero i cromosomi i portatori fisici delle unità ereditarie e che questi caratteri ereditari esistono in coppie, così come in coppie esistono i cromosomi.
Pochi anni dopo il grande genetista americano Morgan spiegò il fenomeno della ricombinazione genetica e spiegò in questo modo i meccanismi dell’ereditarietà. Non solo, in base alla frequenza di ricombinazione riuscì anche a disegnare una mappa genetica, fissando in questo modo all’interno dei cromosomi i geni. Fino allora i geni, iniziavano già a chiamarsi così, erano stati piuttosto astratti, nessuno ne aveva mai visto uno, si sapeva che esistevano ma nulla di più. Morgan diede loro una posizione specifica e misurò anche le distanze tra un gene e l’altro (di questo ho parlato nell’articolo “Knock out”, nella parte scritta in corsivo; se vi interessa potete andarvela a leggere). Questa posizione venne chiamata Locus. I geni quindi esistevano, erano localizzati sui cromosomi in posizione fisse e venivano ereditati da una generazione all’altra. Ma ancora molto doveva essere scoperto. Tanto per cominciare erano davvero i geni a trasportare l’informazione? Sembrava di sì, ma mancava la prova fondamentale. Come erano organizzati questi geni? Qual’era la loro natura?
Quando si andò ad analizzare la natura dei cromosomi si scoprì che erano costituiti da due componenti, una chiamata nucleina e l’altra erano le proteine. La composizione della nucleina era innanzitutto di natura acida, e poi aveva una struttura decisamente molto più semplice rispetto alle proteine. Da qui nacque una disputa durata diversi decenni che vedeva contrapposti chi credeva che fosse la nucleina la responsabile della trasmissione ereditaria dei caratteri e chi invece le proteine. Questa disputa finì nel 1944 quando l’americano Avery, in uno degli esperimenti più importanti della biologia molecolare, dimostrò che era la nucleina la sostanza portatrice dell’informazione, in quanto, se estratta da batteri patogeni, era la sola in grado di “trasformare” dei batteri non patogeni in patogeni, anche a bassissime concentrazioni. Stranamente i risultati di Avery non destarono lo scalpore che ci si sarebbe atteso.
Sempre negli anni quaranta del secolo scorso nacque la famosa idea che ciascun gene dia origine ad uno specifico enzima.
Infine, negli anni 50 venne finalmente scoperta la struttura molecolare della nucleina, o DNA, da esperimenti sulla diffrazione di raggi X dagli arcinoti Watson e Crick.
Ora si avevano in mano importanti informazioni: I geni sono delle unità discrete costituite di DNA e localizzate in posizioni fisse sui cromosomi. Sono i responsabili della trasmissione ereditaria dei caratteri e ciascuno di loro contiene l’informazione per costruire una proteina.
Si iniziò a studiare il codice genetico, come cioè dal linguaggio dei quattro nucleotidi A, T, C e G si potesse arrivare al linguaggio delle proteine, costituite di amminoacidi. Si scoprì inoltre che tra il DNA e la proteina c’era un intermediario, l’RNA messaggero. Sono gli anni 60, gli anni del dogma centrale della biologia molecolare che enunciava che l’informazione passava dal DNA, all’RNA e quindi alle proteine. Attraverso un sistema di codifica ben determinato. Questo dogma ebbe vita breve con la scoperta dei retrovirus.
La definizione “un gene una proteina” però iniziava ad andare stretta già in quegli anni, perchè alcuni geni davano origine a degli RNA che però non venivano tradotti in proteine, ma davano origine ai ribosomi e agli RNA transfer.
Negli anni settanta si iniziò a scoprire come i geni erano organizzati e come venivano espressi e letti. Si iniziò quindi a definire gene una sequenza funzionale compresa tra un codone di inizio ed uno di fine. Una cosiddetta ORF, una open reading frame. Il concetto di open reading frame si basa sul fatto che i geni vengono letti a gruppi di tre nucleotidi, o codoni, ciascuno dei quali codifica per un amminoacido. Perciò una sequenza:

CATGCCAATTAGCTAA

Può essere letta: CAT-GCC-AAT-TAG-CTA-A… oppure ..C-ATG-CCA-ATT-AGC-TAA , oppure ancora: ..CA-TGC-CAA-TTA-GCT-AA.. Ci si ferma qua perchè slittando di un altro nucleotide ancora si finisce nel primo caso.
Siccome la seconda lettura possiede un ATG e un TAA che sono rispettivamente il codone di inizio e uno dei codoni di fine, molto probabilmente è la lettura giusta. Da notare che non ci sono solo questi tre modi per leggere una sequenza, ma ci sono anche i rispettivi per leggere la sequenza complementare. Per questo si dice che una sequenza si può leggere in sei modi diversi.
Contemporaneamente si sviluppavano degli algoritmi per predire se una sequenza potesse essere o meno una ORF. L’inizio della bioinformatica.
La definizione di gene dovette essere ancora cambiata in seguito alla scoperta degli esoni e degli introni e dello splicing alternativo (leggersi l’inizio dell’articolo precedente). La ORF non era più continua, ma interrotta dagli introni e inoltre poteva dare origine a proteine diverse. Diciamo che si potrebbe dire un gene molte proteine. Ma comunque sarebbe scorretto, perchè per proteina si intende un prodotto funzionale, mentre spesso i geni codificano per delle subunità di una proteina, che da sole non hanno alcuna funzione. Quindi si potrebbe correggere con un gene (o ORF) codifica una serie di prodotti funzionali, proteine o RNA. Una definzione di gene che tenga conto di questa realtà è “un locus di esoni cotrascritti”
Veniamo ai giorni nostri. Attualmente si tende a definire un gene in base alla sua sequenza. una definizione potrebbe essere, in lingua originale  “a locatable region of genomic sequence, corresponding to a unit of inheritance, which is associated with regulatory regions, transcribed regions and/or other functional sequence regions” Traducibile con “una regione localizzabile della sequenza genomica, corrispondente ad un’unità ereditaria che è associata a regioni regolatrici, a regioni trascrivibili e/o altre sequenze funzionali” (Pearson 2006).
Con questa definizione tuttavia si hanno dei problemi. Infatti, sebbene nessuna definizione prima d’ora enunciata parlasse delle sequenze regolatrici, includerle nella definizione potrebbe essere problematico, visto che molte sequenze regolatrici sono estremamente distanti dalla regione codificante. In questo modo si avrebbe un’idea di gene “diluita” nel genoma e non compatta in un singolo locus.
Un altro problema che si fa avanti è la scoperta che in moltissimi casi i geni sono sovrapposti, dividono cioè la stessa sequenza di DNA, ma posseggono diverse reading frame.  Sono geni letti in maniera sfalsata, quindi.
Come vedete, non esiste una definizione di Gene che sia completamente senza problemi.
Ma veniamo, finalmente, al famoso ENCODE project, di cui parlavao all’inizio. Siamo finalmente arrivati alle ultime battute. Questo progetto aveva lo scopo di definire ed identificare ogni elemento funzionale presente nel nostro genoma. Cosa hanno ottenuto?
Innanzitutto, se per funzionale si intende che viene trascritto, una grande quantità di trascritti provenienti da regioni non identificate prima come geni è stata rivelata. Di questo problema mi sono occupato diffusamente nell’articolo “Dark Matter”, materia oscura, perchè di questo si tratta. Trascritti di cui non riusciamo a dare una spiegazione funzionale.
Inoltre, in contrasto con la definizione di gene come unità fisica definita nello spazio e separata dagli altri tende a cadere sia in base alla scoperta dei geni sovrapposti, sia perchè in questo modo si formano delle ampie regioni genomiche in cui sono raggruppati molti geni sovrapposti senza possibilità di definire una regione genica ed intergenica con sicurezza.
Insomma, sembra quasi che, ad un secolo e mezzo di distanza la definizione di Gene non possa più rispondere ai recenti (più o meno) sviluppi delle biologia molecolare. I ricercatori del ENCODE-project hanno provato a scendere a compromessi e hanno provato a definire un gene così:

“The gene is a union of genomic sequences encoding a coherent
set of potentially overlapping functional products.”

Il gene è un unione di sequenze genomiche codificanti un set coerente di prodotti funzionali potenzialmente sovrapposti.
Sembra una definizione abbastanza semplice, tuttosommato. Io mi aspettavo qualcosa di più complesso, ma sembra funzionare lo stesso. è Semplice, concisa e lineare. A volte le cose semplici sono le più corrette.
Vediamo se funziona:
-in caso di geni continui, la definizione si riduce alla classica definizione di gene che sappiamo: una sequenza di DNA che codifica per un prodotto funzionale, RNA o proteina.
-Per i geni discontinui e/o sovrapposti funziona, perchè è considerato come unione di sequenze codificanti che possono anche essere sovrapposte.
-Anche lo splicing alternativo sembra essere spiegato, in quanto parla di prodotti finali, quindi possono essere anche molteplici.
-Le regioni regolatrici non sono incluse nella definizione. Qui secondo me è stata una scelta. Se fossero state incluse però, avrebbero complicato ulteriormente la questione.

Riconosco che è una questione davvero complicata. Alcune cose non sono chiare nemmeno a me. Comunque la mia intenzione era quella di darvi un’idea di come le cose siano andate complicandosi sempre di più. Ma credo sia proprio questo il bello! alla prossima.

Per scrivere questo articolo mi sono basato in parte sul seguente articolo: “Mark B. Gerstein, Can Bruce, Joel S. Rozowsky, et al., What is a gene, post-ENCODE? History and updated definition, Genome Res, 2007 17: 669-681″

Tags: , , ,

Uno degli annosi dilemmi della biologia molecolare, molti anni fa, era la correlazione tra complessità dell’organismo e dimensioni del genoma. Un organismo complesso, si pensava, doveva possedere un altissimo numero di geni, mentre un organismo meno complesso poteva accontentarsi di un numero di geni più modesto. Ovviamente, da bravi presuntuosi quali siamo, l’essere umano doveva averne, come minimo, un centinaio di migliaia. Non di meno.
La stima che venne eseguita, però, parlava di ben altre cifre: circa 25-30’000 geni. Se poi si andavano a guardare altri esseri viventi si scopriva che il moscerino della frutta ne possiede circa 15 mila e un vermiciattolo (il nematode C. elegans) circa 20 mila. Brutta storia. E’ chiaro che non si può tentare di spiegare la complessità con dei semplici numeri o con delle mere classifiche.

Alla fine degli anni settanta venne inoltre confutata la definizione di gene classica che la maggior parte di noi conosce “Un gene = Una proteina” con la scoperta dello splicing alternativo.
La scoperta dello splicing alternativo poteva essere una spiegazione alternativa alla complessità degli organismi. Cos’è lo splicing alternativo? E ancora prima, cos’è lo splicing?
La scoperta dei geni interrotti, negli eucarioti, è stato il primo passo per comprendere lo splicing. I geni degli eucarioti non sono costituiti da una sequenza codificante lineare e ininterrotta, dal codone di inizio a quello di stop. Sono costituiti da pezzi codificanti interrotti da pezzi non codificanti. I primi pezzi vengono chiamati esoni, i secondi introni. Quando il gene viene trascritto, viene trascritto tutto quanto esoni più introni. In media, nell’uomo, ogni gene è costituito da 9 esoni e 8 introni. Ma è soltanto una media. Il gene ErbB4, nell’uomo, ha 28 esoni, e non è neanche quello che ne ha di più.
Il trascritto così formato non può essere subito tradotto in proteina, per ovvi motivi: i ribosomi hanno bisogno di leggere una ORF (open reading frame, nota come cornice di lettura) continua, non saltellante. Per questo l’RNA messaggero appena formato viene subito processato. Il processamento o processing avviene sempre nel nucleo e consta di tre fasi: il Capping, la Poliadenilazione e lo Splicing.
Il capping consiste nell’aggiunta all’inizio dell’RNA (al 5′) di una 7-metil guanosina, ma non attraverso il solito legame 3′-5′, ma con l’insolito 5′-5′. Questo cap ha il compito di proteggere l’RNA dalla degradazione e di regolare il trasporto dello stesso fuori dal nucleo per la traduzione.
Funzione simile ha la poliadenilazione, ovvero l’aggiunta di qualche centinaio di residui di adenosina alla fine del trascritto (3′).
Veniamo allo splicing. Questo processo consiste nel staccare selettivamente gli introni e unire conseguentemente gli esoni, formando così il trascritto maturo che potrà essere tradotto.

Il meccanismo dello splicing è estremamente complesso e non starò a parlarne, perché credo che per chi non studi espressamente biologia molecolare non sia interessante (se però, nonostante questi avvertimenti, vorrete saperne di più chiedete pure!). Quello che mi limiterò a dire è che possono esistere due forme di splicing, uno per così dire autonomo, ovvero che non necessita elementi esterni, ed uno guidato da un complesso macchinario formato da proteine ma soprattutto da RNA stesso, ovviamente non codificante. E’ questo uno dei casi in cui è l’RNA non le proteine ad avere un ruolo da catalizzatore. L’altro caso è ovviamente il ribosoma. Il ribosoma e lo spliceosoma (ovvero il macchinario che catalizza lo splicing, sì lo so che è una parola orribile) possono essere delle vestigia del cosiddetto RNA world, precedente alla comparsa del DNA.
La domanda che vi potete essere posti è: come si riesce a distinguere un esone da un introne, e soprattutto come si riesce ad individuare correttamente la fine di un esone e l’inizio di un introne. Non è così semplice. Innanzitutto, studi comparativi (ovvero che prendevano in esame un gran numero di sequenze) hanno tracciato dei profili più o meno conservati di giunzione esone-introne. Ovvero di quella manciata di nucleotidi a cavallo tra la fine di un esone e l’inizio di un introne e viceversa.

La figura evidenzia un sito di splicing al 5′ e un altro al 3′ dell’introne, entrambi sono fondamentali per il distacco dell’introne e la congiunzione degli esoni.
Vi potrete chiedere se questa sequenza sia fissa ed immutabile per tutti i geni. Il diagramma che vi metterò ora vi darà la risposta:

Come si interpreta? Le dimensioni delle lettere sono proporzionali alla loro frequenza, quindi, ad esempio, nella posizione 7 dell’introne (il settimo nucleotide dall’inizio dell’introne) tutti i nucleotidi sono equivalenti, questo ci fa presupporre che non sia una posizione utile allo splicing, mentre nella posizione -1, 1 e 2 abbiamo quasi esclusivamente GGT. Questi devono essere i nucleotidi più importanti perché più conservati. Seguiti dalla A in -2 e in 3 e 4 e dalla G in 5. Sembra strano che così pochi nucleotidi bastino a garantire la specificità richiesta.
Abbiamo altre sequenze però, come il tratto di polipirimidine (py tract) e il punto di ramificazione. Numerose malattie genetiche e tumori sono dovuti a difetti nello splicing, si stima che siano circa il 15%.
Ma veniamo ora allo splicing alternativo. E’ questo un fenomeno molto interessante e consiste nella possibilità per un gran numero di geni di dare origine a diversi prodotti, o isoforme, alcune correlate funzionalmente tra loro, altre invece completamente diverse. Lo splicing alternativo non è un eccezione, è la regola. Si stima che più del 70% dei geni nell’uomo vada incontro a questo fenomeno (ci sono stime diverse, ovviamente in base alle tecniche utilizzate per ottenerle). Come è possibile arrivare a questo? Il modo più comune, forse, è quello di eliminare uno o più esoni dal trascritto primario, generando così un’isoforma più corta; oppure trattenendo un introne tra due esoni, anziché eliminarlo; o anche, grazie alla presenza di siti di splicing alternativi, la formazione di esoni/introni di diversa lunghezza. Normalmente distinguiamo esoni e introni costitutivi e sono esoni e introni sempre presenti/assenti nel trascritto maturo. Esistono poi i cosiddetti esoni/introni opzionali che possono o meno venire inclusi. Inoltre ci sono dei casi in cui la presenza nel trascritto maturo di un esone implica necessariamente l’assenza di un altro esone, in questo caso parliamo di esoni mutualmente esclusivi. Questo ovviamente può generare una varietà enorme di trascritti. Ci sono geni anche con decine di varianti diverse, ciascuna delle quali darà origine a proteine diverse. Quindi non solo il concetto del gene è stravolto (e venne stravolto molte volte ancora, per gli interessati ho da consigliare un ottimo articolo sull’evoluzione del concetto di gene negli anni) ma anche si riuscì a capire come da un numero relativamente modesto di geni si generasse una varietà così grande di proteine. La domanda da farsi ora è: cosa decide se un esone/introne debba essere incluso o meno? E’ un discorso estremamente complesso che vede in gioco un numero molto alto di fattori. Cercherò di semplificarlo al meglio.
Ci sono all’interno degli esoni e degli introni delle sequenze, anche molto lunghe, che vengono distinte in due classi: gli splicing-enhancers (SE) e gli splicing-silencers (SS). Queste sequenze giocano un ruolo fondamentale. Vengono riconosciute da numerose proteine (delle RBPs, RNA-binding-proteins) le quali possono influenzare lo splicing. In che modo? Vediamolo.
Le sequenze SE possono essere introniche od esoniche; a queste sequenze si legano delle proteine appartenenti alla famiglia SR (serin-rich, ricche di serina, un amminoacido), a loro volta queste proteine reclutano sul trascritto immaturo i componenti dello spliceosoma (il macchinario che catalizza lo splicing). Lo spliceosoma riconosce i siti di splicing 5′ e 3′ (vedere la figura due), in questo modo lo splicing può avvenire attraverso l’eliminazione dell’introne e la congiunzione degli esoni, secondo lo schema classico. Se in un trascritto immaturo funzionassero soltanto le sequenze SE, per forza di cose tutti gli esoni sarebbero tenuti e tutti gli introni eliminati.
Per far sì che ci possa essere lo splicing alternativo, ci sono anche le SS. Queste sequenze legano alte proteine, le quali coprono fisicamente sia le SE sia i siti di splicing 5′ e 3′ , in questo modo lo spliceosoma non può legarsi. Questo cosa comporta? Semplicemente che l’esone nel quale le SS sono attive, non verrà riconosciuto dallo spliceosoma, il quale si legherà alle sequenze di splicing più vicine a monte e a valle dell’esone; la regione compresa tra queste due sequenze, quindi con l’esone compreso verrà trattata come se fosse un introne e verrà eliminato dal trascritto.
Il tutto si gioca sull’equilibrio tra SS e SE e sulle proteine che legano queste sequenze. In base alla prevalenza di una famiglia di proteine sull’altra si avrà la ritenzione o l’eliminazione dell’esone. In questo quadro, potrebbe essere influente anche la velocità alla quale il trascritto viene sintetizzato dall’RNA polimerasi, perchè in questo modo alcune sequenze potranno essere disponibili con tempi diversi e potranno competere tra di loro.

Da quanto detto se ne deduce che:

*Un esone può venire incluso o escluso dal trascritto maturo in base all’equilibrio SE-SS.
*Due esoni mutualmente esclusivi saranno regolati in base alle competizione tra le loro sequenze e i loro siti di splicing. Supponiamo di avere un esone A e un esone B, ciscuno con le sue SE e SS. Nel caso degli esoni mutualmente esclusivi, le sequenze dell’uno “influenzano” il destino dell’altro. Per cui, ad esempio, se l’esone A riesce a legare più proteine di B sulle sue ES, esclude l’esone B, e viceversa. Ovviamente prendete con le pinze il “riesce”, non è una gara, è soltanto una questione di equilibrio.
Lo splicing alternativo è, come dicevo, molto diffuso. Una cosa che è importante sapere è che è anche tessuto-specifico. Questo significa che tessuti diversi esprimono isoforme diverse dello stesso gene attraverso splicing alternativi.  Infatti l’analisi dello splicing in diversi tessuti permette di stabilirne l’origine. Come è possibile manatenere splicing diversi in tessuti diversi? Molto spesso è dovuto all’espressione di fattori di splicjng diversi da tessuto a tessuto e questo determina eventi di splicing specifici. Il sistema nervoso è forse il tessuto che presenta il più alto grado di splicing alternativo tessuto specifico. Anche all’interno dello stesso sistema nervoso ci sono aree con diversi pattern di splicing.

Voglio concludere questo papiro con un esempio estremo di splicing alternativo. Questa volta non sarà l’essere umano ‘esempio, ma il nostro amico Drosophila.  Il moscerino, durante lo sviluppo del suo sistema nervoso esprime una proteina chiamata “Dscam”. Questa proteina, espressa sui neuroni in via di sviluppo, è un recettore appartenente alla famiglia CAM (cell-adhesion-molecules), è quindi una proteina che media l’adesione cellula-cellula. Il gene di questa proteina è forse il più complesso gene che si sia mai visto, avendo ben 38016 varianti di splicing, solo lui. Se la drosophila ha circa 15 mila geni, solo dscam ha più varianti che tutti i suoi geni messi assieme. Questo perchè il gene in questione ha tre esoni, il 4, il 6 e il 9 che hanno rispettivamente 12, 48 e 33 varianti mutualmente esclusive, quindi soltanto una variante per esone è mantenuta nel trascritto maturo. Non ho fatto il calcolo combinatoriale, per cui non so dirvi se vengono effettivamente 38 mila e passa varianti, ma confido che chi l’ha fatto l’abbia fatto giusto.  Spaventoso, vero? Non solo spaventoso, direi anche meraviglioso. Alla faccia di chi crede che solo l’uomo e i mammiferi sono degni di essere studiati. Ciascun neurone esprime una sola variante di splicing, e questo è necessario per mantenere l’identità neuronale stessa. Non credo che esistano due neuroni con la stessa isoforma Dscam. Non è ancora chiaro se la scelta venga fatta casualmente.

Spero di essere stato interessante, nonostante la lunghezza dell’articolo. come sempre se avete domande fatele! se desiderate saperne di più chiedete, posso consigliarvi numerosi articoli. Se notate errori, per favore, fatemelo sapere nei commenti. Alla prossima e Buone vacanze!


Tags: , , , , , , , , , ,

Nonostante il titolo, non dovreste lasciarvi ingannare oramai, perchè dovreste sapere dove vado a parare di solito. Questo non è un post di etologia, ma di biologia molecolare e genetica.
Fino a qualche anno da si riteneva che in un organismo le due metà del patrimonio genetico derivanti dai due genitori contribuissero egualmente, ma si è scoperto che non è così. Per un gruppo di geni fare parte della linea materna o paterna è di fondamentale importanza per la sua futura attività.
L’imprinting è un termine che comunque è stato mutuato dall’etologia e indica proprio questo aspetto: un piccolo insieme di geni sono espressi esclusivamente dalla linea materna o dalla linea paterna e mai dall’altra. Non è incredibile? Questo fenomeno non è casuale, nel senso che geni che hanno un imprinting materno (che sono cioè espressi soltanto dall’allele di derivazione materna) conservano lo stesso imprinting in tutti gli organismi della stessa specie e probabilmente anche nelle specie affini. Molti dei geni “imprinted” nell’uomo, ad esempio, hanno lo stesso imprinting anche nel topo! In generale il fenomeno dell’imprintig è abbastanza conservato in tutti i mammiferi, ma è stato osservato ovunque negli eucarioti.
Non so se riusciate a comprendere la portata del fenomeno. Come diavolo possono essere distinti i geni in base linea parentale di appartenenza? Come è possibile che sempre lo stesso allele venga espresso? Sembra ovvio che non può essere questione di diversità di sequenza, perchè gli alleli sono in teoria identici.
Quindi ci deve essere qualcos’altro all’origine di questo strano fenomeno che viene trasmesso di generazione in generazione. Ci deve essere un modo per marcare il DNA in modo da poter identificare i geni in questione e soprattutto questa marcatura deve essere trasmessa di generazione in generazione.
A questo punto devo introdurre un concetto abbastanza complicato e che se anche all’inizio sembrerà che non c’entri nulla con quanto ho appena detto, in realtà è un passaggio fondamentale.
Tutti conosciamo il codice genetico, ma pochi conoscono il codice epigenetico. Il termine epigenetica indica un insieme di fenomeni che in qualche modo “stanno sopra” la genetica. Cosa vuol dire stare sopra? Non che sia più importante, ma soltanto che mentre il codice genetico si basa sulle sequenze nucleotidiche, le quali codificano informazioni ben precise come ben sappiamo, il codice epigenetico è un codice che non si basa sulle sequenze ma su altri elementi che adesso in breve spiegherò.
Questi elementi possono essere a carico del DNA stesso, come la metilazione (aggiunta di un gruppo -CH3) su entrambi i filamenti delle citosine in contesto CG; oppure possono essere a carico di una famiglia di proteine che interagiscono direttamente e fisicamente con il DNA e influenzano in modo determinante la trascrizione ed altri processi: gli istoni.
Cerco di spiegarmi meglio; il codice epigenetico è una sorta di linguaggio (come il codice genetico) e porta informazioni ben precise e fondamentali per lo sviluppo e la corretta funzione di una cellula. Questo linguaggio è costituito da un “alafabeto” che consiste principalmente in metilazione delle citosine in 5-metil-citosina quando le C sono precedute e/o seguite da una G. Questa metilazione avviene su entrambi i filamenti ad opera di una famiglia di enzimi chiamati DNMT (DNA-metil-transferasi). La metilazione sembra una modificazione insignificante, ma in realtà influenza pesantemente la struttura e la funzione del DNA.Diverse proteine si legano alle sequenze metilate e fanno in modo che il DNA assuma una conformazione densa e compatta e pressochè inattiva (eterocromatina). La metilazione non è l’unico elemento epigenetico, ma è l’unico ad interessare direttamente il DNA. Le altre modificazioni interessano delle proteine che sono strettamente associate al DNA gli istoni. Gli istoni sono le proteine che più frequentemente troviamo associate al DNA, il quale si avvolge letteralmente sopra. A seconda di come sono modificati gli istoni, il DNA può essere rilassato e attivo, oppure compatto ed inattivo. Però cosa si intende per compatto e per rilassato? Il DNA è approssimativamente un filo, quando è ripiegato tante volte su se stesso ed associato molto strettamente agli istoni allora è compatto; quando si trova in questo stato il DNA è inattivo perchè le proteine che sono necessarie alla trascrizione non riescono a legarsi all DNA stesso. Se invece il DNA è lineare è attivo perchè non ci sono ostacoli alla trascrizione.
Concentriamoci sulla metilazione delle citosine. Questa è l’unica modificazione che viene trasmessa e mantenuta da una cellula all’altra durante la divisione, ed è la responsabile della memoria cellulare! Cosa vuol dire? Vi siete mai chiesti come faccia una cellula già differenziata rimanere tale dopo la divisione cellulare? Come fa una cellula a sapere da che cellula deriva? Ricordatevi che una cellula quando si divide, replica e condensa tutti i cromosomi e li divide equamente tra le cellule figlie; queste ultime, una volta separate, decondensano i cromosomi e pertanto potrebbero in teoria decondensare ed attivare anche regioni che normalmente non dovrebbero essere attive in una cellula di quel tipo e diventare altre cellule. Come fanno a sapere cosa attivare e cosa no? Ok, mi direte voi, dal contesto e dal tessuto in cui si trova (se si trova in mezzo a epatociti diventerà epatocita); non è errata come risposta, ma non è sufficiente. E’ la metilazione che guida la memoria cellulare. Regioni metilate ed inattive nella cellula madre, saranno tenute metilate anche nelle cellule figlie, ad opera delle DNMT. Una cellula replica il suo DNA in maniera semiconservativa, pertanto le due copie di DNA che si formano avranno un filamento “vecchio” della cellula madre ed il complementare è invece appena sintetizzato. Pertanto le cellule figlie avranno soltanto un filamento di DNA che continua ad essere metilato,  quello della madre, mentre il complementare no! le DNMT riconoscono lecitosine in contesto CG metilate solo su un filamento e le metilano anche nel filamento complementare, mantenendo così intantta la meoria cellulare. Interessante non è vero???
Ok, spero di non avervi confuso le idee con questa digressione. Spero non abbiate perso il punto principale, ovvero l’imprinting. Ci eravamo chiesti quale “marcatura” potesse essere in grado di differenziare un allele dall’altro e che fosse in grado di trasmettersi lungo le generazioni. Come avrete già capito, questa marcatura è proprio la metilazione delle citosine. A questo punto si apre un problema. E’ noto che durante lo sviluppo embrionale sono le cellule staminali embrionali che danno origine all’individuo. Le cellule staminali embrionali (CSE) sono dedifferenziate e possono dare origine a qualsiasi cellula. Questo è possibile perchè il DNA dello zigote non appena c’è stata la fecondazione va incontro ad un ampio riarrangiamento e viene praticamente “demetilato” per cancellare la memoria cellulare e dare origine alle CSE. A questo seguirà una ondata di metilazione “de novo” che permetterà alle cellule di differenziarsi man mano che procede lo sviluppo. Non si conoscono ancora bene i meccanismi di questa nuova ondata di metilazione, però sta di fatto che se le metilazioni originali vanno perdute, come si fa a ristabilire l’imprinting nel modo corretto? Questo è possibile perchè non tutte le metilazioni vanno perdute, e tra le metilazioni che rimangono, ci sono quelle che regolano l’imprinting e pertanto questo viene conservato durante le generazioni.
Ora che abbiamo capito la logica che ci sta dietro, vediamo come sono regolati questi “imprinted genes”.  E’ stato notato che c’è una regione di DNA che può anche essere condivisa da più geni che può essere metilata o non metilata. Questa regione che può anche essere molto lunga è chiamata ICR (imprinted control region). E’ questa regione che è differentemente marcata tra le due linee parentali. Se è metilata su una linea non è metilata nell’altra. Solitamente le regioni metilate sono inattive, quindi la ICR metilata sarà un segnale di silenziamento genico.  Il discorso è però più complicato, perchè esistono due tipi di ICRs, ma non mi sembra il caso di addentrarmi ulteriormente.. mi sembra di aver messo già troppa carne al fuoco.

Spero di essere stato chiaro e non confusionario. spero di aver reso l’idea di quello che volevo dire! Se avete domande ovviamente siete caldissimamente invitate a farle. Così pure se volete semplicemente commentare o criticare!

Tags: , ,

« Older entries § Newer entries »