Uno degli annosi dilemmi della biologia molecolare, molti anni fa, era la correlazione tra complessità dell’organismo e dimensioni del genoma. Un organismo complesso, si pensava, doveva possedere un altissimo numero di geni, mentre un organismo meno complesso poteva accontentarsi di un numero di geni più modesto. Ovviamente, da bravi presuntuosi quali siamo, l’essere umano doveva averne, come minimo, un centinaio di migliaia. Non di meno.
La stima che venne eseguita, però, parlava di ben altre cifre: circa 25-30’000 geni. Se poi si andavano a guardare altri esseri viventi si scopriva che il moscerino della frutta ne possiede circa 15 mila e un vermiciattolo (il nematode C. elegans) circa 20 mila. Brutta storia. E’ chiaro che non si può tentare di spiegare la complessità con dei semplici numeri o con delle mere classifiche.
Alla fine degli anni settanta venne inoltre confutata la definizione di gene classica che la maggior parte di noi conosce “Un gene = Una proteina” con la scoperta dello splicing alternativo.
La scoperta dello splicing alternativo poteva essere una spiegazione alternativa alla complessità degli organismi. Cos’è lo splicing alternativo? E ancora prima, cos’è lo splicing?
La scoperta dei geni interrotti, negli eucarioti, è stato il primo passo per comprendere lo splicing. I geni degli eucarioti non sono costituiti da una sequenza codificante lineare e ininterrotta, dal codone di inizio a quello di stop. Sono costituiti da pezzi codificanti interrotti da pezzi non codificanti. I primi pezzi vengono chiamati esoni, i secondi introni. Quando il gene viene trascritto, viene trascritto tutto quanto esoni più introni. In media, nell’uomo, ogni gene è costituito da 9 esoni e 8 introni. Ma è soltanto una media. Il gene ErbB4, nell’uomo, ha 28 esoni, e non è neanche quello che ne ha di più.
Il trascritto così formato non può essere subito tradotto in proteina, per ovvi motivi: i ribosomi hanno bisogno di leggere una ORF (open reading frame, nota come cornice di lettura) continua, non saltellante. Per questo l’RNA messaggero appena formato viene subito processato. Il processamento o processing avviene sempre nel nucleo e consta di tre fasi: il Capping, la Poliadenilazione e lo Splicing.
Il capping consiste nell’aggiunta all’inizio dell’RNA (al 5′) di una 7-metil guanosina, ma non attraverso il solito legame 3′-5′, ma con l’insolito 5′-5′. Questo cap ha il compito di proteggere l’RNA dalla degradazione e di regolare il trasporto dello stesso fuori dal nucleo per la traduzione.Funzione simile ha la poliadenilazione, ovvero l’aggiunta di qualche centinaio di residui di adenosina alla fine del trascritto (3′).
Veniamo allo splicing. Questo processo consiste nel staccare selettivamente gli introni e unire conseguentemente gli esoni, formando così il trascritto maturo che potrà essere tradotto.

Il meccanismo dello splicing è estremamente complesso e non starò a parlarne, perché credo che per chi non studi espressamente biologia molecolare non sia interessante (se però, nonostante questi avvertimenti, vorrete saperne di più chiedete pure!). Quello che mi limiterò a dire è che possono esistere due forme di splicing, uno per così dire autonomo, ovvero che non necessita elementi esterni, ed uno guidato da un complesso macchinario formato da proteine ma soprattutto da RNA stesso, ovviamente non codificante. E’ questo uno dei casi in cui è l’RNA non le proteine ad avere un ruolo da catalizzatore. L’altro caso è ovviamente il ribosoma. Il ribosoma e lo spliceosoma (ovvero il macchinario che catalizza lo splicing, sì lo so che è una parola orribile) possono essere delle vestigia del cosiddetto RNA world, precedente alla comparsa del DNA.
La domanda che vi potete essere posti è: come si riesce a distinguere un esone da un introne, e soprattutto come si riesce ad individuare correttamente la fine di un esone e l’inizio di un introne. Non è così semplice. Innanzitutto, studi comparativi (ovvero che prendevano in esame un gran numero di sequenze) hanno tracciato dei profili più o meno conservati di giunzione esone-introne. Ovvero di quella manciata di nucleotidi a cavallo tra la fine di un esone e l’inizio di un introne e viceversa.

La figura evidenzia un sito di splicing al 5′ e un altro al 3′ dell’introne, entrambi sono fondamentali per il distacco dell’introne e la congiunzione degli esoni.
Vi potrete chiedere se questa sequenza sia fissa ed immutabile per tutti i geni. Il diagramma che vi metterò ora vi darà la risposta:

Come si interpreta? Le dimensioni delle lettere sono proporzionali alla loro frequenza, quindi, ad esempio, nella posizione 7 dell’introne (il settimo nucleotide dall’inizio dell’introne) tutti i nucleotidi sono equivalenti, questo ci fa presupporre che non sia una posizione utile allo splicing, mentre nella posizione -1, 1 e 2 abbiamo quasi esclusivamente GGT. Questi devono essere i nucleotidi più importanti perché più conservati. Seguiti dalla A in -2 e in 3 e 4 e dalla G in 5. Sembra strano che così pochi nucleotidi bastino a garantire la specificità richiesta.
Abbiamo altre sequenze però, come il tratto di polipirimidine (py tract) e il punto di ramificazione. Numerose malattie genetiche e tumori sono dovuti a difetti nello splicing, si stima che siano circa il 15%.Ma veniamo ora allo splicing alternativo. E’ questo un fenomeno molto interessante e consiste nella possibilità per un gran numero di geni di dare origine a diversi prodotti, o isoforme, alcune correlate funzionalmente tra loro, altre invece completamente diverse. Lo splicing alternativo non è un eccezione, è la regola. Si stima che più del 70% dei geni nell’uomo vada incontro a questo fenomeno (ci sono stime diverse, ovviamente in base alle tecniche utilizzate per ottenerle). Come è possibile arrivare a questo? Il modo più comune, forse, è quello di eliminare uno o più esoni dal trascritto primario, generando così un’isoforma più corta; oppure trattenendo un introne tra due esoni, anziché eliminarlo; o anche, grazie alla presenza di siti di splicing alternativi, la formazione di esoni/introni di diversa lunghezza. Normalmente distinguiamo esoni e introni costitutivi e sono esoni e introni sempre presenti/assenti nel trascritto maturo. Esistono poi i cosiddetti esoni/introni opzionali che possono o meno venire inclusi. Inoltre ci sono dei casi in cui la presenza nel trascritto maturo di un esone implica necessariamente l’assenza di un altro esone, in questo caso parliamo di esoni mutualmente esclusivi. Questo ovviamente può generare una varietà enorme di trascritti. Ci sono geni anche con decine di varianti diverse, ciascuna delle quali darà origine a proteine diverse. Quindi non solo il concetto del gene è stravolto (e venne stravolto molte volte ancora, per gli interessati ho da consigliare un ottimo articolo sull’evoluzione del concetto di gene negli anni) ma anche si riuscì a capire come da un numero relativamente modesto di geni si generasse una varietà così grande di proteine. La domanda da farsi ora è: cosa decide se un esone/introne debba essere incluso o meno? E’ un discorso estremamente complesso che vede in gioco un numero molto alto di fattori. Cercherò di semplificarlo al meglio.
Ci sono all’interno degli esoni e degli introni delle sequenze, anche molto lunghe, che vengono distinte in due classi: gli splicing-enhancers (SE) e gli splicing-silencers (SS). Queste sequenze giocano un ruolo fondamentale. Vengono riconosciute da numerose proteine (delle RBPs, RNA-binding-proteins) le quali possono influenzare lo splicing. In che modo? Vediamolo.
Le sequenze SE possono essere introniche od esoniche; a queste sequenze si legano delle proteine appartenenti alla famiglia SR (serin-rich, ricche di serina, un amminoacido), a loro volta queste proteine reclutano sul trascritto immaturo i componenti dello spliceosoma (il macchinario che catalizza lo splicing). Lo spliceosoma riconosce i siti di splicing 5′ e 3′ (vedere la figura due), in questo modo lo splicing può avvenire attraverso l’eliminazione dell’introne e la congiunzione degli esoni, secondo lo schema classico. Se in un trascritto immaturo funzionassero soltanto le sequenze SE, per forza di cose tutti gli esoni sarebbero tenuti e tutti gli introni eliminati.
Per far sì che ci possa essere lo splicing alternativo, ci sono anche le SS. Queste sequenze legano alte proteine, le quali coprono fisicamente sia le SE sia i siti di splicing 5′ e 3′ , in questo modo lo spliceosoma non può legarsi. Questo cosa comporta? Semplicemente che l’esone nel quale le SS sono attive, non verrà riconosciuto dallo spliceosoma, il quale si legherà alle sequenze di splicing più vicine a monte e a valle dell’esone; la regione compresa tra queste due sequenze, quindi con l’esone compreso verrà trattata come se fosse un introne e verrà eliminato dal trascritto.
Il tutto si gioca sull’equilibrio tra SS e SE e sulle proteine che legano queste sequenze. In base alla prevalenza di una famiglia di proteine sull’altra si avrà la ritenzione o l’eliminazione dell’esone. In questo quadro, potrebbe essere influente anche la velocità alla quale il trascritto viene sintetizzato dall’RNA polimerasi, perchè in questo modo alcune sequenze potranno essere disponibili con tempi diversi e potranno competere tra di loro.
Da quanto detto se ne deduce che:
*Un esone può venire incluso o escluso dal trascritto maturo in base all’equilibrio SE-SS.
*Due esoni mutualmente esclusivi saranno regolati in base alle competizione tra le loro sequenze e i loro siti di splicing. Supponiamo di avere un esone A e un esone B, ciscuno con le sue SE e SS. Nel caso degli esoni mutualmente esclusivi, le sequenze dell’uno “influenzano” il destino dell’altro. Per cui, ad esempio, se l’esone A riesce a legare più proteine di B sulle sue ES, esclude l’esone B, e viceversa. Ovviamente prendete con le pinze il “riesce”, non è una gara, è soltanto una questione di equilibrio.
Lo splicing alternativo è, come dicevo, molto diffuso. Una cosa che è importante sapere è che è anche tessuto-specifico. Questo significa che tessuti diversi esprimono isoforme diverse dello stesso gene attraverso splicing alternativi. Infatti l’analisi dello splicing in diversi tessuti permette di stabilirne l’origine. Come è possibile manatenere splicing diversi in tessuti diversi? Molto spesso è dovuto all’espressione di fattori di splicjng diversi da tessuto a tessuto e questo determina eventi di splicing specifici. Il sistema nervoso è forse il tessuto che presenta il più alto grado di splicing alternativo tessuto specifico. Anche all’interno dello stesso sistema nervoso ci sono aree con diversi pattern di splicing.
Voglio concludere questo papiro con un esempio estremo di splicing alternativo. Questa volta non sarà l’essere umano ‘esempio, ma il nostro amico Drosophila. Il moscerino, durante lo sviluppo del suo sistema nervoso esprime una proteina chiamata “Dscam”. Questa proteina, espressa sui neuroni in via di sviluppo, è un recettore appartenente alla famiglia CAM (cell-adhesion-molecules), è quindi una proteina che media l’adesione cellula-cellula. Il gene di questa proteina è forse il più complesso gene che si sia mai visto, avendo ben 38016 varianti di splicing, solo lui. Se la drosophila ha circa 15 mila geni, solo dscam ha più varianti che tutti i suoi geni messi assieme. Questo perchè il gene in questione ha tre esoni, il 4, il 6 e il 9 che hanno rispettivamente 12, 48 e 33 varianti mutualmente esclusive, quindi soltanto una variante per esone è mantenuta nel trascritto maturo. Non ho fatto il calcolo combinatoriale, per cui non so dirvi se vengono effettivamente 38 mila e passa varianti, ma confido che chi l’ha fatto l’abbia fatto giusto. Spaventoso, vero? Non solo spaventoso, direi anche meraviglioso. Alla faccia di chi crede che solo l’uomo e i mammiferi sono degni di essere studiati. Ciascun neurone esprime una sola variante di splicing, e questo è necessario per mantenere l’identità neuronale stessa. Non credo che esistano due neuroni con la stessa isoforma Dscam. Non è ancora chiaro se la scelta venga fatta casualmente.
Spero di essere stato interessante, nonostante la lunghezza dell’articolo. come sempre se avete domande fatele! se desiderate saperne di più chiedete, posso consigliarvi numerosi articoli. Se notate errori, per favore, fatemelo sapere nei commenti. Alla prossima e Buone vacanze!