Generalmente un gene può essere in due stati, mutualmente esclusivi: acceso o spento. Quando un gene è acceso, si dice che è espresso, e questo significa che si trova in condizioni tali per cui il complesso sistema della RNA polimerasi II e dei fattori di trascrizione è in grado di leggere la sequenza del gene e sintetizzare una molecola di RNA messaggero complementare. Questo RNA messaggero viene chiamato anche trascritto. Un gene può essere espresso solo se la sua sequenza è fisicamente accessibile alle proteine trascrizionali. Se invece questa sequenza è condensata il gene non può essere espresso perché il complesso trascrizionale non può accedervi. Immaginate di avere un filo di lana, questo filo può essere disteso o condensato, convoluto su sé stesso a formare un gomitolo. Nel primo caso è accessibile nel secondo è inaccessibile. L’essere accessibile o no dipende da una serie di fattori che vengono studiati col termine di epigenetica. Dei circa 25000 geni che quasi ogni cellula umana possiede soltanto alcuni saranno “accesi”, mentre i restanti saranno silenziati. Il particolare pattern di espressione genica conferisce alle cellule fenotipi differenti. Quindi, cellule diverse (ad es epatociti, neuroni, macrofagi) pur avendo un genoma identico all’interno del loro nucleo, si comportano in maniera estremamente diversa perchè esprimono geni differenti. E’ però possibile identifcare dei geni che sono costantemente espressi in tutte le cellule; questi geni vengono detti Geni housekeeping, e sono generalmente geni coinvolti nelle funzioni basali di cui ogni cellula necessita. Inoltre, l’espressione genica non è costante nel tempo, ma varia al variare delle condizioni. Se si studia l’espressione genica di un tessuto ad esempio in condizioni di normossia prima e ipossia dopo, possiamo apprezzare una variazione dell’espressione di numerosi geni.
Ci sono diversi parametri che possiamo valutare per studiare l’espressione genica, in particolare possiamo misurare il cosiddetto trascrittoma, ovvero l’insieme dei trascritti che una cellula presenta in un determinato momento; oppure possiamo misurare le proteine.
Trovare il messaggero di un gene è la prima evidenza che il gene è espresso, per le ragioni che ho detto prima, anche se bisogna tenere conto di diversi fattori, come l’emivita del messaggero e il tasso di sintesi proteica. Per trovare e identificare i messaggeri (associarli cioè al gene da cui derivano) abbiamo due vie. La prima consiste nell’utilizzo della PCR quantitativa. Questa tecnica deriva dalla PCR normale che consiste nell’amplificare una determinata sequenza di DNA o RNA utilizzando due sequenze specifiche che si appaiano con le due regioni terminali della sequenza di interesse (a 5 primo e a 3 primo) o per le due regioni fiancheggianti (a destra e a sinistra) se la sequenza di interesse fa parte di una più lunga. Queste sequenze utilizzate sono chiamate primers e sono disegnate in modo che la DNA polimerasi sia in grado di amplificare esponenzialmente la sequenza compresa tra loro. La PCR è una tecnica che si basa su cicli di amplificazione. In ogni ciclo il numero di copie di una sequenza approssimativamente raddoppia (questo è vero solo per un determinato periodo, dopo l’amplificazione cessa di essere esponenziale); Attraverso l’utilizzo di sonde fluorescenti che aumentano il loro segnale all’aumentare del numero delle copie della sequenza di interesse noi possiamo rilevare attraverso dei sensori in tempo reale il ciclo al quale questo segnale fluorescente supera una determinata soglia che sarà calcolata in base al rumore di fondo della reazione, e grazie ad un sistema di calibrazione o taratura siamo in grado di risalire alla quantità di sequenza (DNA o RNA) iniziale. Una sequenza più abbondante determinerà un segnale positivo ad un ciclo di amplificazione minore, e viceversa. E’ una versione estremamente semplificata di un discorso più complesso, ma l’importante è il concetto: con una PCR quantitativa (o real time) siamo in grado di quantificare il numero di copie della sequenza (per la quale abbiamo disegnato i primer) in un determinato campione. Per come è stata disegnata, la Real Time PCR è una tecnica utile per quantificare in modo assoluto (in termini di concentrazione) un numero limitato di sequenze per volta. Per cui con questa tecnica riusciamo a quantificare un numero limitato di messaggeri per esperimento.
Però sempre più spesso noi vogliamo conoscere la situazione globale, analizzando l’espressione di centinaia/migliaia di geni contemporaneamente. Quello quindi che vogliamo ottenere è un Gene Expression Profile, per gli amici GEP. Ricorrere alla PCR quantitativa per fare un GEP è impensabile. Tradizionalmente per questi scopi vengono usati i cosiddetti Microarray.
Introduciamo il concetto di Microarray. Un Microarray è una piattaforma di vetro o simili, delle dimensioni di un vetrino da microscopio (chiamato arraychip). Su questa piattaforma sono caricate delle sequenze di DNA (se parliamo di DNA microarray), disposte in un ordine ben preciso a formare una matrice, di file e colonne.
Come ci finiscono delle sequenze su un vetrino? Il processo di Loading è ormai robotizzato, ed esistono due diversi metodi: gli spotted microarray in cui vengono caricate ordinatamente delle microgocce (spot) ciascuna con una concentrazione picomolare di una sequenza complementare e specifica ad un unico RNA messaggero. Ci sono anche gli in situ synthetised arrays, in cui le sequenze sono direttamente sintetizzate in situ, sul vetrino stesso. Quello che è importante capire è che in un modo o nell’altro avremo una griglia ordinata di cluster di sequenze e ciascuno di questi cluster è specifico per un unico trascritto.
Moltissime aziende biotecnologiche hanno messo sul mercato arraychip sempre più moderni e all’avanguardia e a prezzi sempre più competitivi (L’affymetrix, l’Illumina, l’Agilent technologies ecc..).
Ci sono Chips in grado di misurare l’espressione di 28000 geni per campione. Inoltre, l’affidabilità dei risultati è garantita dal fatto che ci sono più tipi di sonde per ciascun trascritto, per garantire specificità e riproducibilità dei risultati.
Ok, perfetto. Io ho questi chip, che possono comodamente stare in una mano, su questi chip sono caricati con un ordine ben preciso le sonde (sequenze) specifiche per un trascritto. Ma come faccio a misurare effettivamente l’espressione genica con questi chip? In parole povere,molto povere, si fa quanto segue:
1) Prima di tutto si disegna l’esperimento. Poniamo di volere analizzare l’espressione genica di cellule tumorali prelevate da una biopsia e confrontarla con il tessuto di origine. Questo tipo di esperimento ha lo scopo di esaminare quali sono quei geni che hanno un livello di espressione diverso nelle cellule tumorali rispetto al tessuto normale. E soprattutto, un esperimento di questo tipo permette di avere una visione d’insieme di tutti i geni espressi in un dato momento.
2) Si determinano i campioni da utilizzare, la ripetibilità, i controlli positivi e negativi e i costi dell’esperimento.
3) Si ordinano i chip scelti in modo che possano dare le risposte al tipo di esperimento disegnato
4) Si preparano i campioni, in questo caso un certo numero di biopsie tumorali e un certo numero di tessuti di controllo, dai quali si estrae l’RNA messaggero totale. Una volta estratto, l’RNA deve essere testato per la sua qualità. Visto che l’RNA ha una natura instabile tende a degradarsi. Per cui assicurarsi che i campioni non siano degradati è fondamentale.
5) Il passo successivo è la retrotrascrizione, Poiché come ho detto l’RNA è instabile, i messaggeri si retro trascrivono in DNA grazie alla Trascrittasi Inversa. Il problema è che dobbiamo trascrivere tutti i messaggeri presenti, per cui non possiamo usare primers specifici per ogni trascritto per ovvie ragioni. Si sfrutta pertanto la coda di poliA che viene aggiunta dopo la sintesi dell’RNA da una poliA polimerasi cellulare. Utilizzando un primer di poliT si retrotrascrive il filamento di DNA complementare. Quindi si ottiene un ibrido DNA/RNA. l’RNA viene digerito da una RNAasi, e si ottiene un singolo filamento di DNA. A questo punto, per sintetizzare il filamento di DNA complementare, o si usano i cosiddetti random primers, ovvero oligonucleotidi che per ragioni probabilistiche si appaieranno casualmente e quindi potranno dare inizio alla sintesi del filamento, oppure si sfrutta il fatto che il single strand DNA assume delle conformazioni particolari perchè è altamente idrofobico e quindi si ripiega su se stesso stabilizzandosi; in questo modo si sfrutta questo ripiegamento come se fosse un primer e si sintetizza il secondo filamento. Un passaggio fondamentale è quello di marcare, durante la retro-trascrizione, le sequenze di DNA con dei marcatori fluorescenti; in particolare si marcano le sequenze dei campioni tumorali con un fluoroforo (ad esempio la Cianina 5, Cy5 che a dispetto del nome ha un picco di emissione nel rosso, 670nm) e le sequenze retrotrascritte dai campioni di cellule sane con un fluoroforo diverso (ad es la Cy3 che ha un picco di emissione nel verde 570nm). La marcatura delle sequenze può essere diretta o enzimatica.
6)A questo punto, per ogni chip di microarray si mescolano un campione tumorale ed uno normale (ricordo che sono marcati in modo diverso) e si depositano micro-aliquote di questo mix per ogni spot sul vetrino di microarray (è tutto robotizzato). In questo modo le sequenze di DNA marcate dei campioni da analizzare si ibridano in modo proporzionale alla loro concentrazione alle sonde specifiche fissate sul microarray. In questo modo solo le sequenze che in modo specificano si legano alle sonde rimangono, quelle che invece non sono specifiche vengono successivamente “lavate via”. Questo avviene in ogni spot del microarray, laddove una sequenza marcata trovi una sua sequenza complementare e specifica.
7)La piastra di microarray, dopo che è avvenuta l’ibridazione, viene letta ad uno scanner con due laser (ad esempio un laser ad Argon e uno all’Elio/Neon che eccitano i fluorofori a particolari lunghezze d’onda, e questi in risposta emettono fotoni che vengono rilevati da un sensore. Viene quindi rilevata la fluorescenza delle sequenze marcate ibridate alle sonde. Gli spot in cui soltanto le sequenze tumorali si sono ibridate alle sonde fissate daranno un segnale rosso. Questo vuol dire che il gene del messaggero in questione era espresso solo nelle cellule tumorali e non nelle cellule normali. Se lo spot invece dà un segnale verde, allora vuol dire che quel messaggero era espresso solo nelle cellule normali. Se lo spot non dà nessun segnale, ovviamente il gene non era espresso in nessuno dei due campioni, ma i casi più frequenti sono le situazioni intermedie in cui abbiamo entrambi i segnali, stabilire l’intensità di questi segnali permette di capire quale dei due è più forte. Poiché la misurazione è influenzata anche dalla quantità di marcatori fluorescenti incorporata nelle sequenze da ibridare, è opportuno quantificare questo parametro.
Ovviamente tutti questi segnali vengono letti ed analizzati da software specifici e quello che noi otteniamo è una visione di insieme delle differenze di espressione genica di due campioni.
Quello che otteniamo quindi non è il valore assoluto, ma la quantità relativa dei messaggeri. Con la PCR quantitativa noi avevamo una quantificazione assoluta del messaggero, qui abbiamo una quantificazione relativa. Con una PCR quantitativa posso quantificare i messaggeri di poche decine di geni, con un microarray di ultima generazione posso quantificare relativamente l’espressione di tutti o quasi i geni di un organismo. In molti casi, per validare i risultati ottenuti con i microarray viene eseguita la PCR quantitativa sui geni che si ritengono essere più importanti. Con l’idea che se vedo la stessa cosa con due metodiche diverse, allora probabilmente sto vedendo una fenomeno reale.
Con i Microarray bisogna fare molta attenzione, innanzitutto si assume che l’efficienza di ogni passaggio del protocollo (dall’estrazione all’ibridazione) sia identica per ogni trascritto, e questo non possiamo dimostrarlo. Ripetere l’esperimento aiuta a eliminare gli errori casuali, ma non quelli sistematici, se ad esempio la retrotrascrizione di un messaggero non è efficiente, questo non si può modificare. Inoltre assumiamo che la quantità di messaggero sia direttamente proporzionale alla quantità di proteina, e questo non è sempre vero. Inoltre se anche vedessimo che un determinato gene è espresso dieci volte in più nel tumore rispetto al tessuto normale, non sarebbe comunque una prova definitiva che quel gene è implicato nella tumori genesi.
Contraddico ora ciò che ho detto poco fa. Il semplice rapporto tra l’intensità dei marcatori fluorescenti non è utilizzabile come misura della differenza di espressione di un gene in due campioni. Esiste un rumore di fondo, un background, che inizialmente era aggirato con l’utilizzo di cut-off. per cui, ad esempio, un gene si considerava differenzialmente espresso se il rapporto superava il 2 o scendeva sotto lo 0.5, ma questi sono cut off arbitrari e possono falsare i risultati. Molto spesso, si eseguono dei replicati, ovvero sullo stesso microarray un gene è rappresentato da più spot, sparsi casualmente sulla piastra, in modo da lavorare su delle medie e non su singoli valori. Ovviamente poi bisognerà eseguire dei test di ipotesi. L’analisi statistica dei risultati di un esperimento di Microarray e tutto tranne che banale. A seconda dei test che si usano possono venire risultati diversi. Quindi è molto difficile standardizzare e confrontare esperimenti eseguiti in laboratori diversi.
Resta comunque il fatto che i Microarray hanno dato un contributo fondamentale allo studio dell’espressione genica e hanno permesso di fare grandi passi avanti. I Microarray sono utilizzati per moltissime applicazioni, non solo per l’espressione genica. Ad esempio esistono gli SNPs Microarray, che servono per sondare la variabilità genetica interindividuale, e magari associare questa variabilità alle diverse risposte ai farmaci (Vedere l’articolo Non siamo tutti uguali. Questo articolo, sebbene smisuratamente lungo, è comunque una semplificazione notevole dell’argomento. la mia intenzione era queslla di illustrare nei principi generali la tecnica senza scendere troppo nei dettagli. Ecco comunque alcuni Link Utili, che rappresentano anche i siti da cui ho preso alcune delle informazioni per scrivere questo articolo
Una pagina curata dall’Università dello Utah
Link a cura della massima autoirità della bioinformatica, l’NCBI
Link sull’analisi dei dati di un esperimento di Array
Se avete domande o dubbi o se notate errori fatemelo notare senza problemi nei commenti. Provvederò a correggermi immediatamente. Grazie della pazienza, alla prossima.











Commenti recenti