RAPPRESENTAZIONE DEL CODICE GENETICO
ALLA LUCE DELL'INTERPRETAZIONE BINARIA DA NOI PROPOSTA.


clicca sotto per tornare all'articolo principale:
http://it.geocities.com/kenoms3/codice_degenerato_dna.html



Ciasuna tripletta codificata dal codice è rappresenta da sette cifre binarie di cui la prima indica il "valore binario" già individuato nella nostra ricerca sul "codice entelechico" e comunque riportata sotto:


A
B
C
D
A
1
0
1
1
B
0
0
1
0
C
1
0
1
1
D
0
0
1
0

Ciascuna delle lettere di questa tabella indica una determinata base secondo lo schema seguente:

A= U, B= C, C= A, D= G (pertanto il quadrato CD è associato alla basi Adenina (A) - Guanina (G))

Mentre le altre cifre corrispondono ai valori binari associati a ciascuna delle basi che costituiscono i "codoni", ovvero:

U = 00 / C = 01 / A =  10 / G = 11 dato che (2^2 = 4)

Pertanto la rappresentazione binaria completa del codice genetico (4^3=64) sarà la seguente:

   

   

A
B
C
D
A
 UUU - 1000000 Phe (0)
UUC - 1000001 Phe (1)
UUA - 1000010 Leu (2)
UUG - 1000011 Leu (3)
 UCU - 0000100 Ser (4)
UCC - 0000101 Ser (5)
UCA - 0000110 Ser (6)
UCG - 0000111 Ser (7)
 UAU - 1001000 Tyr (8)
UAC - 1001001 Tyr (9)
UAA - 1001010 Stop (10)
UAG - 1001011 Stop (11)
 UGU - 1001100 Cys (12)
UGC - 1001101 Cys (13)
UGA - 1001110 Stop (14)
UGG - 1001111 Try (15)
U
C
A
G
B
 CUU - 0010000 Leu (16)
CUC - 0010001 Leu (17)
CUA - 0010010 Leu (18)
CUG - 0010011 Leu (19)
 CCU - 0010100 Pro (20)
CCC - 0010101 Pro (21)
 CCA - 0010110 Pro (22)
CCG - 0010111 Pro (23)
 CAU - 1011000 His (24)
CAC - 1011001 His (25)
CAA - 1011010 Gln (26)
CAG - 1011011 Gln (27)
 CGU - 0011100 Arg (28)
CGC - 0011101 Arg (29)
CGA - 0011110 Arg (30)
CGG - 0011111 Arg (31)
U
C
A
G
C
 AUU - 1100000 Ile (32)
AUC - 1100001 Ile (33)
AUA - 1100010 Ile (34)
AUG - 1100011 Met/ Start (35)
 ACU - 0100100 Thr (36) 
ACC - 0100101 Thr (37)
ACA - 0100110 Thr (38)
ACG - 0100111 Thr (39)
 AAU - 1101000 Asn (40)
AAC - 1101001 Asn (41)
AAA - 1101010 Lys (42)
AAG - 1101011 Lys (43)
 AGU - 1101100 Ser (44)
AGC - 1101101 Ser (45)
AGA - 1101110 Arg (46)
AGG - 1101111 Arg (47)
U
C
A
G
D
 GUU - 0110000 Val (48)
GUC - 0110001 Val (49)
GUA - 0110010 Val (50)
GUG - 0110011 Val (51)
 GCU - 0110100 Ala (52)
GCC - 0110101 Ala (53)
GCA - 0110110 Ala (54)
GCG - 0110111 Ala (55)
 GAU - 1111000 Asp (56)
GAC - 1111001 Asp (57)
GAA - 1111010 Glu (58)
GAG - 1111011 Glu (59)
 GGU - 0111100 Gly (60)
GGC - 0111101 Gly (61)
GGA - 0111110 Gly (62)
GGG - 0111111 Gly (63)
U
C
A
G

Le ultime 6 cifre binarie corrispondono ciascuna ai valori decimali compresi tra 0 e 63 (per un totale di 64 messaggi). La prima cifra binaria, in un certo senso, possiamo invece fingerla come una rappresentazione di positivo e negativo ed, in ogni caso,  specifica se il codone appartiene ad una serie con un grado di degenerazione 1 (il valore in quel caso è zero) oppure a un grado di degenerazione 2 o 3 (il valore in quel caso è 1). La rappresentazione binaria così ottenuta ci consente a questo punto di  avere  tutte le informazioni necessarie per la classificazione  non arbitraria di ciascuna tripletta.

Facciamo un esempio:

0110000 indica in maniera univoca che si tratta di un amminoacido con grado di degenerazione "1", posto nel quadrato DA è ed il primo codone di quel quadrato. E ciò è facilmente dimostrabile confrontando le due tabelle sopra riportate. Le sei cifre finali inoltre identificano inequivocabilmente la tripletta GUU.

Questo sistema ci pare così  una delle strategie più semplici da adottare per l'identificazione immediata degli amminoacidi utilizzando sistemi elettronici di trasmissione dei dati digitali.

La nostra rappresentazione binaria del codice genetico porta inoltre ad ulteriori due conseguenze:

1) Esiste una singolare corrispondenza tra la rappresentazione binaria delle basi che compongono i nucleotidi degli acidi nucleici del RNA (e del DNA sostituendo la timina all'uracile) e la loro capacità di legarsi reciprocamente. Come è noto la la citosina (C) si lega alla guanina (G), mentre l'uracile (U) si lega alla adenina (A). Come abbiamo visto, inoltre, l'uracile ha rappresentazione binaria 00 e l'adenina 10, mentre la citosina ha rappresentazione 01 e la guanina guanina 11. Si noti dunque come si vengono a creare le seguenti coppie binarie:
(U) 00 - (A) 10
(C) 01 - (G) 11

Se utilizziamo la rappresentazione convenzionale binaria del segno più e meno (per cui il valore positivo è assunto da 0 mentre il valore negativo è assunto da 1), otterremo:
(U) 00 > +0 - (A) 10 > -0
(C) 01 > +1 - (G) 11 > -1

Ora non sappiamo se la rappresentazione che produciamo abbia un effettivo significato naturale (*); tuttavia rappresenta una strategia tanto semplice quanto efficace per evidenziare il dato biologico: Uracile si lega con adenina e ad U +0 corrisponde A -0; citosina si lega a guanina e a C +1 corrisponde G -1

2) la seconda conseguenza è quella di individuare una strategia generale adottata dalla natura per la costruzione dei codici chimici basata sulla matematica binaria (vedi il capitolo "una rifelssione multidisciplinare" nella pagina web:http://it.geocities.com/kenoms3/saccaridi.html). La natura ha realizzato il linguaggio del DNA e del RNA come una grammatica generativa (secondo la definizione di Noam Chomsky) che sfrutta le stesse strategie dei moderni calcolatori digitali.

Esaminando con più attenzione la tabella binaria del codice genetico ci accorgiamo, inoltre, come la stessa sia all'origine della stessa tabella del codice entelechico. Se infatti consideriamo il valore binario dei primi due amminoacidi di ciascuna tripletta (U = 00, C = 01, A= 10, G = 11) otteniamo sedici coppie così suddivise:



A
B
C
D
A
0000
0001
0010
0011
B
0100
0101
0110
0111
C
1000
1001
1010
1011
D
1100
1101
1110
1111

Come si vede questa tabella mostra le stesse proprietà della tabella del codice entelechico:

1)  la riga orizzontale AA,BB, CC,DD è perfettamente speculare alla riga DA,DB,DC,DD letta in senso inverso e, analogamente, la riga BA,BB,BC,BD risulta speculare alla riga CA,CB,CC,CD letta in senso inverso;
2) la riga verticale AA,AB,AC,AD è perfettamente speculare alla riga DA,DB,DC,DD letta in senso inverso e lo stesso discorso vale per le righe verticali BA,BB,BC,BD e CA,CB,CC,CD;

Per rendere evidente questo discorso facciamo l'esempio delle righe orizzontali

LINEE ORIZZONTALI

AA 0000 - AB 0001 - AC 0010 - AD  0011
DD 1111 - DC 1110 - DB 1101 - DA 1100

BA 0100 -  BB 0101 -  BC 0110 - BD  0111
CD 1011 - CC 1010 -  CB 1001 - CA  1000

La disposizione delle sequenze binarie (di quattro cifre sia per il codice entelechico binario che per il codice genetico binario) mostra sempre specularità (**).

La tabella del codice entelechico è dunque, necessariamente, derivata dalla  disposizione bianaria dei 64 codoni che formano il codice genetico. Appare altresì evidente che l'ordine delle cifre binarie del codice entelechico è l'unico ordine matematicamente possibile (in campo binario) per rappresentare la simmetria della tabella del codice genetico binario. Dunque i gradi di degenerazione del codice genetico non sono arbitrari, ma conseguenti ad un preciso ordine naturale.

Da tutto quanto scoperto, ed esposto, ne deriva necessariamente che:

a) il codice genetico è sempre stato a quattro basi;
b) il codice genetico è sempre stato realizzato attraverso 64 codoni  di tre basi ciascuno (***);
c) l'ordine di degenerazione del codice genetico non è casuale o arbitrario, ma la conseguenza naturale dell'ordine binario del codice genetico


__________________________________________________________________

(*) Volendo forzare l'interpretazione potremmo immaginare che una delle cifre binarie, anche alla luce dei diversi nucleotidi che polimerizzano per formare il DNA e lo RNA, è determinata dall'appartenenza della base azotata alle piramidine o alle purine (per cui citosina, timina e uracile hanno valore 0 mentre guanina e adenina hanno valore 1) mentre l'altra cifra binaria potremmo immaginarla determinata dalla capacità delle quattro basi azotate di legarsi con due o tre ponte a idrogeno (uracile - timina nel DNA - e adenina si legano con due ponti a idrogeno entrambi identici, e di senso contrario, a quelli che legano la citosina e la guanina e dunque hanno valore binario 0. Citosina e guanina si legano con tre ponti a idrogeno di cui due identici, e di senso contrario a quelli di uracile - timina nel DNA - e adenina, e dunque hanno valore binario 1). Tuttavia si tratta di una supposizione non adegutamente supportata dai fatti e dunque nulla più di un "instrumentum laboris".

(**) Il requisito della specularità sembra davvero un elemento fondamentale del codice genetico a tutti i livelli, ad esempio: a) l'uracile si lega con l'adenina e la citosina con la guanina secondo il principio della specularità. Infatti, come abbiamo visto, da un punto di vista chimico, l'uracile (timina nel DNA) e la citosina sono piramidine mentre l'adenina e la guanina sono purine (inoltre l'adenina in posizione 6 ha un NH2 mentre l'uracile e la timina in posizione 6 hanno un C=O mentre la guanina in posizione 6 ha un C=O e la citosina in posizione 6 ha un NH2). Dal punto di vista binario abbiamo visto che a uracile 00 (+0) corrisponde adenina 10 (-0) mentre a citosina 01 (+1)corrisponde guanina 11 (-1); b) la doppia elica del DNA è una struttura speculare nella quale un polinucleotide corre in direzione 5'-3' mentre l'altro corre in direzione 3'-5'; c) l'informazione biologica portata dall'elica stampo DNA viene letta in direzione 3'-5' mentre la sintesi della nuova molecola RNA viene letta in direzione 5'-3'; d) alcune sequenze nucelotidiche identiche si presentano ripetute in orientazioni opposte all'interno di una molecola di DNA, o adiacenti le une alle altre ovvero a qualche distanza l'una dall'altra (sono i cosiddetti ripetuti invertiti).
In un certo senso possiamo considerare un ulteriore esempio di specularità nei geni sovrapposti di alcuni virus: a livello di genoma si nota, infatti, come alcuni virus (ad esempio il virus dell'epatite B) tendono a leggere la stessa sequenza nucleotidica secondo schemi diversi per sintetizzare due o più differenti proteine. Questi schemi diversi rappresentano uno speciale tipo di specularità. Ad esempio NEI GENI E e D di ΦX174 (vedi p. 266 di T.A.BROWN, "Genetica: un abbroccio molecolare", Piccin, Padova, 2001):

          METVAL                LYSGLUSTOP                                  GENE E 
GTTTATGGTA              GAAGGAGTGATG  
VALTYRGLY                 GLUGLYVALMET                             GENE D

Quest'ultima strategia estremamente utile negli organismi più semplici, perché consente di ridurre al minimo la quantità di DNA / RNA necessaria per codificare le proteine, è poi stata in gran parte abbandonata nel corso dell'evoluzione in quanto, quando una mutazione altera un singolo nucleotide, le proteine virali o cellulari coinvolte possono essere non più solo una, ma due o più. A nostro avviso è, dunque, probabile che alcuni tra i primi organismi viventi (sfruttando il principio della specularità che risponde altresì anche ad esigenze di economicità) presentassero lo schema della doppia lettura del genoma per, successivamente, abbandonarlo in favore di una meno efficiente, ma assai più sicura, codifica univoca.
Tornando ad ulteriori esempi di specularità (e contemporaneamente di logica binaria) presenti nel mondo del vivente possiamo citare:
a) la regolazione genica del fago lambda. Nel fago lambda osserviamo infatti la presenza di interrutori del tipo on / off (0/1), la presenza di molti geni diversi alcuni dei quali trascritti verso destra e altri verso sinistra, la presenza di operatori PRM e PR orientati in direzione 'coda-coda' chel legano la RNApolimerasi e la fanno viaggiare a destra per trascrivere il gene 'cro' e a sinistra per trascrivere il repressore 'cI'. Nel fago lambda, inoltre, la scala di affinità di 'cro' per i tre siti di legame presenti in OR è esattamente opposta a quella del repressore CI;

A titolo di esempio, per quanto attiene i meccanismi interrutori nel fago lambda si riportano gli stati fisiologicamente importanti dell'operatore OR di lambda occupato da cro:
PR UP-1
0R3
0R2
OR1
PR
ACCESO
0
0
0
ACCESO
SPENTO
1
0
0
ACCESO
SPENTO
1
1
0
SPENTO
SPENTO
1
0
1
SPENTO
SPENTO
1
1
1
SPENTO



b) i meccanismi epigenetici embrionali. Consideriamo, ad esempio, un embrione di Drosophila allo stadio di blastula precoce. In questa fase la cellula uovo originaria non si è ancora divisa, ma il suo nucleo è già andato incontro a numerosi cicli di divisione, per cui all'interno dlla cellula sono presenti migliaia di nuclei allineati lungo la superficie interna. Grazie alle diverse distribuzioni presenti all'interno della cellula uovo di moleole segnale capaci di innescare l'espressione genica (è noto che la porzione posteriore dell'uovo presenta un ambiente cellulare diverso da quella anteriore e si ritiene che anche la concentrazione di alcune sostanze nella porzione ventrale sia diversa da quella dorsale) ogni nucleo, percependo le diverse concentrazioni di questi fattori, riesce, in qualche modo, a decifrare la propria posizione all'interno dell'uovo e ad innescare uno specifico programma di espressione genica. E' molto probabile, dunque, che la variazione di concentrazione all'interno della cellula uovo di una particolare proteina regolatrice sia sufficiente a innescare gli interrutori genici di Drosophila. Da notare come la variazione di concentrazione possa essa stessa essere considerata un interruttore del tipo 0/1 (in presenza di una certa concentrazione il meccanismo è attivato mentre in assenza il meccanismo non è attivato);
c) se passiamo dal livello subcellulare all'istologia ci accorgiamo che sono ancora presenti elementi di natura binaria e di natura speculare. Sono elementi di natura binaria, ad esempio, i connessoni che possono avere uno stato on / off (0/1). Hanno elementi di natura speculare le cellule epiteliali con una estemità apicale che risulta ben distinta dall'estremità basale.

(***) Assolutamente infondata è dunque la teoria proposta da alcuni scienziati che ritengono che, all'inizio, il codice genetico contenesse solo sedici messaggi diversi, ipotesi riportata anche in questo passaggio di un articolo pubblicato dall'Università di Catania nel proprio sito (http://www.unict.it/psmfn/GENOMA.htm):
"La parte sorprendente e non ancora chiarita, è che siccome le basi nucleiche sono quattro, le combinazioni di triplette possibili sono 43 = 64. Il codice genetico ha quidi la possibilità di individuare 64 amminoacidi differenti, mentre nelle proteine la natura ne utilizza soltanto 20. Non si comprende ancora il perché di questo spreco di possibilità, che si concretizza nel fatto che ci sono molte triplette di basi nucleiche che specificano lo stesso amminoacido pur essendo diverse fra loro. In altre parole, il codice genetico è sovradimensionato, ad almeno così ci appare fino adesso. Alcuni pensano che inizialmente il codice fosse binario, che cioè bastassero due basi per specificare un amminoacido. In questo caso però 42 = 16, e cioè si potevano specificare soltanto 16 amminoacidi diversi. Quando l’evoluzione ha portato ad una maggiore complessità, e la natura ha avuto bisogno di inserire 20 amminoacidi nella catena proteica, allora il codice del DNA èdivenuto ternario. Tuttavia, il divario fra 16 e 64 ammonoacidi appare troppo grande. La natura ci ha abituati ad una grande semplicità ed economia nei suoi processi. E’ probabile che ulteriori studi ci permetteranno di vedere meglio in questo problema".

11 novembre 2006


Web site analytics