La disponibilidad de la secuencia completa del genoma humano es el punto de partida para la ingente tarea de intentar comprender toda la información genómica, es decir, descifrar qué tipo de informaciones conlleva el genoma, cómo están codificadas, y sobre todo cómo se implementan de modo interactivo en el curso del desarrollo embrionario y durante la vida del organismo. Este último aspecto, que ocupa actualmente la atención de un gran número de investigadores biomédicos, se integra en el concepto de epigenómica e incluye la investigación con células madre, la diferenciación celular, la impronta genética, la senescencia y una gran parte de los procesos de regulación génica que tienen que ver con la organización del DNA en cromatina. La epigenómica nos recuerda que lo que se transmite de una célula a otra no es sólo el DNA sino la cromatina, es decir, la compleja estructura nucleoproteica que contiene toda la información genómica en organismos eucariotas así como sus modificaciones durante el desarrollo y la diferenciación celular. Precisamente la base estructural de la epigenómica son cambios en la estructura y la función de la cromatina acompañados de modificaciones químicas de sus componentes, las proteínas cromosomales y el DNA.
IDENTIDAD CELULAR
Es la transmisión fiel de estos cambios de una célula a otra la que garantiza la continuidad de la identidad celular, mientras que alteraciones de estas modificaciones epigenéticas conllevan cambios de identidad, ya sean fisiológicos, como la diferenciación celular, o patológicos, como la pérdida de diferenciación o el crecimiento incontrolado. Sólo tras la comprensión de estos complejos y múltiples aspectos de la transmisión de la información genómica será posible sacar partido plenamente a las posibilidades biológicas, médicas y sociales del conocimiento de la secuencia del genoma.
GENOTIPO Y FENOTIPO
Los biólogos describen los organismos vivos utilizando dos términos muy amplios: genotipo y fenotipo. El genotipo se refiere al conjunto de la información genética contenido en el genoma de un organismo que es recibido de sus antecesores y transmitido a su descendencia. En los organismos complejos los genomas paterno y materno se recombinan durante la reproducción sexual dando lugar a individuos con una composición genómica única. A menudo el genotipo se define como el conjunto de los genes de un organismo, pero esta definición es inexacta. Lo que se transmite de generación en generación no es sólo la información que codifica para proteínas o para RNA, los genes propiamente dichos, sino todo el DNA resultante de la fusión de dos células germinales, un espermatozoide y un óvulo, del cual sólo un pequeño porcentaje codifica para genes en el sentido clásico. Sabemos que el DNA contiene información reguladora usada por las proteínas para especificar cuándo y dónde se expresan los genes. Pero esta información ocupa una parte mínima del genoma. Descubrir y entender qué otra información encierra el resto del DNA y cómo las distintas informaciones se solapan unas con otras es uno de los retos de la investigación genómica.
El fenotipo describe la estructura del organismo, su forma y su tamaño, así como su función, que resultan en cada individuo de la ejecución de las instrucciones contenidas en su particular genotipo. La descripción del fenotipo y sus desviaciones es la tarea de los biólogos y los médicos desde hace siglos, aunque aún se siguen descubriendo nuevas especies y quedan una enorme cantidad por descubrir. La descripción del genotipo es mucho más reciente. Se inicia con Mendel de modo formal matemático y sólo desde hace algo más de medio siglo conocemos su substrato químico, el DNA. Aunque en algún momento de la evolución el RNA jugó un papel polifacético y esencial, en la inmensa mayoría de los organismos vivos actualmente el DNA es el portador de las instrucciones genéticas. Pero la naturaleza de las instrucciones codificadas en el DNA nos es conocida sólo en parte. Para comprender mejor los tipos de información contenidos en el DNA, es necesario prestar atención a las propiedades químicas de la molécula de DNA y no considerarla como un portador pasivo de genes.
A, T, C, G…
Muy a menudo en los libros y las revistas de biología o bioinformática el genoma se describe como una secuencia de letras A, T, C, G, los nucleótidos que componen la doble hélice. De ahí la metáfora de la escritura, que compara el genoma con un texto escrito. Es cierto que el DNA contiene la información necesaria para construir el organismo, y que esta información está de algún modo contenida en su secuencia de nucleótidos; pero no es una secuencia lineal de palabras o de instrucciones. El DNA es una estructura química tridimensional, lo que le diferencia tanto del texto escrito como de las instrucciones de un programa de ordenador.
En cierto sentido el DNA, siendo el substrato químico del genotipo, tiene también un fenotipo, una estructura, una forma dinámica que ejerce una función y está cargada también de información. Es importante dedicar cierta atención a esta estructura porque en ella están implícitas muchas de las propiedades del genoma que se manifestarán en su interacción con proteínas y en particular en su organización en cromatina dentro del núcleo celular. Muy recientemente se empieza a entrever que la particular secuencia de nucleótidos de la doble hélice del DNA impone a la molécula propiedades dinámicas que determinan su conformación tridimensional y sus propiedades topológicas, condicionando así su función.
Pero aun olvidando este aspecto estructural, desde el punto de vista meramente semántico, el texto genómico no es comparable a un texto literario en prosa. Si acaso se parece más a un criptograma abierto a múltiples interpretaciones, o mejor aún al texto cifrado de un mensaje secreto que es leído de modo diferente por distintos individuos. En el DNA, como en el mensaje secreto, se solapan diversos tipos de información escritos con las mismas unidades básicas, los nucleótidos, pero usando caracteres químicos o códigos distintos: interacción entre bases complementarias, reconocimiento de pares de bases, apilamiento de pares de bases consecutivas, etc. De este modo, el DNA comunica con distintos componentes de la célula transmitiendo a cada uno un mensaje específico.
CAMBIOS ESTRUCTURALES
Finalmente, en el proceso de la ejecución del mensaje genómico, el genoma se comporta como una estructura dinámica que responde con cambios estructurales y topológicos a interacciones con sus propios productos, las proteínas. Estos cambios son registrados a su vez por otras proteínas como instrucciones que modifican su lectura del mensaje genómico. De este modo el genoma se lee a sí mismo en un sinfín de versiones siempre cambiantes generando estructuras complejas cuya finalidad última es multiplicar, propagar y modificar el mensaje genómico. A lo largo de la evolución, en miles de millones de años, esta estrategia ha generado la maravillosa variedad de la biosfera que por primera vez una especie, la nuestra, está amenazando. La revolución genómica, que está llamada a cambiar nuestras vidas, debería contribuir también a que nuestra especie comprenda que es sólo una parte de una historia mucho más amplia y aprenda así a integrar al resto de los seres vivos con los que compartimos material genético en una estrategia responsable que garantice la biodiversidad.