Revista Ciencia
En entradas anteriores hemos explicado cómo el Dogma central de la Biología Molecular –establecido a finales de los años cincuenta del Siglo XX por Francis Crick– proponía la relación directa entre un gen y una proteína. De igual modo, en otra entrada distinta expusimos que el número de genes contenidos en los más de 3.000 millones de pares de bases de ADN que tiene el genoma humano era de unos 20.000-22.000. Pero esto no quiere decir que todo ese ADN esté “ocupado” por los genes. Es decir, no todo el ADN presente en una célula es ADN cuya última función sea la de producir una proteína.
En Biología Molecular, al referirnos al ADN que da lugar a una proteína hablamos de ADN codificante y éste, en el caso del ser humano, sólo representa entre el 1,5 y el 2 % del ADN total presente en nuestras células. Cuando se descubrió este hecho, cuando se vio que la práctica totalidad del ADN no daba lugar a proteínas, se pensó que era un ADN inútil, que no servía para nada. Se propuso entonces que ese ADN podía ser los restos de todo un proceso evolutivo cuyo resultado final es la especie humana tal y como la conocemos hoy en día. Por ese motivo, a ese ADN se le llamó ADN basura.
Pasado el tiempo se empezó a sospechar que el calificativo puesto a ese material genético era del todo erróneo. Algunas evidencias hacían pensar que al menos parte del mal-llamado ADN basura podía tener alguna función relacionada con el control de la expresión de ciertos genes, la reparación del ADN o el marcaje de sitios concretos en el genoma. Pero fue, definitivamente el proyecto ENCODE (Enciclopedia de los Elementos del ADN), cuya publicación vio la luz en el verano de 2.012, el encargado de poner en valor al denostado ADN no codificante. Así, una de las conclusiones arrojadas por el proyecto fue la de comparar al ADN basura con un gigantesco panel de control con millones de interruptores que encendía y apagaban genes. Ahora sabemos que cuándo y dónde se produce la expresión de una proteína son cuestiones que no quedan resueltas por la secuencia de ADN en la que se encuentra codificada dicha proteína –el gen–, sino que viene determinado por ADN codificante que antes creíamos sin valor alguno.