domingo, 21 de abril de 2013

Computación y Biología comparten Teoría de la Evolución de Darwin


Científicos del Brookhaven National Laboratory y la Stony Brook University NY han descubierto que los principios de la teoría de la “supervivencia del más apto” de Charles Darwin se cumplen también en los sistemas computacionales. El análisis del genoma de 500 bacterias y de 200 000 paquetes Linux ha revelado que estas dos redes complejas utilizan el mismo mecanismo para expandir sus componentes claves. La razón de esta similitud estaría en que ambas son sistemas de acceso libre.

La teoría de la evolución por selección natural constituye el gran aporte de Charles Darwin. La selección natural es un fenómeno esencial de la evolución con carácter de ley general y que se define como la reproducción diferencial de los genotipos en el seno de una población biológica. La formulación clásica de la selección natural establece que las condiciones de un medio ambiente favorecen o dificultan, es decir, seleccionan la reproducción de los organismos vivos según sean sus peculiaridades. El concepto de aptitud es clave en la selección natural. Los individuos que son más aptos tienen mayor potencial de supervivencia. Por definición, los más aptos tienen más probabilidad de contribuir con descendientes a la siguiente generación, mientras que los menos aptos tendrán menos descendientes o morirán antes de alcanzar la edad adulta.
***
Evolución tecnológica ‘darwiniana’
La teoría de la “supervivencia del más apto” de Charles Darwin se refería originalmente a la selección natural de los sistemas biológicos. Ahora, una nueva investigación de los científicos del Brookhaven National Laboratory y de la Stony Brook University, NY, muestran que esta teoría de la evolución también es aplicable a los sistemas tecnológicos.
Sergei Maslov, Biologo Computacional y Bioinformático, miembro del personal de Investigación del Brookhaven National Laboratory (BNL), nombrado en el Departamento de Física y Astronomía de la Stony Brook University, realizó la investigación con el estudiante graduado Tin Yau Pang, comparando la frecuencia con la que “superviven” los componentes de dos sistemas complejos: el genoma bacteriano (biológico) y el sistema operativo Linux (computacional).
Su trabajo, “Distribución universal de frecuencias de componentes en sistemas biológicos y tecnológicos”, se ha publicado en la edición del 09/04/13 de Proceedings National Academy of Sciences (PNAS).
Selección natural ‘computacional’
Maslov y Pang se propusieron determinar por qué algunos genes especializados o programas informáticos son muy frecuentes, mientras otros no lo son, asimismo determinar el número de componentes que en cualquier sistema, por ser tan importantes para éste, no pueden ser eliminados.
“Si un genoma bacteriano no posee un gen requerido, será eliminado rápidamente”, comenta Maslov. ¿Cuántos genes con estas características existen?.
Esto mismo sucede en los sistemas de software. Éstos tienen múltiples componentes que trabajan conjuntamente, de tal manera que sólo se requiere de los componentes correctos, que trabajando en conjunto permitan una funcionalidad plena del sistema.
Utilizando datos de secuenciación masiva de genomas bacterianos, los investigadores examinaron la frecuencia de ocurrencia de genes en los genomas de 500 especies de bacterias y descubrieron una sorprendente similitud con la frecuencia de instalación de 200.000 paquetes de Linux en más de 2 millones de computadoras individuales.
Linux es un software de colaboración de código abierto que permite a los diseñadores modificar el código fuente para crear programas de uso público.

Linux es un núcleo libre de sistema operativo basado en Unix. Es un software libre. Está licenciado bajo la GPL v2 y está desarrollado por colaboradores de todo el mundo. El desarrollo del día a día tiene lugar en la Linux Kernel Mailing List Archive. El núcleo Linux fue concebido por el entonces estudiante de ciencias de la computación finlandés, Linus Torvalds, en 1991. Consiguió rápidamente desarrolladores y usuarios que adoptaron códigos de otros proyectos de software libre para su uso en nuevas distribuciones. Ha recibido contribuciones de miles de programadores de todo el mundo. Normalmente se utiliza junto a un empaquetado de software, llamado distribución Linux y servidores.
Una lógica universal
Los componentes usados con más frecuencia, tanto en los sistemas biológicos como de computadora son aquellos que permiten la mayor funcionalidad del sistema. Es decir, cuanto más un componente es necesario para otros componentes, es más probable que sea requerido para la funcionalidad completa del sistema.
Esto puede parecer lógico, pero lo sorprendente de este descubrimiento es la universalidad qie lo caracteriza.
“Ciertamente se esperaba que la frecuencia de utilización de cualquier componente estuviera correlacionado con el número de otros componentes dependientes de ella,” dijo Maslov. “Pero hemos encontrado que podíamos determinar el número de componentes esenciales - aquellos sin los que los otros componentes no pueden funcionar - por un simple cálculo que es válido tanto en los sistemas biológicos como en los sistemas informáticos.”
Tanto para las bacterias como para los sistemas informáticos, si tomamos la raíz cuadrada del número de componentes interdependientes, podremos encontrar el número de componentes claves, de tanta importancia que ningun otro elemento puede sobrevivir sin éstos.
Un sistema abierto de libre acceso
Este descubrimiento se aplica por igual a estas redes complejas porque ambas son ejemplos de sistemas de acceso libre con componentes que se instalan de forma independiente.
“Las bacterias son los como los ultimate BitTorrents de la biología”, dijo, refiriéndose a un popular protocolo de intercambio de archivos. “Ellas tienen un enorme fondo común de genes que comparten libremente las unas con las otras.
Los sistemas bacterianos pueden añadir o eliminar genes de su genoma a través de lo que se conoce como transferencia horizontal de genes, una especie de intercambio de archivos entre las bacterias “, dijo Maslov.
Lo mismo ocurre con los sistemas operativos Linux, que permiten la instalación gratuita de los componentes creados y compartidos por un gran número de diseñadores de forma independiente, el uno del otro. La teoría no sería válida para, por ejemplo, un sistema operativo Windows, que sólo ejecuta software de código cerrado (software licenciado).
(Publicación del artículo de investigación)
PNAS — Autores: Tin Yau Pang & Sergei Maslova
Artículo: “Distribución Universal de las Frecuencias de los Componentes en los Sistemas Biológicos y Tecnológicos”
Resumen:
Los genomas bacterianos y los proyectos de software de computador a gran escala consisten en un gran número de componentes (genes o paquetes de software) conectados a través de una red de dependencia mutua.
Los componentes pueden ser fácilmente añadidos o eliminados de los sistemas individuales, y su frecuencia de uso puede variar en muchos órdenes de magnitud. Estudiamos esta distribución de frecuencias en los genomas de ~ 500 especies de bacterias y en más de 2 millones de computadoras Linux y encontramos que en ambos casos se describe la misma distribución de ley de potencia de escala libre, con un pico adicional de distribución correspondiente a componentes casi universales.
Se argumenta que la existencia de una distribución de ley de potencia de frecuencias de los componentes es una propiedad general de cualquier sistema modular con una red de dependencia de varias capas. Se demuestra que la frecuencia de un componente se correlaciona positivamente con el grado de dependencia determinada por el número total de componentes de nivel superior cuyo funcionamiento depende directa o indirectamente del componente seleccionado.
Las distribuciones de grado de frecuencia/dependencia observados se reproducen en un modelo simple matemáticamente tratable introducido y analizado en este estudio.

No hay comentarios:

Publicar un comentario