Encontrar la fuente de virus a partir de secuencias genómicas puede llevar años de investigación de campo intensiva y trabajo de laboratorio. Estos retrasos pueden dificultar la implementación de medidas preventivas, como la vacunación o la prevención de contactos peligrosos entre especies y humanos.
En esta ocasión, con la ayuda de expertos en análisis de datos, los investigadores estudiaron los genomas de más de 500 virus para programar algoritmos de Machine Learning que hicieran coincidir los patrones incrustados en los genomas virales con sus orígenes animales.
Estos modelos fueron capaces de predecir con precisión el huésped animal de cada virus, si el virus requería la picadura de un factor que se alimenta de la sangre y, de ser así, si el vector es una garrapata, un mosquito, un o una mosca.
A continuación, los investigadores aplicaron los modelos a virus para los cuales aún no se conocen los huéspedes y los factores, como la fiebre hemorrágica del Congo de Crimea, el Zika y el MERS. Los anfitriones predichos por el modelo a menudo confirmaron las estimaciones conocidas en cada caso.
La investigación además descubrió que dos de las cuatro especies de ébola que se suponía tenían un reservorio de murciélagos en realidad tenían un apoyo igual o más fuerte que los virus de primates, lo que podría apuntar a una fuente de primates no humanos, en lugar de murciélagos, de algunos brotes de ébola.
Con este tipo de investigaciones se pone de manifiesto la utilidad real a gran escala de las técnicas de Data Analysis y Machine Learning y las posibilidades que ofrecen en aspectos relativos a la anticipación de problemas futuros.
Este tipo de técnicas, utilizadas en el mundo empresarial, nos suponen una gran herramienta de prevención y depuración de errores y proporcionan una gran ventaja a las corporaciones que las integran en sus actividades cotidianas.
Si quieres saber más sobre el análisis de datos y su utilidad en el mundo corporativo visita nuestra página.