El proyecto final de Ingeniería Biológica de la Lic. Camila Simoes es un trabajo en el área de Bioinformática, realizado en conjunto con la Unidad de Bioinformática del Institut Pasteur de Montevideo.
Las “enfermedades raras”, se caracterizan por tener una baja frecuencia en la población mundial. Se han identificado alrededor de 7000 enfermedades raras distintas en el mundo, número que crece a medida que aumenta la investigación en el área. Estas enfermedades a pesar de ser diversas, tienen en común ciertas características: tienen causas generalmente desconocidas, una gran parte de ellas no disponen de un tratamiento efectivo o correcto, tienen un diagnóstico inicial muchas veces erróneo y lleva un tiempo prolongado dar con diagnóstico preciso, y afectan generalmente a niños. Se estima que aproximadamente un 80% de las enfermedades raras tienen origen genético, lo que sumado a los grandes avances en tecnologías de secuenciación masiva de ADN, los análisis asociados y las técnicas de identificación de variantes, han permitido que aumente el conocimiento respecto a las causas moleculares de enfermedades raras. Es por ello que es importante, en parte, el desarrollo de herramientas de análisis que aporten al conocimiento general de este tipo de enfermedades. En este proyecto se realizó un prototipo de software y pipeline de procesamiento de datos genómicos, destinado al cálculo de la probabilidad de que la descendencia de un determinado individuo, se vea afectada por una enfermedad rara de base genética, de acuerdo a la población del otro progenitor. Para ello, el sistema de cálculo se vale de dos grandes conjuntos de datos: uno de referencia que aporta frecuencias alélicas de las variantes de interés en 26 poblaciones mundiales, y otro consiste en las variantes en el genoma o exoma del individuo a estudiar. A partir de procesos principalmente de filtrado y anotación, se acondicionan los datos y se buscan las variantes posiblemente asociadas a enfermedades raras en el genoma del sujeto, para luego realizar el cálculo correspondiente. Finalmente, la herramienta aporta una lista que contiene las variantes identificadas, las probabilidades de que la descendencia sea afectada según 26 poblaciones mundiales, e información específica sobre cada variante, tanto de características a nivel genómico como del fenotipo que causa. Luego de la implementación del prototipo, el mismo fue aplicado sobre datos de 30 pacientes sanos de la fase 2 del proyecto URUGENOMES. Con los resultado obtenidos se realizó un breve análisis estadístico con el fin de estudiar la distribución de las variantes en las poblaciones y la asociación con la ancestría de los sujetos estudiados.