{"id":7372,"date":"2026-03-12T17:11:12","date_gmt":"2026-03-12T20:11:12","guid":{"rendered":"https:\/\/ingbio.paap.cup.edu.uy\/?page_id=7372"},"modified":"2026-03-12T17:11:13","modified_gmt":"2026-03-12T20:11:13","slug":"desarrollo-de-un-score-de-patogenicidad-basado-en-machine-learning-para-la-priorizacion-de-variantes-genomicas-en-el-contexto-de-genomica-medica","status":"publish","type":"page","link":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/desarrollo-de-un-score-de-patogenicidad-basado-en-machine-learning-para-la-priorizacion-de-variantes-genomicas-en-el-contexto-de-genomica-medica\/","title":{"rendered":"Desarrollo de un score de patogenicidad basado en machine learning para la priorizaci\u00f3n de variantes gen\u00f3micas en el contexto de gen\u00f3mica m\u00e9dica"},"content":{"rendered":"<div class=\"entry-content\" itemprop=\"text\">\n\n<p>Las variantes gen\u00f3micas representan alteraciones en la secuencia de ADN de un individuo en comparaci\u00f3n con un genoma de referencia. De las millones de variantes identificadas en humanos, solo una peque\u00f1a fracci\u00f3n tiene un impacto biol\u00f3gico negativo y puede ser causante de diversas enfermedades gen\u00e9ticas. Las consecuencias de estas variantes dependen de la regi\u00f3n gen\u00f3mica afectada, ya sea codificante, reguladora o involucrada en procesos post-transcripcionales. Este proyecto se enfoca en variantes que impactan el splicing, un proceso esencial en la maduraci\u00f3n del ARN mensajero (ARNm). Las variantes en estas regiones pueden dar lugar a la retenci\u00f3n de intrones o la exclusi\u00f3n de exones en el ARNm maduro, lo que altera la secuencia y funci\u00f3n de las prote\u00ednas resultantes, y potencialmente conduce a enfermedades.<\/p>\n\n\n\n<p>A pesar de los avances significativos en las tecnolog\u00edas de secuenciaci\u00f3n de nueva generaci\u00f3n (NGS), que han revolucionado la capacidad de analizar el genoma humano y mejorar el diagn\u00f3stico de enfermedades de base gen\u00e9tica, la interpretaci\u00f3n de los enormes vol\u00famenes de datos generados sigue siendo un desaf\u00edo considerable. El an\u00e1lisis de datos masivos derivados de NGS requiere herramientas computacionales avanzadas para facilitar su manejo y extracci\u00f3n de informaci\u00f3n biol\u00f3gica relevante. En este contexto, el aprendizaje autom\u00e1tico ha emergido como una soluci\u00f3n poderosa para mejorar la interpretaci\u00f3n de variantes gen\u00e9ticas, permitiendo el entrenamiento de modelos predictivos con grandes conjuntos de datos y la identificaci\u00f3n de patrones complejos que pueden predecir el impacto de estas variantes sobre la salud.<\/p>\n\n\n\n<p>Este trabajo tuvo como objetivo desarrollar un score de patogenicidad mediante m\u00e9todos de aprendizaje autom\u00e1tico, enfocado en la clasificaci\u00f3n de variantes gen\u00f3micas que afectan el mecanismo de splicing. Este score est\u00e1 orientado a mejorar el diagn\u00f3stico de pacientes con enfermedades gen\u00e9ticas, con \u00e9nfasis particular en las enfermedades raras. Para este estudio, se recolectaron variantes de tres bases de datos principales: ClinVar, 1000 Genomas y Urugenomes (datos locales). ClinVar proporcion\u00f3 la mayor\u00eda de las variantes clasificadas como patog\u00e9nicas, mientras que 1000 Genomas y Urugenomes aportaron variantes consideradas benignas (sin efecto delet\u00e9reo), adem\u00e1s de informaci\u00f3n poblacional espec\u00edfica para Uruguay.<\/p>\n\n\n\n<p>Una vez reunidos los datos, se incorporaron features mediante la anotaci\u00f3n funcional de variantes con herramientas como ANNOVAR y VEP, permitiendo incorporar informaci\u00f3n gen\u00f3mica, frecuencias poblacionales, predictores in silico y datos cl\u00ednicos. Se pre-procesaron los datos aplicando filtros para seleccionar variantes que afectan sitios de splicing, ya sea en posiciones can\u00f3nicas o en regiones pr\u00f3ximas a estos, y se imputaron valores faltantes mediante KNN. Para el entrenamiento, se emple\u00f3 validaci\u00f3n cruzada anidada junto con GridSearch para la selecci\u00f3n de hiperpar\u00e1metros. Se exploraron diversos modelos de clasificaci\u00f3n (KNN, SVM, Random Forest y XGBoost) con m\u00faltiples combinaciones de par\u00e1metros, buscando maximizar el rendimiento predictivo.<\/p>\n\n\n\n<p>Los resultados obtenidos en este trabajo final de grado muestran que el modelo XGBoost alcanz\u00f3 un rendimiento s\u00f3lido, con una exactitud del 85% y una puntuaci\u00f3n F1 de 87%. Este desarrollo representa un paso preliminar hacia la creaci\u00f3n de una herramienta de asesoramiento diagn\u00f3stico que, en el futuro, podr\u00eda mejorar la precisi\u00f3n cl\u00ednica en el diagn\u00f3stico de muchos pacientes.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"724\" height=\"1024\" src=\"https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-724x1024.png\" alt=\"\" class=\"wp-image-7374\" srcset=\"https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-724x1024.png 724w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-212x300.png 212w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-106x150.png 106w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-768x1086.png 768w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-1086x1536.png 1086w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-1448x2048.png 1448w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1-1414x2000.png 1414w, https:\/\/ingbio.paap.cup.edu.uy\/wp-content\/uploads\/2026\/03\/Poster_CICADA-1.png 1768w\" sizes=\"auto, (max-width: 724px) 100vw, 724px\" \/><\/figure>\n\n\n<\/div>\n","protected":false},"excerpt":{"rendered":"<div class=\"entry-summary\" itemprop=\"text\">\n<p>Las variantes gen\u00f3micas representan alteraciones en la secuencia de ADN de un individuo en comparaci\u00f3n con un genoma de referencia. De las millones de variantes identificadas en humanos, solo una peque\u00f1a fracci\u00f3n tiene un impacto biol\u00f3gico negativo y puede ser causante de diversas enfermedades gen\u00e9ticas. Las consecuencias de estas variantes dependen de la regi\u00f3n gen\u00f3mica &#8230;<\/p>\n\n<\/div>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-7372","page","type-page","status-publish","hentry","entry-lead"],"_links":{"self":[{"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/pages\/7372","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/comments?post=7372"}],"version-history":[{"count":1,"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/pages\/7372\/revisions"}],"predecessor-version":[{"id":7375,"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/pages\/7372\/revisions\/7375"}],"wp:attachment":[{"href":"https:\/\/ingbio.paap.cup.edu.uy\/index.php\/wp-json\/wp\/v2\/media?parent=7372"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}