Última modificación: 2019-08-31
Resumen
Los avances técnicos en recolección, almacenamiento y procesamiento de información de diferente naturaleza, es decir, información estructurada como por ejemplo datos clínicos presentados en tablas, e información no estructurada contenida por ejemplo en imágenes diagnósticas; junto con la tendencia creciente a compartir de manera libre enormes bases de datos, han apalancado en la última década lo que en 1980 Tukey acuñó con el término de análisis exploratorio de datos.
El análisis exploratorio de datos permite un tipo de investigación conducida por los datos y consistente en la inspección de los mismos a fin de encontrar y extraer información significativa que permita la formulación de preguntas investigativas, construcción de hipótesis y creación de nuevo conocimiento alrededor del sujeto o fenómeno asociado a los datos.
La analítica visual que integra técnicas de aprendizaje autónomo, estadística y visualización interactiva de información favorece la creación de herramientas que les permitan a los especialistas una correcta aproximación a los datos y un uso optimo de los mismos en el marco de la investigación exploratoria.
En dominios como la economía y la inteligencia de negocios se ha demostrado la utilidad de herramientas de análisis visual y consideramos que el campo de las neurociencias y específicamente el estudio de la relación entre la estructura física del cerebro y el funcionamiento del mismo, puede de la misma manera beneficiarse significativamente de herramientas de análisis exploratorio.
Después de una revisión bibliográfica, encontramos que uno de los limitantes de las herramientas propuestas hasta ahora es la especialización de cada una de ellas a un tipo de información y la necesidad de los especialistas de utilizar más de una herramienta si quieren analizar diferentes tipos de datos de un mismo sujeto. Asimismo, en las herramientas propuestas, los autores suelen seleccionar ya sea técnicas meramente de visualización o técnicas meramente de aprendizaje automático y además suelen orientarlas únicamente a un tipo de especialistas, ya sean neurólogos, psicólogos, trabajadores sociales, etc.
Esta tesis busca proponer un modelo híbrido que permita el análisis exploratorio de información heterogénea combinando la ingeniería de características (Feature Engineering) con técnicas de análisis visual (Visual Analytics), teniendo siempre como centro a los especialistas y permitiendo la interacción de profesionales de distintas especialidades.
Uno de los casos de estudio que se tiene previsto abordar es el análisis de una cohorte de jóvenes de 20 años nacidos prematuros, centrado en la información de estructuras cerebrales y paradigmas por ejemplo de miedo y coordinación registrados en imágenes MRI, fMRI y DTI.
Este proyecto cuenta con el acompañamiento de expertos de la fundación Canguro con quienes tenemos un acuerdo de análisis conjunto de los datos asociados al caso de estudio mencionado.
Se espera que el modelo propuesto sea implementado en una aplicación Web, que contribuya al análisis exploratorio de datos de cerebro humano por parte de profesionales de diferentes especialidades.