Última modificación: 2013-08-30
Resumen
La deserción estudiantil en los programas de pregrado de la gran mayoría de Instituciones de Educación Superior de Latinoamérica es un problema que tiene un impacto multidimensional en el desarrollo social y económico de un país. Según el Instituto para la Educación Superior en América Latina y el Caribe (IESALC), Latinoamérica presentó en el año 2003 una cobertura promedio en educación superior del 28.7% y una tasa de deserción estudiantil del 50%.
En Colombia, pese a que los últimos años se han caracterizado por aumentos de cobertura e ingreso de estudiantes nuevos, el número de alumnos que logra culminar sus estudios superiores no es alto, dejando entrever que una gran parte de éstos abandona sus estudios, principalmente en los primeros semestres. Según estadísticas del Ministerio de Educación Nacional, de cada cien estudiantes que ingresan a una institución de educación superior cerca de la mitad no logra culminar su ciclo académico y obtener la graduación.
La minería de datos en la educación no es un tópico nuevo y su estudio y aplicación ha sido muy relevante en los últimos años. El uso de estas técnicas permite, entre otras cosas, predecir cualquier fenómeno dentro del ámbito educativo. De esta forma, utilizando las técnicas que nos ofrece la minería de datos, se puede predecir, con un porcentaje muy alto de confiabilidad, la probabilidad de desertar de cualquier estudiante.
En este artículo se presentan los primeros resultados del proyecto de investigación financiado por el Ministerio de Educación Nacional cuyo objetivo fue detectar patrones de deserción estudiantil a partir de los datos socioeconómicos, académicos, disciplinares e institucionales de los estudiantes de los programas de pregrado de la Universidad de Nariño e Institución Universitaria CESMAG, dos instituciones de educación superior (la primera pública y la segunda privada) de la ciudad de Pasto (Colombia), utilizando técnicas de Minería de Datos. Teniendo en cuenta las etapas del proceso de descubrimiento de conocimiento en bases de datos, inicialmente se seleccionaron, de las bases de datos de la Universidad de Nariño los datos socio-económicos, académicos, disciplinares e institucionales de los estudiantes que ingresaron en los años 2004, 2005 y 2006 a los diferentes programas de pregrado, con el fin de hacerles un seguimiento completo hasta el año 2011, determinando si desertaron o no.
Con estos datos se construyó un repositorio de datos utilizando el SGBD PostgreSQL. A estos datos se les aplicó las etapas de pre-procesamiento y transformación con el fin de obtener conjuntos de datos limpios y listos para aplicarles las técnicas y los algoritmos de minería de datos. Los primeros resultados se obtuvieron utilizando la técnica de clasificación basada en árboles de decisión con la herramienta libre de minería de datos Weka. Finalmente, estos resultados fueron analizados, evaluados e interpretados para determinar la validez del conocimiento obtenido. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.