Última modificación: 2018-08-06
Resumen
La deserción estudiantil es un fenómeno complejo que involucra diversos factores en los ámbitos sociales, económicos, familiares, psicológicos y académicos del estudiante. Estudios previos del Ministerio de Educación Nacional, MEN, indican que algunos de los factores determinantes en la deserción son: estrato, sexo, nivel educativo de los padres, ingresos económicos de la familia, clasificación según el SISBÉN, número de personas que componen el núcleo familiar, resultados de las Pruebas de Estado Saber 11° y ocupación del joven.
Según datos del MEN, para el 2015 la deserción universitaria acumulada, de primero a decimo semestre, en Colombia se estimaba en 46.05%. Problema que se presenta en otros países como Estados Unidos 50%, Belice, Vietnam, Indonesia, China, Irán, México, República Dominicana, Chipre, Arabia Saudita, Malasia, Serbia, Túnez y Estonia, hay una tasa de abandono de estudios entre 80% y 90%. Además, la UNESCO (United Nations Educational, Scientific and Cultural Organization), muestra que las tasas de deserción en América Latina y el caribe es significativamente alta en las áreas de humanidades con 76.9%, ciencia básica con 63.2% y tecnología e ingeniería con 61,5%.
Dada la complejidad del problema y el gran impacto que esto genera a nivel social, las universidades diseñan estrategias de intervención que permitan disminuir la tasa de deserción. El inconveniente es que muchas de estas estrategias carecen de efectividad, ya que, no tienen en cuenta que las causas varían en cada caso. Por otro lado, se necesita información confiable que permita caracterizar la población para identificar posibles casos de deserción antes que ocurran, con lo cual se puedan tomar acciones preventivas que permitan disminuir la tasa de deserción.
En este sentido, el propósito de la investigación es diseñar un modelo de clasificación para la deserción temprana en la facultad de ingeniería de la Universidad de la Salle, a través de la aplicación de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), Por esta razón el trabajo se enfoca en los siguientes dos aspectos:
- Identificar los factores (académicos, familiares y sociales de la población estudiantil) que tengan una fuerte influencia en la deserción de estudiantes dentro de la Facultad de Ingeniería de la Universidad de La Salle.
- Proponer técnicas de minería de datos y aprendizaje automático que permitan predecir los casos de deserción en la Facultad de Ingeniería de la Universidad de La Salle.
Se inicia con una revisión de la literatura de 1982 a 2017, en la cual se analizan las aplicaciones de machine learning y data mining para abordar la problemática con métodos como Decision trees, artificial neural networks, support vector machines, naive bayes, uniform random, k nearest neighbor y logistic regression.
En este momento se trabaja en la estructuración y análisis exploratorio de un conjunto de datos de entrenamiento, para posteriormente proceder a desarrollar y evaluar modelos de clasificación que permitan predecir casos de deserción temprana en la Facultad de Ingeniería.