1. Introducción
1.1. Contexto
1.2. Objetivos
1.3. El caso de estudio
1.4. Organización del documento
2. El correo electrónico
2.1. Historia
2.2. Estado actual
2.3. Estructura del correo electrónico
3. Marco teórico y revisión bibliográfica
3.1. Conceptos preliminares
3.2. Email Minig: Concepto y estado del arte
3.3. Clasificación automática de textos
3.4. Email mining: Clasificación automática
3.4.1. Etiquetado de documentos
3.4.2. Representación de documentos
3.4.3. Extracción de características de los documentos
3.4.4. Estrategias de Representación de documentos
3.4.5. Entrenamiento del Modelo
3.4.6. Estrategias de evaluación de modelos
3.4.7. Métricas de selección de modelos
3.4.8. Utilización del modelo
4. Clasificación semi-supervisada
4.1. Introducción
4.2. Antecedentes
4.3. Estrategia semi-supervisada propuesta
4.3.1. Conjunto de datos inicial de Correos electrónicos
4.3.2. Indexación de correos electrónicos con Elasticsearch
4.3.3. Estrategias de selección de características
4.3.4. Recuperación de correos electrónicos
4.3.5. Construcción del Modelo de clasificación
5. trabajos experimentales
5.1. Consolidación del conjunto de datos
5.1.1. Origen de los correos electrónicos
5.1.2. Etiquetado de documentos
5.1.3. Preprocesamiento de los correos .
5.2. Análisis exploratorio del conjunto de datos
5.2.1. Análisis de la fecha de la consulta
5.2.2. Análisis de los atributos categóricos
5.2.3. Análisis exploratorio del texto de la consulta
5.3. Separación del conjunto de datos en entrenamiento y evaluación
5.4. Ejecución de los experimentos
5.4.1. Primera iteración: Distribución de clases original
5.4.2. Segunda iteración: Redistribución de clases y corrección de etiquetas
de clases
5.5. Implementación de la estrategia de aprendizaje semi-supervisado
5.5.1. Extracción de características
5.5.2. Recuperación de correos electrónicos
5.5.3. Construcción del Modelo de clasificación
5.5.4. Síntesis del trabajo experimental
6. conclusiones y trabajos futuros
6.1. Conclusiones
6.2. Trabajos Futuros