Obtención de reglas de clasificación difusas utilizando técnicas de optimización

Jimbo Santana, Patricia

Título:
Obtención de reglas de clasificación difusas utilizando técnicas de optimización: caso de estudio riesgo crediticio
Autor:
Jimbo Santana, Patricia
Otros autores / Colaboradores:
 Lanzarini, Laura Cristina; [ Director/a]  Fernández Bariviera, Aurelio; [ Codirector/a] 
Temas:
MINERÍA DE DATOSOPTIMIZACIÓN
Palabras clave:
Reglas de Clasificación Difusas (Fuzzy Classification Rules), Optimización mediante Cúmulo de partículas tamaño variable (Variable Particle Swarm Optimization), 
URL:
http://sedici.unlp.edu.ar/handle/10915/101163,https://doi.org/10.35537/10915/101163,
Nota de tesis:
Tesis (Doctorado en Ciencias Informáticas) - Universidad Nacional de La Plata. Facultad de Informática, 2020.
Extensión:
1 archivo (2,4 MB) : il. col.
Resumen:
En los últimos años gracias al avance de la tecnología, las organizaciones han almacenado gran cantidad de información. Esto las ha llevado a la necesidad de incorporar técnicas que permitan procesar y obtener información útil de los datos. El proceso de Extracción del Conocimiento, conocido como proceso de KDD (Knowledge Discovery in Databases), está formado por varias fases que van desde la recolección y transformación de los datos hasta la identificación e interpretación de patrones o relaciones subyacentes sumamente útiles en la toma de decisiones. Dentro del proceso de KDD, la Minería de Datos (Data Mining) es considerada la fase más importante, ya que agrupa a las técnicas capaces de modelizar la información disponible. Una característica deseable de los modelos construidos con las técnicas de la Minería de Datos es que el conocimiento que se extrae se exprese en términos comprensibles. El aporte central de esta tesis es la definición de un nuevo método capaz de generar un conjunto de reglas de clasificación difusas de fácil interpretación, baja cardinalidad y una buena precisión. Estas características ayudan a identificar y comprender las relaciones presentes en los datos facilitando de esta forma la toma de decisiones. El nuevo método propuesto se denomina FRvarPSO (Fuzzy Rules variable Particle Swarm Oprmization) y combina una red neuronal competitiva con una técnica de optimización basada en cúmulo de partículas de población variable para la obtención de reglas de clasificación difusas, capaces de operar sobre atributos nominales y numéricos. Los antecedentes de las reglas están formados por atributos nominales y/o condiciones difusas. La conformación de estas últimas requiere conocer el grado de pertenencia a los conjuntos difusos que definen a cada variable lingüística. Esta tesis propone tres alternativas distintas para resolver este punto. Uno de los aportes de esta tesis radica en la definición de la función de aptitud o fitness de cada partícula basada en un ”Criterio de Votación” que pondera de manera difusa la participación de las condiciones difusas en la conformación del antecedente. Su valor se obtiene a partir de los grados de pertenencia de los ejemplos que cumplen con la regla y se utiliza para reforzar el movimiento de la partícula en la dirección donde se encuentra el valor más alto. Con la utilización de PSO las partículas compiten entre ellas para encontrar a la mejor regla de la clase seleccionada. La eficiencia y eficacia de FRvarPSO se encuentran fuertemente condicionadas por la manera en que se determinen las funciones de pertenencia de los conjuntos difusos. En el marco de las investigaciones de esta tesis se han utilizado diferentes opciones. Uno de estas opciones fue particionar el rango de cada atributo numérico en intervalos de igual longitud, y centrando en cada uno de ellos una función triangular con un solapamiento adecuado. Otra de las formas para obtener los conjuntos difusos ha sido utilizando el método Fuzzy C-Means. Adicionalmente, se utilizó también como técnica el conocimiento de un experto para la definición de los conjuntos difusos, y su correspondiente valor de pertenencia. El desempeño del método propuesto FRvarPSO fue comparado con versiones previas del mismo como son SOM + PSO, SOM + varPSO (PSO con población variable), LVQ + PSO, así como otros métodos de extracción de reglas de clasificación como PART y C4.5. Adicionalmente se comparó FRvarPSO con las versiones SOM + PSO Difuso, SOM + varPSO Difuso, LVQ + PSO Difuso, que son las versiones anteriores a las que se les aplicó lógica difusa al momento de construir el antecedente junto con el criterio de votación utilizado en la función fitness. La medición se realizó sobre doce bases de datos del repositorio UCI (Machine Learning Repository) y tres casos reales en el área de crédito del Sistema Financiero del Ecuador asociadas al riesgo crediticio considerando un conjunto de variables micro y macroeconómicas. Se transformaron variables con la finalidad de tener indicadores aplicados al cliente como por ejemplo: la capacidad de pago, la capacidad de endeudamiento y la calificación crediticia. Esta última tuvo un análisis particular, debido a que se disponía de información de las características generales del cliente, así como del comportamiento de los créditos otorgados en un horizonte de tiempo, con lo cual se obtuvo el nivel de morosidad. Otro de los aportes de esta tesis fue haber realizado una consideración especial en la morosidad del cliente teniendo en cuenta los días de vencimiento de la cartera otorgada; esto fue posible debido a que se tenía información del cliente en un horizonte de tiempo, una vez que el crédito se había concedido. De esta forma, se consideraron tres casos: la cartera vencida, la que no devenga intereses y la cartera castigada. Se verificó que con este análisis las reglas difusas obtenidas a través de FRvarPSO permiten que el oficial de crédito de respuesta al cliente en menor tiempo, y principalmente disminuya el riesgo que representa el otorgamiento de crédito para las instituciones financieras.

Puede solicitar más fácilmente el ejemplar con: TES 20/03

Ver índice

La edición contiene los siguientes documentos electrónicos para descargar:

Se cuenta con disponibilidad inmediata para llevar a domicilio.


Disponibilidad Actual Para Préstamo: 1 Disponibilidad Actual Para Sala de Lectura: 0 Cantidad Actual de Reservas: 0 Cantidad Actual de Préstamos: 0

Valoración


Comentarios (0)