Publicación:
Selección de características usando algoritmos genéticos para clasificación de cáncer de mama

Cargando...
Miniatura

Fecha

Autores

Juárez Cayetano, Marleny

Director de Tesis

Co-director de Tesis

Título de la revista

ISSN de la revista

Título del volumen

Editor

Unidades académicas

Colecciones

item.page.projects

item.page.journal-issue

Resumen

El cáncer de mama, entre muchas otras enfermedades, es un problema a nivel mundial que causa miles de muertes anualmente, por lo tanto, es necesario combatir esta enfermedad desde diferentes ángulos. La asignación de un diagnostico puede ser realizada por medio de la clasificación binaria, considerando ciertas características tomadas del paciente. Sin embargo, puede ocurrir que el número de características sea demasiado grande o que todas las características no sean necesarias para asignar un diagnóstico correcto, lo que podría insertar errores en la clasificación y/o solicitar pruebas innecesarias al paciente. Por esta razón, esta tesis aborda el problema de la selección de características de cáncer de mama, con las que será posible proporcionar un diagnóstico acertado sin la necesidad de utilizar todas las características. Para este trabajo se toma en cuenta la Base de Datos de Cáncer de Mama en Wisconsin, que contiene características tomadas de pacientes con tumores y un diagnóstico para cada uno de ellos. Para verificar la eficiencia de la metodología desarrollada se realizaron pruebas con la base de datos de libros del Mago de Oz, la cual ha sido utilizada en diversos trabajos de clasificación. Bases de datos como estas almacenan muchas características. Para lograr este objetivo se implementó un algoritmo genético utilizando la calidad de clasificadores binarios como función objetivo, esta calidad fue medida por medio de la precisión de clasificación. Los clasificadores implementados son el análisis discriminante lineal y el método del k-vecino más cercano. El criterio de optimización del algoritmo genético fue de maximización, es decir, se esperaba que en cada iteración la función objetivo fuera mayor a la anterior. Un algoritmo genético toma distintos subconjuntos de características, los evalúa, selecciona a los subconjuntos con un valor de función objetivo mayor, entonces los recombina y los muta; el proceso es repetido hasta cumplir un criterio de paro. Finalmente, devuelve el subconjunto de características con el mejor valor de función objetivo. El algoritmo se implementó en lenguaje C. Si bien, la meta principal de la tesis es la selección de características para el diagnóstico de cáncer de mama por medio de clasificadores binarios, la metodología desarrollada se puede utilizar para tratar otro tipo de problemas, tal y como se muestra en esta tesis.

Descripción

Citación

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced