Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar?

Salazar Blandón, Diego Alejandro (2012) Comparación de Máquinas de soporte vectorial vs. Regresión Logística. ¿Cuál es más recomendable para discriminar? Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.

Texto completo

[img]
Vista previa
PDF - Versión Aceptada
Available under License Creative Commons Attribution No Derivatives.

1MB

Resumen

La clasificación de objetos es un problema muy común en el trabajo estadístico aplicado. Si se tiene un conjunto de datos X correspondientes a una muestra de una población en el que cada uno de sus elementos pertenece a una de dos clases, el objetivo de los métodos de clasificación es determinar a cuál de esas dos clases pertenecerá una nueva observación. Uno de los métodos más utilizados es la regresión logística (RL); su validez y desempeño han sido ampliamente demostrados en la literatura. Recientemente, las Máquinas de Soporte Vectorial (SVM), un método alterno basado en procesos algorítmicos, proporciona un enfoque diferente a la solución de este problema. En este trabajo se exponen los principios básicos de RL y SVM y se comparan, vía simulación, para dar respuesta a la pregunta de cuál es más recomendable para discriminar cuando la población puede clasificarse en dos categorías. Finalmente se presentan dos aplicaciones con datos provenientes de micro arreglos en los que se midieron los niveles de expresión de genes en pacientes con diabetes y enfermedad de Alzheimer./ Abstract. The classification of individuals or objects is a common problem in applied statistics. For instance, if X is a data set corresponding to a sample from an specific population in which all its observations belong to one of two categories, the goal of classification methods is to decide to which class a new observation will be in. One of the most and widely used classification methods is logistic regression (LR); its properties and performance have been extensively studied in the literature. Recently, Support Vector Machine (SVM), an alternative method based on highly structured algorithms, has provided a new solution to the classification problem. In this work, the fundamentals of LR and SVM are described. Also, using statistical simulation, we address the question of which of them is better to discriminate when the population can be classified in two categories. Finally, two applications with real data from microarray experiments in diabetes and Alzheimer’s disease are presented as illustration.

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Salazar Uribe, Juan Carlos
Palabras clave:Máquinas de Soporte Vectorial; Regresión logística; Clasificación; Simulación estadística; Genética /Support Vector Machines; Logistic Regression; Classification;Statistical simulation; Genetics.
Temática:5 Ciencias naturales y matemáticas / Science > 51 Matemáticas / Mathematics
Unidad administrativa:Sede Medellín > Facultad de Ciencias > Escuela de Estadística
Código ID:6594
Enviado por : Biblioteca Sede Medellín Universidad Nacional de Colombia
Enviado el día :30 May 2012 17:17
Ultima modificación:11 Oct 2012 20:51
Ultima modificación:11 Oct 2012 20:51
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Metabiblioteca OAIster BASE BDCOL Registry of Open Access Repositories SNAAC Red de repositorios latinoamericanos eprints Open archives La referencia Tesis latinoamericanas OpenDOAR CLACSO
Este sitio web se ve mejor en Firefox