Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Recuperación de información bilingüe

Támara López, Daniel Enrique (2016) Recuperación de información bilingüe. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.

Texto completo

[img]
Vista previa
PDF - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

522kB

Resumen

En esta tesis se presenta un método para la recuperación de información bilingüe basado en la descomposición matricial semidiscreta (SDD). Se desarrollan cuatro casos de estudio que exhiben el rendimiento de usar Latent Semantic Indexing (LSI) vía SDD para la recuperación de información entre lenguajes (CLIR). Paralelamente se confrontan estos resultados con los obtenidos al aplicar LSI vía descomposición en valores singulares (SVD). Dos idiomas (inglés y español) son combinados agregando una pequeña parte de documentos en un idioma en el correspondiente documento del otro idioma. Las rutinas empleadas para aplicar y comparar los métodos son propias y se implementaron en MATLAB, Abstract : This thesis presents a method for the recovery of bilingual information based in Semidiscrete Matrix Decomposition (SDD). Four cases studies that exhibit the performance of use LSI via SDD for cross-language information retrieval (CLIR) are displayed. Concurrently these results are compared with those obtained by applying LSI via singular value decomposition (SVD). Two languages (english and spanish) are combined by adding a small portion of documents in a language to the corresponding document in the other language. The routines used to implement and compare methods are proper and implemented in MATLAB

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Acosta Medina, Carlos Daniel and Mejía Salazar, Carlos Enrique
Información adicional:Tesis presentada como requisito parcial para optar al título de: Magíster en Ciencias - Matemática Aplicada. -- Línea de Investigación: Computación Científica.
Palabras clave:Recuperación de información, Indexación semántica latente, Descomposición semidiscreta, Descomposición en valores singulares, Idiomas cruzados, Information retrieval, Latent semantic indexing, Semidiscrete decomposition, Singular value decomposition, Cross-languaje
Temática:4 Lenguas / Language
4 Lenguas / Language > 41 Ligüística / Linguistics
5 Ciencias naturales y matemáticas / Science > 51 Matemáticas / Mathematics
Unidad administrativa:Sede Manizales > Facultad de Ciencias Exactas y Naturales > Departamento de Matemáticas y Estadística
Código ID:53058
Enviado por : Daniel Enrique Támara López
Enviado el día :25 Julio 2016 21:08
Ultima modificación:25 Julio 2016 21:19
Ultima modificación:25 Julio 2016 21:19
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Metabiblioteca OAIster BASE BDCOL Registry of Open Access Repositories SNAAC Red de repositorios latinoamericanos eprints Open archives La referencia Tesis latinoamericanas OpenDOAR CLACSO
Este sitio web se ve mejor en Firefox