Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español

Iván Amón; Francisco Moreno; Jaime Echeverri

Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español

Author details

Iván Amón | Biografía
Universidad Pontificia Bolivariana

Francisco Moreno | Biografía
Universidad Nacional de Colombia

Jaime Echeverri | Biografía
Universidad de Medellín

Palabras clave:

Aviso de derechos de autor/a

Articles

Resumen

Con frecuencia datos que deberían estar escritos de forma idéntica no lo están debido a errores ortográficos y tipográficos, variaciones en el orden de las palabras, uso de prefijos y sufijos, entre otros. Las técnicas fonéticas para detección de duplicados no están orientadas al idioma español, lo que dificulta la identificación y corrección de problemas como errores ortográficos en textos escritos en este idioma. En este artículo de investigación se propone un algoritmo denominado PhoneticSpanish parala detección de cadenas de texto duplicadas el cual considera la presencia de errores ortográficos en el idioma español. El algoritmo propuesto se comparó con nueve técnicas para la detección de duplicados. Los resultados del algoritmo fueron satisfactorios ya que se obtuvieron mejores resultados que las otras técnicas y evidencian oportunidades para mejorar el análisis de información en el idioma español.

PDF

Cómo citar

Amón, I., Moreno, F., & Echeverri, J. (1). Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español. Revista Ingenierías Universidad De Medellín, 11(20), 127-138. Recuperado a partir de https://revistas.udem.edu.co/index.php/ingenierias/article/view/671

Descargas

La descarga de datos todavía no está disponible.

Revista Ingenierías Universidad de Medellín

Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español

Resumen

Descargas

Send mail to Author

Artículos más leídos del mismo autor/a

Estamos indexados en

Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español

Resumen

Descargar Cita

Descargas

Send mail to Author

Artículos más leídos del mismo autor/a

Estamos indexados en