Publication:
A study of spelling errors in word processing: detection and correction

Thumbnail Image
Authors
Díaz-Figueroa, María I.
Embargoed Until
Advisor
Rodríguez, Néstor J.
College
College of Engineering
Department
Department of Electrical and Computer Engineering
Degree Level
M.S.
Publisher
Date
2006
Abstract
JThis document presents a research study that identifies spelling errors committed by people writing in Spanish and how the errors are corrected. A usability test was conducted in which 20 people were asked to write a document in Spanish using Microsoft Word. During the writing process, the interaction of the participants with Microsoft Word was recorded. The recordings were then analyzed to identify the errors committed by the users and how these were corrected. Errors were classified in eleven different types. The most important finding was that a large proportion of the errors were related with words that include á, é, í, ó, ú, or ñ characters. The study revealed that three fourth of the errors are corrected using one out of four possible techniques. The large majority of the errors were identified and corrected on the spot using the backspace key. Many of the uncorrected errors were errors that were not detected by the word processor. However, with simple algorithms these errors can be detected and corrected. We developed algorithms to detect four of these types of errors. The algorithms were able to detect and provide correct alternatives for all the errors in words that currently exist on the dictionary used to implement the algorithms.

En este documento se presenta un estudio que identifica errores ortográficos cometidos por personas escribiendo en español y cómo los errores fueron corregidos. Se condujo un estudio de usabilidad en el que se pidió a 20 personas que escribieran un documento en español utilizando Microsoft Word. Durante el proceso de escritura la interacción de los participantes con Microsoft Word fue grabada. Las grabaciones fueron analizadas para determinar los tipos de errores cometidos y cómo fueron corregidos. Once tipos de errores fueron identificados en el estudio. El hallazgo más importante fue que un gran número de errores estaban relacionados con palabras que incluyen las letras á, é, í, ó, ú, o ñ. El estudio reveló que tres cuartas partes de los errores fueron corregidos y que se utilizaron cuatro técnicas para corregirlos. La mayoría de los errores fueron corregidos en el momento en que se cometieron utilizando la tecla "backspace". Muchos de los errores que no fueron corregidos fueron errores que no fueron detectados por el procesador de palabras. Sin embargo, con algoritmos simples estos errores pueden ser detectados y corregidos. Nosotros desarrollamos algoritmos para detectar cuatro tipos de estos errores. Los algoritmos pudieron detectar y proveer alternativas correctas para todos los errores de palabras que existían en el diccionario utilizado para implementar los algoritmos.
Keywords
Cite
Díaz-Figueroa, M. I. (2006). A study of spelling errors in word processing: detection and correction [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2245