Publication:
Towards an x-bar parser: a model of English syntactic performance

No Thumbnail Available
Authors
Gómez-Marco, Oscar
Embargoed Until
Advisor
Vega-Riveros, José F.
College
College of Engineering
Department
Department of Electrical and Computer Engineering
Degree Level
M.S.
Publisher
Date
2015
Abstract
In the field of Natural Language Processing (NLP) any kind of analysis of written language starts by breaking down the text to identify its constituents as well as the relations between them. This process is called parsing and the most popular parsers at the moment base their analysis on learning processes and statistics. This research presents a deterministic rule-base parser that uses the X-bar schema as a base to output all the possible grammatically feasible structured representations of a sentence. In simple terms the parser is able to generate not only the most probable parse as the former ones mentioned but all the grammatical ones accounted for the multiple classifications of the input constituents. We show that the binarity of the outputs generated, in contrast with the non-binary, is better to identify the internal relations between the constituents of the sentence.

En el campo de Procesamiento del Lenguaje Natural (PLN) cualquier tipo de análisis de la lengua escrita comienza por descomponer el texto para identificar sus componentes, así como las relaciones entre ellos. Este proceso se denomina análisis sintáctico y los analizadores más populares en la actualidad basan su análisis en procesos de aprendizaje y en estadísticas. En esta investigación se presenta un programa de análisis sintáctico determinista basado en reglas que utiliza el esquema de X-barra como base para la producción de todas las posibles representaciones estructurales gramaticalmente factibles de una oración. En términos simples, el analizador es capaz de generar no sólo el análisis sintáctico más probable, como los anteriores mencionados, sino también todos los gramaticales en base a las múltiples clasificaciones de los constituyentes del texto de entrada. Demostramos que la binariedad de las salidas que genera el analizador es mejor para identificar las relaciones internas entre los constituyentes de la frase.
Keywords
X-bar parser,
natural language processing
Cite