ENFOQUE LINGÜÍSTICO
Fernando Galindo Soria
Instituto Politécnico
Nacional
UPIICSA ESCOM
Av. Milán
173
Col. Izcalli Pirámide
Tenayuca, Mex.
54140 MÉXICO
Tel. 391-64-92
Julio de 1994
RESUMEN
En este
trabajo se presenta el Enfoque
Lingüístico como una nueva forma de
ver la realidad, en la cual se considera que, cualquier cosa se puede ver como una oración de algún lenguaje.
Mediante este enfoque se pueden representar como
oraciones de algún lenguaje las imágenes, las reglas de un sistemas expertos, las trayectorias de un planeta, el movimiento de
la mano, la trayectoria que sigue una pieza de ajedrez al moverse, una huella
digital, la señal de un electrocardiograma, etc., con lo que se amplia el concepto de lenguaje que normalmente se
restringía a los lenguajes naturales (como el Español, Ingles, Chino o Árabe) y
artificiales (como Fortran, Pascal o C), para incluir cualquier cosa.
Como primer punto
se comenta que el Enfoque Lingüístico surgió en México a mediados de los
70's y que tiene como antecedentes los trabajos desarrollados por Noam Chomsky a mediados de los 50's
para representar la estructura de los lenguajes naturales, la aplicación de
estos trabajos a la construcción de compiladores, con lo que se generalizo el concepto de lenguaje para incluir a los
lenguajes artificiales de programación y el surgimiento del Reconocimiento Sintáctico de Formas donde
se plantea que la forma de cualquier
objeto o el patrón de comportamiento de cualquier proceso se puede ver como una
oración de algún lenguaje, con lo que
se generalizó aún más el concepto de lenguaje para incluir a cualquier patrón o
forma, de donde se llego finalmente a la idea del Enfoque Lingüístico.
Como siguiente punto se generaliza el concepto de unidad léxica
para incluir a cualquier cosa que se pueda percibir o conceptualizar.
Se presentan ejemplos de múltiples tipos
de lenguajes, como: lenguajes naturales restringidos, lenguajes de trayectoria,
lenguajes para representar sistemas de diagnostico y toma de decisiones y una ecuación lingüística con la cual se tiene la estructura de cualquier
elemento de la naturaleza.
Mas adelante se ve que la Gramática (o conjunto de reglas que representan a un lenguaje) es equivalente a un sistema de información. por lo que si se tienen un conjunto de oraciones de un
lenguaje se puede encontrar su gramática y de ahí obtener el sistema que
trabaja con ese lenguaje.
Finalmente se muestra que las oraciones tienen una estructura fractal, ya que, según el
enfoque lingüístico cada una de las
unidades léxicas que componen a la oración se pueden ver a su vez como
oraciones.
ENFOQUE LINGÜÍSTICO
Fernando Galindo Soria
Instituto Politécnico
Nacional
UPIICSA ESCOM
Av. Milán
173
Col. Izcalli Pirámide
Tenayuca, Mex.
54140 MÉXICO
Tel. 391-64-92
Julio de 1994
INTRODUCCIÓN
En este trabajo se presenta el Enfoque Lingüístico como una nueva
forma de ver la realidad, en la cual se considera que, cualquier cosa que se pueda percibir o conceptualizar se puede
representar como una oración de algún lenguaje.
Mediante este enfoque se
pueden ver como oraciones de algún lenguaje las imágenes, las reglas de un
sistemas expertos, las trayectorias de
un planeta, el movimiento de la mano, la trayectoria que sigue al moverse una
pieza de ajedrez, una huella digital, la señal de un electrocardiograma, etc.,
y se amplia el concepto de lenguaje que normalmente se restringía a los
lenguajes naturales (como el Español, Ingles, Chino o Árabe) y artificiales
(como Fortran, Pascal o C), para incluir cualquier cosa.
1. ANTECEDENTES DEL ENFOQUE LINGÜÍSTICO
El Enfoque Lingüístico
surgió como resultado de múltiples trabajos realizados desde mediados de los
70's principalmente en El Colegio de México, la Escuela Superior de Física y
Matemáticas (ESFM) , el Centro Nacional de Cálculo (CENAC) y la UPIICSA del
IPN.
Empero sus primeros antecedentes se encuentran en los trabajos
desarrollados por Noam Chomsky para
representar la estructura de los lenguajes naturales y plasmados en su libro Sintactic Structures publicado en 1957,
en la aplicación de estos trabajos a la construcción de compiladores y en el
surgimiento del Reconocimiento
Sintáctico de Formas.
A principios de los
60's los trabajos de Chomsky se aplicaron para describir la gramática del
Lenguaje Algol propiciando que ya para finales de esa décadas empezaran a
surgir libros donde se mostraba como construir un compilador a partir de la
gramática de un lenguaje dado, con lo
cual se generalizo el concepto de lenguaje para incluir a los lenguajes
artificiales de programación.
En paralelo con lo anterior
y desde mediados de los 60's se empezó
a aplicar la Lingüística Matemática al Reconocimiento de Patrones (o sea al
estudio de la forma o patrón de comportamiento asociado con algún objeto o proceso) siendo la base de los
métodos de Reconocimiento Sintáctico de
Formas en los cuales se plantea que
la forma de cualquier objeto o el patrón de comportamiento de cualquier proceso
se puede ver como una oración de algún lenguaje, por ejemplo se ve a una
imagen o proceso (voz, movimiento de los planetas, jugada de ajedrez, etc.)
como una oración del lenguaje de imágenes o de procesos , con lo que se generalizó aún más el concepto de lenguaje para incluir a
cualquier patrón o forma.
A finales de los 60's Rafael C. Gonzalez y Michael C. Thomason
escribieron el libro Sintactic Pattern
Recognition donde ya se presenta en una forma elaborada el concepto de
reconocimiento sintáctico de patrones y aparece
claramente la idea de representar patrones como oraciones de algún lenguaje, con lo que se extiende el
concepto de lenguaje para incluir figuras geométricas, dibujos e imágenes en
general , además de la forma o patrón de cualquier objeto o proceso, por lo que
podemos considerar que este libro es el
precursor del enfoque lingüístico.
Durante todos los 70's se
continuaron realizaron aplicaciones de las herramientas lingüísticas a la
construcción de compiladores y al reconocimiento de formas y se extendió su uso
a otras áreas de la Informática como la complejidad de algoritmos y la construcción
de sistemas operativos, manejadores de bases de datos y editores.
2. RESULTADOS GENERALES
En particular desde mediados
de los 70's en el IPN se ha desarrollado el
Enfoque Lingüístico y en la actualidad ya se cuenta con una gran
cantidad de resultados y aplicaciones, por lo que en los siguientes puntos se
presentaran algunos de éstos.
2.1. CONCEPTOS GENERALES
En general se define un lenguaje como un conjunto. Mas
especificamente cualquier mecanismo que
tenga un conjunto de elementos o palabras (Alfabeto)
sobre los que se pueda aplicar un conjunto de reglas para relacionarlos (Sintaxis) y asociarle un significado (Semántica) se puede decir que cuenta con un lenguaje.
En particular
una oración está formada por palabras (o unidades léxicas) relacionadas entre
sí (o sintaxis) y con un cierto significado (o semántica).
2.2. PERCEPCIÓN Y CONCEPTUALIZACIÓN DE UNIDADES LÉXICAS
Generalmente solo se aceptan
como unidades léxicas a los componentes de las oraciones de los lenguajes
naturales, y desde el surgimiento de los lenguajes de programación se ha
ampliado el término para abarcarlos también a ellos, sin embargo aún en la
actualidad no se incluyen dentro de este concepto por ejemplo a las partes de
un gato o a las ramas de un árbol o a las señales que emite una neurona, y el estudio de estos elementos se incluye
como problemas independientes dentro de la Semiótica. Por lo que, lo primero
que se tiene que hacer es generalizar el
concepto de unidad léxica.
En el enfoque lingüístico se
generaliza el concepto de unidad léxica
a cualquier cosa que se pueda percibir o conceptualizar. Por ejemplo la imagen que percibimos de un gato se
puede considerar como la oración que representa al gato , y las diferentes
partes del gato equivalen a las palabras o unidades léxicas que componen a la
oración.
2.3. EJEMPLOS DE LENGUAJES
A continuación se mostraran
algunos ejemplos de lenguajes no tradicionales con el fin de mostrar la
diversidad de aplicaciones de este enfoque y su fuerza.
2.3.1. LENGUAJE NATURAL RESTRINGIDO
Como primer ejemplo se
presenta el caso de los lenguajes naturales restringidos donde se incluyen: los
Lenguajes Imperativos formados por oraciones en las que se
plantea algún requerimiento u orden, los Lenguajes
Declarativos que se centran en
el planteamiento de hechos o reglas de
inferencia, los Lenguajes
Interrogativos mediante los que se
plantean preguntas sobre
el sistema y sus combinaciones.
Como posibles ejemplos de
oraciones de este tipo de lenguajes se tienen:
En diagnóstico
médico: la conversación del paciente con el médico.
En un sistema
de nómina: la descripción de los cambios o modificaciones requeridas.
En pruebas de
personalidad: la oración formada por
una cadena de signos, donde cada signo
representa la respuesta a una
pregunta de la prueba (normalmente
tienen un máximo de cinco
posibles respuestas) y la cadena
representa todas las
respuestas dadas por una persona, de donde una oración típica se parece a una cadena binaria.
2.3.2. LENGUAJES DE TRAYECTORIA.
Estamos acostumbrados a manejar el
concepto de lenguaje como sinónimo de lenguaje natural escrito o hablado
y si nos fuerzan mucho podemos aceptar
la idea de lenguaje de señas o
movimientos.
Sin embargo, atrás de todos
estos tipos de lenguajes podemos encontrar un concepto más general que los
incluye y generaliza conocido como LENGUAJE DE TRAYECTORIA. en el cual se
incluyen todos los lenguajes visuales (Gráficas),
de movimiento, (Jugadas en
un tablero de Ajedrez, movimiento de un robot, etc.) y cualquier otro
lenguaje que se pueda representar
por una trayectoria
(Sonido, recorrido por una ciudad, etc.).
Un Lenguaje de Trayectoria
se puede conceptualizar como un conjunto de
oraciones que representan la
trayectoria espacial o temporal entre dos puntos para lo cual
en lugar de
lexemas o fonemas utiliza como
unidades básicas símbolos
que representan trayectorias.
Prácticamente todos los
elementos de los
lenguajes tradicionales (Natural escrito y hablado, señas, etc.) se
pueden ver como una combinación de trayectorias ya que al final de cuentas
lo que
se representa mediante una letra
es el resultado de la trayectoria que sigue
la pluma de un punto a otro, o lo que se escucha como un fonema es la abstracción de la trayectoria que sigue
una onda sinusoidal y existen múltiples fenómenos que captamos como resultado de una trayectoria en alguna
dimensión entera o fractal (el movimiento de los planetas, el movimiento de un
pie, el paso del tiempo,
el crecimiento de una célula, etc.).
Por lo que a todos estos
fenómenos se les puede asociar una trayectoria
y podemos postular que cuando se capta algún fenómeno en primera instancia estamos captando oraciones de
algún lenguaje de trayectoria las
cuales al ser absorbidas y
procesadas por nuestros sentidos
son integradas mediante un patrón
general al cual se le asocia
algún tipo de significado.
2.3.3. SISTEMAS DE DIAGNOSTICO Y TOMA DE DECISIONES.
Una de las características
de los sistemas de diagnóstico y toma de decisiones (DSS, reconocedores de
patrones, etc.) en general y de los
sistemas expertos en particular se encuentra en que el lenguaje del usuario
consta principalmente de oraciones de
la forma:
Síntoma :
Diagnostico : Acciones o Tratamiento
donde este tipo de oraciones nos permiten plantear
por ejemplo la base de un conjunto de
reglas de inferencia o el patrón general de algún tipo de figuras.
Por ejemplo si se tiene la
oración:
Paciente femenino de 15
años con 38 grados de temperatura y
S1 S2 S3
dolor en el pecho, se le
diagnosticó laringitis y se le recetó
S4 d1
antibióticos, antiistamínicos
y reposo
t1 t2 t3
|
se detecta que el paciente tiene los síntomas: |
S1 S2 S3 S4 |
|
el diagnostico: |
d1 |
|
y requiere los tratamientos: |
t1 t2
t3 |
2.3.4. ECUACIÓN FUNDAMENTAL DE LA NATURALEZA
Aunque es poco conocido,
desde mediados de los 70's se ha
utilizado la lingüística y en particular los sistemas-L para representar la
estructura de arboles y construir programas de graficación, siguiendo con esa
linea y combinando los conceptos de fractales y el Enfoque Lingüístico a
finales de los 80's era relativamente fácil representar mediante gramáticas la
estructuras de múltiples objetos de la naturaleza como arboles, nubes y
montañas.
Sin embargo cada tipo de
objeto se representaba con una gramática diferente a partir de la premisa de
que cada objeto tenia una estructura
diferente de los otros. Mas adelante se encontró que todos esos objetos se
podía representar con una única
ecuación lingüística de la forma S->a*S* con lo cual prácticamente se tiene en una sola ecuación la
estructura de cualquier elemento de la naturaleza.
2.4. DEL LENGUAJE AL SISTEMA
El concepto de lenguaje es
muy amplio y es importante saber elegir el que se adecúe más a nuestro problema. Ya que se eligió un lenguaje X,
el siguiente paso consiste en
captar muchas oraciones (Grabando,
observándolo, sintiéndolo, etc.).
Ahora bien, si se tuviera
que tener la lista de todas las oraciones de un lenguaje no terminaríamos, por
lo que, comúnmente en lugar de la lista
de oraciones se utiliza una Gramática o conjunto de reglas que representan al
lenguaje.
La Gramática que representa
al lenguaje es equivalente a un sistema de
información. por lo que si se
tienen un conjunto de oraciones de un lenguaje se puede encontrar su gramática
y de ahí obtener el sistema que trabaja
con ese lenguaje.
2.5. ESTRUCTURA FRACTAL DE LAS ORACIONES
Un resultado que se encontró
junto con Juan Martín Gonzalez Vasquez en 1984, fue que las oraciones tienen una estructura fractal, ya que, según el
enfoque lingüístico cada una de las
unidades léxicas que componen a la oración se pueden ver a su vez como
oraciones.
Por ejemplo en la siguiente
oración:
El
perro mordió al gato
Cada una de las palabras
puede ser una oración y entonces la palabra
perro
es
por sí sola una oración compuesta por sus propias unidades léxicas, que
dependiendo de la aplicación podrían ser por ejemplo :
a) pe , rro para un analizador silábico.
b) p , e , r , o para un
programa de ordenamiento de palabras.
A su vez cada letra se puede ver como una oración
de otro lenguaje, por ejemplo la letra
p
sería una oración donde las
unidades léxicas podrían ser los diferentes trazos que la forman.
CONCLUSIÓN
En este documento se mostró
como el estudio de los lenguajes se ha
ampliado desde la idea original del
tratamiento de los lenguajes naturales, su ampliación para incluir a los
lenguajes artificiales de programación y su generalización para incluir a
cualquier patrón o forma, de donde se llego finalmente a la idea del Enfoque
Lingüístico que plantea que cualquier cosa se puede ver como una oración de
algún lenguaje. Ademas se mostraron algunas de sus aplicaciones con el
fin de que se vea que es un
concepto general y que se encuentra en el núcleo de las herramientas que nos
permiten estudiar la realidad.
BIBLIOGRAFÍA
1.
Przemyslaw Prosinkiewicz, Aristid Lindenmayer y James Hanan. Developmental Models of Herbaceous Plants for Computer Imagery Purposes.
Computer
Graphics, Vol 22(4), Agosto 1988.
2. Sofia Bueno Peralta y Antonio Simancas López. Generador de Arboles Fractales. en Memorias del III Congreso
Nacional sobre Informática y Computación, Jalapa, Ver. México, Octubre 1990
3. Heinz-Otto Peitgen
and Dietmar Saupe (Editores). The Science of Fractal
Images. ED Springer-Verlag, 1988.
4. Fernando Galindo Soria. Sistemas Evolutivos: Nuevo Paradigma de la Informática. en Memorias
XVII Conferencia Latinoamericana de Informática, Caracas Venezuela, julio de
1991.
5. Fernando Galindo Soria. Sistemas Evolutivos. en Boletín de Política Informática. México,
Septiembre de 1986.
6. Fernando Galindo Soria. Aplicaciones de la Lingüística Matemática y los Fractales a la
Generación de Imágenes. en Memorias Simposium Nacional de Computación.
México, Nov de 1991.
7. Rafael C. Gonzalez y Michael C. Thomason. Sintactic Pattern Recognition. Ed. Addison-Wesley.
8. Emmon Bach. Teoría Sintáctica. Ed Anagrama.
9. Salomaa. Formal Languages. Ed. Academic Press.
10. Herbert. A. Simon. Las Ciencias de lo Artificial. Ed.
ATE
11
Noam Chomsky. Estructuras Sintácticas. Ed. Siglo XXI
12. Hopcroft y Ullman. Formal Languages and
Their Relation to Automata. Ed. Addison-Wesley.