El ser humano entra en contacto y se comunica con la tecnología a través del lenguaje en numerosas situaciones cotidianas, en el mundo físico y en el virtual, donde utiliza herramientas de búsqueda de información que manejan propiedades físicas o formales del lenguaje, propiedades que en un sentido amplio del término podríamos llamar sintácticas y que no tienen nada o casi nada que ver con lo que las palabras quieren decir, con el conocimiento que pueden representar.
Antes de salir de casa, nuestro hombre tenía que resolver un asunto que en un país civilizado sería trivial, pero que en el nuestro implica notables perjuicios para la salud. Debía hacer una consulta a una gran compañía (de las que somos clientes a la fuerza) y el único medio de hacerlo era mediante una llamada telefónica.
Tales llamadas, como es sabido, nos exponen a la negociación con una persona empleada, anónima y mal pagada que no nos hará ni caso, o a la interacción con una máquina que, de algún modo, entiende lo que le decimos y genera mensajes hablados de una manera inteligible, pero enojosa.
Cuando una máquina nos habla –a través del teléfono, desde el GPS del coche…– nos enfrentamos a una aplicación efectiva de las que podemos llamar ‘tecnologías del lenguaje’. Si los físicos tienen alguna responsabilidad por la existencia de las armas nucleares, los ingenieros y los lingüistas que se dedican a estas cosas son responsables de la existencia de las exasperantes maquinitas que, aun dentro de sus limitaciones, son tan hábiles en torear al usuario.
Pero volvamos a nuestro hombre, al que suponemos que ya ha acabado la gestión que había comenzado y de la que también suponemos que no ha acabado con él.
Y es que nuestro personaje, como todos nosotros, vive en medio de tecnologías que utilizan, manejan, interpretan o generan textos e intervenciones orales en español y en todas las otras lenguas.
Cuando escribimos un SMS –como nuestro hombre va a tener que hacer esta misma mañana– el teclado de nuestro móvil, con seguridad, nos ahorrará algunas pulsaciones porque un programa sabe qué combinaciones de letras son más probables o, quizá –si dispone de un teclado más complejo– le sugerirá directamente la palabra completa que quiere escribir.
E incluso, sin levantarse del ordenador, nuestro hombre puede comprar vaya uno a saber qué producto a través de una página web que, pongamos, está en ruso. Perplejo ante el contundente alfabeto cirílico, llama a su compañera de trabajo para ver si, más versadas en las inescrutables lenguas extranjeras, entiende algo de todo aquello; pero ésta, que ya se las ha visto con estas cosas, lo que hace es algo tan sencillo como pedirle a una herramienta gratuita –digamos que la proporcionada por Google– que le traduzca la página y, en un abrir y cerrar de ojos, disponen de una traducción que, pese a algunos deslices, le informa lo suficientemente bien acerca de cómo llevar a cabo la compra como para que, sin mayores precauciones, nuestro amigo se arriesgue a hacerla.
Traducir es una tarea seguramente imposible si se busca la perfección, pero puede decirse que resuelta si lo que se pretende es una cierta inteligibilidad. La traducción automática se realiza gracias a aplicaciones informáticas que se basan en lo que sabemos sobre las lenguas, en sus propiedades léxicas, gramaticales y también estadísticas.
Sin embargo, lo que hacen las máquinas con el lenguaje no acaba allí. Una tarea cotidiana es buscar información en un ordenador o en la madeja enorme de ordenadores que es internet. Sabemos que, en principio, a un buscador le damos una cadena o unas cadenas de letras y espacios enlazados mediante unos pocos operadores y que el buscador, mediante diversos algoritmos de búsqueda y ordenación nos ofrece documentos que, se supone, tienen que ver con nuestros intereses.
Cuando, al igual que el hombre de nuestra historia o que su compañera, hacemos una búsqueda, lo que queremos es algo tan difícil de definir como la información, una información relevante aunque tal vez no demasiado precisada de antemano. Y si pensamos en las técnicas de que hemos hablado hasta ahora, podemos decir que –con la excepción posiblemente de algunos procedimientos de traducción automática y olvidándonos de algunos detalles– las mismas sólo manejan propiedades físicas o formales del lenguaje, propiedades que en un sentido amplio del término podríamos llamar sintácticas y que no tienen nada o casi nada que ver con lo que las palabras quieren decir, con el conocimiento que pueden representar.
En cambio, cuando nos metemos con este asunto de la información –que expresado subjetivamente y sin preocuparnos de los conceptos técnicos de información y representación del conocimiento– es algo tan ilimitado como “lo que queremos o necesitamos saber en una situación concreta”, la sintaxis puede no ser suficiente.
Con suma facilidad, nuestro hombre puede descubrir que muchos buscadores de Internet hacen sugerencias para mejorar nuestras búsquedas o parecen saber algo de morfología. Buscamos una palabra en singular y se nos ofrecen documentos con esa palabra en plural. O introducimos un término compuesto con guión y nos aparece la variante sin guión. Pero lo interesante empieza cuando –y hay buscadores y herramientas que lo hacen– una búsqueda se extiende a la de términos y palabras relacionadas semánticamente con aquella que introducimos.
De modo complementario, nuestra maquinita tiene que saber si “gato” es el felino o la herramienta. El curioso lector puede entretenerse reflexionando acerca de cómo se proyectan aquí las diversas relaciones que se dan entre las palabras: para desambiguar (que es el término técnico) “gato”, ha de atenderse a las palabras que acompañan a ésta en el texto en el que aparece y, también, a las que le acompañan en el diccionario porque guardan alguna relación semántica con ella.
Pero, en ocasiones, no se trata de encontrar información, sino de clasificar documentos, esto es, saber de qué van, resumirlos, simplificar su lenguaje o estilo, etiquetarlos (esto es, detectar sus componentes dentro de categorías relevantes a efectos sintácticos o semánticos), o identificar la lengua en que están escritos (algo no tan trivial como podría parecer).
Lo sorprendente de todo esto es la rapidez con la que estas tecnologías se están convirtiendo en un medio en el que todos estamos inmersos. No son materia reservada para especialistas, su vocación es la de permear todos los ámbitos de la acción social y de la economía y, desde luego, ya están ahí.
Por ello nos afectan a todos y, sin embargo, nuestro hombre –del que no hemos averiguado demasiado a lo largo de toda esta historia y quizá no sabemos qué piensa o qué cosas le gustan– ha estado utilizando estas tecnologías sin saberlo, como aquel gentilhombre famoso que también hacía cosas con palabras de las que era perfectamente inocente.
En fin, éste ha sido un día bastante normal en la vida de nuestro hombre. No ha tenido que ir a un juzgado, por ejemplo. Allí se podría haber cruzado con un lingüista que ha sido reclamado para hacer un peritaje, imaginemos que referido a un posible plagio. O no ha visitado un hospital, donde se hubiera podido topar con un lingüista que goza de buena salud, pero que trabaja en asuntos relativos a la patología del habla. Ni le han presentado a un lingüista que prepara herramientas para el aprendizaje de lenguas. Ni con un lingüista que asesora a políticos y que legitima políticas lingüísticas, pero, claro, éstos son otra especie.
Pedro Santana (Logroño, 1960) es Doctor en Filosofía y Letras, y profesor titular del Departamento de Filologías Modernas de la Universidad de la Rioja, en el área de Filología Inglesa. Imparte el curso de doctorado Lingüística cuantitativa: su aplicación a los estudios literarios y es responsable del grupo de investigación ‘Grupo de estudio y desarrollo de herramientas informáticas para la filología’, con el que trabaja en el desarrollo de un editor y base de datos de plantillas léxicas.