Lenguaje, herramienta por excelencia en el contexto digital

Publicado el 10 enero, 2024 En NACIONAL UNAM

MÉXICO.- Internet es un espacio de información que, si bien es benéfico para la humanidad, representa también un peligro porque se corre el riesgo de perdernos en el cúmulo de información que ahí está y que con frecuencia no es tan confiable, alertó la académica del Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI) de la UNAM, Adriana Suárez Sánchez.

Obtenerla es importante en todos los ámbitos de nuestra vida; y si está actualizada y es fiable estamos en posibilidad de tomar decisiones o preparados ante situaciones en diferentes aspectos de nuestra vida cotidiana, comentó.

El tema del lenguaje en su localización ha sido investigado en el IIBI, donde especialistas desarrollan trabajos asociados a la búsqueda en catálogos de bibliotecas, bases de datos y entornos web. En este rubro hemos creado lenguajes de indización como el tesaurosaxonomías y ontologías que apoyan a los usuarios en la recuperación de datos mediante un lenguaje estandarizado, y trabajamos para que los sistemas sean más inteligentes y respondan con mayor eficacia a las consultas de los cibernautas.

En la actualidad, el panorama de las fuentes de información se ha ampliado. A principios y mediados del siglo XX las personas se mantuvieron documentadas por medios impresos, luego a través de la radio y la televisión; sin embargo, aproximadamente a mediados de la década de 1990 las tecnologías de la comunicación y la información registraron la aparición y masificación de internet. A partir de entonces la web se ha consolidado como un espacio de información relevante a la par de los medios tradicionales.

En el contexto digital el lenguaje sigue siendo la herramienta por excelencia con la que establecemos interrogaciones en un buscador como Google, o en una base de datos como JSTOR, orientada hacia la investigación y enseñanza con tecnología de punta, incluso las consultas que expresamos a las inteligencias artificiales como Alexa, Siri o ChatGPT, explicó Suárez Sánchez.

Y añadió: en el caso de los catálogos de bibliotecas, bases de datos e inteligencias artificiales debemos ser conscientes de que estamos ante un agente artificial; es decir, una computadora que no posee la complejidad de comprensión lingüística que tenemos los humanos. “Lo intentan, hacia allá se dirigen, pero aún falta más desarrollo semántico en tales sistemas”.

¿Hacia dónde van las bibliotecas, hemerotecas y la lectura?

Frente a esa situación, nuestras consultas deben realizarse en un lenguaje estándar, con sintaxis adecuada y semántica clara. Por ejemplo, si indagamos “león” debemos precisar, de inicio, si se trata del animal, la ciudad de Guanajuato o el equipo de futbol.

Recordó que en Google, a diferencia de otras herramientas digitales, son más fácil las búsquedas debido a la estructuración de su contenido; es decir, se trata de un gran motor que se adhiere más al lenguaje natural, porque tiene texto completo, ello es bueno y malo.

En esa plataforma las búsquedas son sencillas, pero con frecuencia no precisas; en cambio, sitios como bibliotecas y repositorios digitales son espacios más estructurados y formales en la web donde recuperamos otro tipo de recursos de información confiable, actualizada y organizada.

Suárez Sánchez mencionó que se adhieren a la normatividad para la integración de los recursos en la web, todo lo que se integra debe pasar por una reglamentación establecida por un consorcio: el W3C (World Wide Web Consortium).

Para ello, utilizan esquemas de metadatos que describen adecuadamente los recursos, lo que incide en la recuperación de la información, eso tiene que ver con algo que llamamos web semántica, que es más significativa y estructurada en términos de metadatos.

Bibliotecas y repositorios digitales son fáciles de revisar. “Trabajamos en una recuperación semántica de la información, cuyo supuesto es un enlace significativo entre las consultas de los usuarios en lenguaje natural y esos recursos indizados en lenguaje controlado que necesita para satisfacer su necesidad informativa”, precisó.

Su premisa es la difusión y acceso global con miras a generar conocimiento. Por ejemplo, en México podemos consultar repositorios sobre cultura china, o de canciones rumanas, esa es la ventaja de esos espacios -a diferencia de Google-, porque son más estructuradas, cuentan con información confiable; eso es importante en el contexto de las fake news, que circulan en la red.

En las últimas décadas la Universidad Nacional desarrolló un proyecto en la materia que dio origen al Repositorio Institucional de la UNAM, el cual contiene más de tres millones de recursos digitales. Hasta el momento es un portal centralizado que contiene todos aquellos creados en esta casa de estudios; está abierto para el público en general, finalizó Adriana Suárez.