La Real Academia de la Lengua me invita a ser miembro de la institución @RAEInforma

Todo comenzó el pasado 1 de marzo de 2017, cuando poco antes de hablar de AURA asistí a la presentación del libro “El valor Económico del Español”. Allí tuve la suerte de escuchar al gran Mario Vargas Llosa hablado de la importancia del Español en nuestro mundo, en la economía de hoy en día y en la futura. Pero yo tenía alguna que otra queja.

Figura 1: La Real Academia de la Lengua me invita a ser miembro de la institución

Aproveché para reunirme con algunos académicos de la RAE, y les conté algunas de mis preocupaciones sobre dicho tema. Básicamente, mi problema es que, la tecnología que crean las grandes empresas anglosajonas, nos está manipulando y redefiniendo el Español para hacerlo más pobre y menos diferente con su propia lengua, que argumente con una serie de motivos que os paso a enumerar.
1) Si no hay palabra bien definida, se usa la versión anglosajona: No hace falta que os diga que les saqué mi caballo de batalla personal con el término hacker, al que creía que la RAE había incluido en el diccionario con una definición que no era para nada la que nosotros entendíamos, por eso nunca íbamos a utilizar “pirata informático”. Seguiríamos utilizando Hacker con su definición anglosajona, y eso resta valor e importancia al diccionario, que es una de nuestras herramientas más poderosa.
Figura 2: Definición de Hacker en inglés en el IETF
2) El Español de baja frecuencia: Cuando analizamos los sistemas de reconocimiento de términos que se utilizan en las tecnologías de las grandes empresas de tecnología, es pésimo. Basta hacer una pequeña prueba con palabras esdrújulas, menos utilizadas ampliamente por la mayoría de los hispano parlantes en la red, y darse cuenta como los sistemas correctores dan por malas una cantidad enorme de ellas.
Figura 3: En rojo términos no reconocidos por el corrector de Google
Esto es simplemente porque son palabras de baja frecuencia, es decir, que no están en la gran mayoría de los sistemas correctores que utiliza el software más popular de Microsoft, Google o Apple. Basta con ver el ejemplo.
3) Los errores de alta frecuencia: No hace falta decir que muchos usuarios utilizan el buscador de Google para ver si una palabra está bien escrita o mal escrita. Su criterio es, que si Google le dice que hay muchos resultados, entonces está bien. Y eso no es siempre así. Casos como cuando se utiliza el imperativo más el pronombre para dar una orden y se cambia por el infinitivo. Para la gente es una cuestión de cuántas referencias salen.
Figura 4: Resultados con "poneos".

Es cierto que ambas son formas válidas, pero depende del contexto y el uso. No es lo mismo un “Deberíais poneros a estudiar” que un “Dejar de hablar y poneos a estudiar”. Por desgracia, la elección de muchos visitantes es el mero número de resultados.


Figura 5: Resultados con "poneros". Se come al infinitivo.
4) Los acentos hablados: Con la construcción de AURA, nosotros estamos dotando a nuestras tecnologías de tecnologías “Cogntive”. Es decir, de interfaces humanos como el reconocimiento natural del habla o la visión artificial. Cuando vamos a ver cómo funcionan los reconocimientos naturales del habla, tenemos un problema mayor con los acentos y dejes locales, ya que el Español de baja frecuencia ya no es solo en su forma escrita, si no en su forma hablada, por lo que el número de términos que perdemos es mayor. Así, un acento gaditano de Español hablando a un sistema NLP de tecnologías Microsoft o Google, tiene dos problemas. O bien no reconoce muchas de las palabras o bien el usuario debe modificar su acentuación, y por tanto perder la riqueza que ella lleva.
Además, harían falta sistemas de AI basados en el lenguaje Español. A día de hoy, ninguna empresa tecnológica anglosajona propone servicios cognitive que te digan, por ejemplo, el significado del término en frase o la probabilidad de procedencia del interlocutor.

Con escuchar hablar a un catalán, a un gallego (de Galicia), a un porteño, un chileno, o un sevillano, es posible para muchos de nosotros reconocerlo. Bien por el acento, bien por el significado de las palabras en las expresiones, bien por las referencias locales. Esto, a día de hoy no existe en los sistemas de AI que ofrecen servicios "cognitivos" y perdemos una ventaja de posicionamiento en el futuro.

Por último, mi preocupación era sobre qué pasa con las otras formas de representación del Español, por medio de cosas como los Emojis o el lenguaje leet, u otros que van apareciendo en la red. Esto ya sucedió con los mensajes SMS(esmés) en el pasado, pero ahora hay muchas formas de representación.

Figura 6: Un "Ole tus huevos, campeón" en Emoji

Con este debate pasamos un rato interesante, e incluso conseguí que me dijeran que iban a ver cómo solucionaban lo del término hacker – algo que por cierto ya han resuelto -. Lo que no pensaba yo es que mi idea terminara cuajando y me ofrecieran a mí ser miembro de la RAE, por medio de la carta que me enviaron hace poco más de un mes, y que os he colgado en SlideShare.

La verdad es que después de que me eligieran uno de los 100 españoles más influyentes del año, de recibir la Cruz del mérito con distintivo blanco de la Guardia Civil, este ha sido el colofón perfecto para el año. Así que, como tenía hasta fin de año para decidirme, he dicho que sí, y a partir de ahora no volveré a escribir ningún término en inglés en mi bitácora y la despedida tendrá también su signo de admiración a la apertura de la frase.

¡Saludos Malignos!

Via: www.elladodelmal.com
La Real Academia de la Lengua me invita a ser miembro de la institución @RAEInforma La Real Academia de la Lengua me invita a ser miembro de la institución @RAEInforma Reviewed by Zion3R on 5:17 Rating: 5