• Reducir  fuente
  • Aumentar  fuente
22 Dic 2017

MINETAD y Real Academia de la Lengua crearán un corpus textual para impulsar la industria de las tecnologías del lenguaje


Las palabras constituyen el eje entorno al que gira toda la industria de las tecnologías del lenguaje, una de las que tienen mayor proyección en el ámbito de las TIC. Con el objetivo de dotar a las empresas de este sector de un corpus textual que permita incrementar las infraestructuras lingüísticas de nuestro país, el Ministerio de Energía, Turismo y Agenda Digital ha anunciado la puesta en marcha de un nuevo proyecto con la Real Academia Española, que se enmarca en el convenio de colaboración que rubricaron ambas entidades el año pasado.

Para hacerlo realidad, la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital (SESIAD) cuenta con un presupuesto de más de 580.000 euros. Se dedicará al diseño, adquisición y marcación de este corpus, así como a la gestión de derechos y licencias, y la documentación y preparación para su acceso y posterior distribución.

El objetivo que se pretende al dotar a la industria de este nuevo corpus textual es impulsar las infraestructuras lingüísticas, aumentando el número, la calidad y la disponibilidad de las existentes en español. Para ello, la Real Academia ostenta una posición privilegiada respecto a la lengua española y conocimientos en diccionarios, lingüística y lingüística computacional.

La colaboración entre la SESIAD y la Real Academia se remonta al año 2016, cuando se firmó el convenio marco para apoyar y ayudar en la definición del Plan de Impulso de Tecnologías del Lenguaje, la iniciativa del Gobierno para fomentar el desarrollo de las tecnologías que facilitan a los ordenadores una comprensión automática cada vez más profunda de la información de contenido lingüístico.

El secretario de Estado para la Sociedad de la Información y la Agenda Digital, José María Lassalle, y el director de la Real Academia Española, Darío Villanueva, se encargaron de firmar una nueva adenda al convenio marco de colaboración entre ambos organismos, para poner este proyecto en marcha.

Cabe recordar que la iniciativa forma parte del Plan de Impulso de las Tecnologías del Lenguaje, cuyo objetivo general es desarrollar la industria del procesamiento del lenguaje natural y la traducción automática en España; especialmente en lengua española y lenguas cooficiales. Para ello se trabaja en distintos frentes. En primer lugar, se pretende aumentar el número, calidad y disponibilidad de las infraestructuras lingüísticas en español y lenguas cooficiales.

Además, se quiere impulsar la Industria del lenguaje fomentando la transferencia de conocimiento entre el sector investigador y la industria, ayudando a la internacionalización de las empresas e instituciones que componen el sector y fomentando la cooperación con la comunidad iberoamericana.

Finalmente, se busca mejorar la calidad y capacidad del servicio público incorporando las tecnologías de procesamiento de lenguaje natural y de la traducción automática, actuando, de esta forma, como tractor de la demanda.

 



Los comentarios están cerrados.