Pasado y presente
de la lengua española

La Real Academia y el Ministerio de Educación y Cultura estudiarán la evolución de nuestro idioma y
crearán una base de datos con 250 millones de formas

El Consejo de Ministros ha autorizado la formalización de un convenio entre el Ministerio de Educación y Cultura y la Real Academia Española
para la creación de dos conjuntos textuales, denominados corpus,
que proporcionen conjuntamente, mediante

250 millones de formas de uso y manifestación, una idea exacta de lo que ha sido el español
a lo largo de su historia, su evolución y la realidad de nuestro idioma en la actualidad.

La base de datos a elaborar por
el MEC y la RAE recopilará, en soporte electrónico todas formas de uso y manifestación del idioma español, desde sus orígenes hasta nuestros días. (Foto: EFE)

Madrid.- El Consejo de Ministros, en reunión celebrada el viernes 28 de mayo, ha resuelto autorizar al Ministerio de Educación y Cultura y a la Real Academia Española el establecimiento y formalización de un convenio de colaboración que posibilite la creación de dos conjuntos textuales (denominados corpus) que proporcionen y transmitan, entre ambos, "una idea exacta de lo que ha sido el español como idioma a lo largo de la historia y lo que nuestra lengua representa en la actualidad".

Para la creación y desarrollo de estos dos conjuntos textuales, el Corpus de Referencia del Español Actual (CREA) y el Corpus Diacrónico del Español (CORDE), se destinará, según contempla el convenio autorizado por el Consejo de Ministros, un presupuesto global de 539.400.000 pesetas. El Ministerio de Educación y Cultura, a través de la Secretaría de Estado de Educación, aportará 212 millones para el citado presupuesto, mientras que la Real Academia Española aportará 313,2 millones y los 14,2 millones de pesetas restantes serán cubiertos por diversos organismos.

El desarrollo de ambos proyectos se encuadra dentro de los objetivos del III Plan Nacional de Investigación Científica y Desarrollo Tecnológico de defensa y conservación del Patrimonio Artístico e Histórico.

Según se especifica en un comunicado oficial del MEC, "cuando el trabajo esté concluido, nos encontraremos con la base de datos del idioma español, en soporte magnético, más importante del mundo hispánico". Asimismo, la realización del proyecto "situará a nuestro idioma a la altura de las lenguas de nuestro entorno (en especial el inglés) en cuanto a bases de datos que recopilen información sobre cada idioma".

CREA y CORDE

El Corpus de Referencia del Español Actual (CREA), con 125 millones de formas de manifestación del idioma español, será, al término de la segunda fase de su realización, una muestra de la lengua española de nuestros días, y estará constituido por textos, orales y escritos, correspondientes a diversos campos, géneros, zonas geográficas, medios sociales y períodos de tiempo. El CREA estudiará asimismo la evolución del idioma español en los últimos 25 años.

Por su parte, el Corpus Diacrónico del Español (CORDE), constará asimismo de 125 millones de formas, y estará constituido por textos de todas clases y procedencias, utilizados desde los orígenes del idioma español hasta el año 1974.

El resultado de ambos conjuntos textuales resultará fundamental tanto para las actividades de estudio e investigación como para su utilización en la creación de diccionarios, gramáticas y libros de enseñanza de la lengua española, e incluso para actividades de carácter comercial, al disponer de un extenso repertorio de voces y construcciones representativas de nuestra lengua en el momento presente.

arriba