Baidu, el gigante tecnológico chino especializado en servicios relacionados con Internet e inteligencia artificial (IA), ha superado los rivales, Google y Microsoft en una competición permanente de IA diseñada para ayudar a las máquinas a entender mejor el lenguaje humano.

Baidu alcanzó la puntuación más alta de la evaluación general de la comprensión lingüística (GLUE), un punto de referencia ampliamente aceptado para la formación, la evaluación y el análisis de los sistemas de comprensión lingüística de la IA.

GLUE consta de nueve pruebas de comprensión del lenguaje de nuevo frases o pares de frases diferentes basadas en conjuntos de datos existentes establecidos y seleccionadas para cubrir un abanico diverso de tamaños de conjuntos de datos, géneros de texto y grados de dificultad. La media de personas obtiene unos 87 puntos sobre un centenar en la escala GLUE.

Baidu utilizar su propio modelo de IA con la lengua china, llamada ERNIE (que significa «Emejorado Representación mediante kNconocimiento yonuevo TestamentoEgración «). La compañía se ha convertido en el primer equipo que supera los 90 con su modelo, ERNIE, y también ha superado el mercado clasificación gobernado por empresas y universidades tecnológicas de EEUU.

No sólo eso, sino que Baidu también se convirtió en uno de los únicos 10 sistemas de inteligencia artificial que superó la puntuación humana media de 87,1 en el punto de referencia GLUE.

ERNIE de Baidu se inspiró en BERT de Google (Bidireccional Encoder Rpresentaciones de Transformers), que se creó a finales del 2018. Ambos modelos predicen e interpretan el significado de la palabra teniendo en cuenta el contexto que aparece antes y después de ella en una frase a la vez.

Esto se hace mediante una técnica llamada «enmascaramiento», donde la IA esconde aleatoriamente palabras para predecir el significado de la frase.

Sin embargo, los investigadores de Baidu se dieron cuenta que tenían que hacer cambios a ERNIE debido a las diferencias entre el chino y el inglés. Al crear su propio modelo ERNIE utilizando la lengua china, formó ERNIE para predecir conjuntos de palabras que faltan en chino y luego lo utilizó para palabras en inglés.

Los investigadores de Baidu «formaron ERNIE sobre una nueva versión del enmascaramiento que esconde cadenas de personajes en lugar de solteros. También lo entrenaron para distinguir entre cadenas significativas y aleatorias, por lo que podía enmascarar las combinaciones de caracteres adecuadas en consecuencia «, escribió MIT Technology Review, Que informó por primera vez de la investigación.

«Cuando empezamos este trabajo, pensábamos específicamente en ciertas características de la lengua china. Pero rápidamente descubrimos que era aplicable más allá de eso «, hao Tian, ​​arquitecto jefe de Baidu Research.

Este método hizo el algoritmo aún más fuerte en la comprensión del inglés, lo que permitió a ERNIE alcanzar la puntuación de COLA más alta hasta ahora.

Los investigadores de Baidu tienen previsto presentar un papel detallado sobre cómo se formó el Ernie para la prueba de lengua en la conferencia de la Asociación para el avance de la inteligencia artificial del año próximo.