El mundo se está quedando sin datos para seguir entrenando a la IA. China tiene un as en la manga
El mundo se está quedando sin datos para seguir entrenando a la IA, advierte Epoch AI: es probable que el texto de alta calidad disponible en Internet se agote entre 2026 y 2032. El riesgo es que, al agotarse la fuente, el crecimiento basado en volúmenes de datos podría frenarse. En respuesta, China avanza con un borrador de política que busca, para 2028, crear un ecosistema de datos validados que alimente la próxima generación de modelos de IA. El plan prioriza sectores como investigación científica, manufactura, agricultura, energía, transporte, finanzas, sanidad, educación y comercio electrónico, y también campos de vanguardia como robótica, conducción autónoma, aviación de baja altitud y biomanufactura, donde los datos provienen de sensores y entornos industriales reales. Se propone ampliar la oferta de texto, código, imágenes, audio y video para entrenar sistemas con razonamiento, comportamiento autónomo y control de robots, destacando una ventaja estructural frente a laboratorios occidentales.







