Cultural

Internet se queda pequeña ante el apetito de datos de la IA

Foto:

*Se supone que es un sándwich hecho de 1s y 0s | Hecho en Midjourney

| | 02 Abr 2024

El rápido avance de la inteligencia artificial está topándose con un obstáculo inesperado: la falta de datos suficientes en Internet para alimentar a estos gigantes hambrientos de información.

Empresas como OpenAI y Anthropic están en una carrera contra el tiempo para encontrar nuevas fuentes de datos que permitan entrenar a la próxima generación de modelos de IA.

Te contamos por qué:

Los modelos de IA más avanzados, como GPT-4 de OpenAI, necesitan cantidades astronómicas de datos para aprender. Estamos hablando de hasta 100 billones de tokens (palabras y partes de palabras).

Pero se estima que solo un 10% de la información disponible en Internet es realmente útil para este propósito. La mayoría son fragmentos inservibles.

Y para complicar aún más las cosas, plataformas como Facebook e Instagram están limitando el acceso a sus datos.

Ante este desafío, las empresas de IA están explorando alternativas creativas. OpenAI ha discutido usar transcripciones de videos públicos de YouTube para entrenar a GPT-5. Otras apuestan por generar sus propios datos sintéticos, aunque esto lleva el riesgo de crear modelos que solo hablen disparates.

En perspectiva: La escasez de datos de calidad podría frenar el desarrollo de la IA en un futuro próximo. Pero, al igual que ocurrió con el temido "pico del petróleo", es probable que la innovación y la tecnología terminen superando este desafío.

03 Abr 2025 - Periodistas y satíricos en ISOJ debaten el auge de los memes en el discurso político. Es más que un chiste

03 Abr 2025 - OPLE ordena la publicación de los listados de los candidatos a los cargos judiciales y la impresión de boletas

03 Abr 2025 - Publica la SHCP precriterios presupuestales de 2026; la deuda pública asciende a 52.3% del PIB

03 Abr 2025 - Fortalece PJCDMX respeto a derechos humanos con capacitación a su personal

03 Abr 2025 - Reforma profunda al Tribunal Universitario

02 Abr 2025 - El diputado Gutiérrez Luna espera pronta resolución del TEPJF ante apelación de la Cámara de Diputados contra el INE

02 Abr 2025 - Puebla, tercer estado más afectado por aranceles de Trump al sector automotriz

02 Abr 2025 - La declaración de amor por Los Mochis de Edgar Amador Zamora

02 Abr 2025 - Barcelona se convierte en el centro del problema de la vivienda en Europa

02 Abr 2025 - Así se vivió la primera carrera a la Basílica de Guadalupe en México

02 Abr 2025 - Los mercados abiertos son esenciales para las empresas estadounidenses: ICC México

02 Abr 2025 - Forbes lanzó su famosa lista de la gente más rica del planeta

02 Abr 2025 - Trump impone arancel de 10% a todas las importaciones y sanción recíproca a múltiples países