Mark Zuckerberg dejó en claro que utilizará imágenes publicadas en Facebook e Instagram para entrenar sus herramientas de inteligencia artificial generativa.
Al hacer una referencia a DALL-E y Midjourney de OpenAI, Zuck comparó las fuentes de datos de otras empresas de IA con las suyas. “Cuando la gente piensa en datos, normalmente piensa en el utilizar toda la data existente para entrenar un modelo desde el principio”, dice Zuckerberg.
“En Facebook e Instagram, hay cientos de miles de millones de imágenes compartidas públicamente y decenas de miles de millones de videos públicos, lo que estimamos es mayor que el conjunto de datos Common Crawl y la gente también comparte una gran cantidad de publicaciones de texto públicas en comentarios en nuestros servicios.”
En este sentido, OpenAI empleó el conjunto de datos Common Crawl para crear sus populares aplicaciones de IA. Básicamente, Zuckerberg está diciendo que Meta no necesita servicios como Common Crawl o LAION-5B (un índice de código abierto de imágenes y subtítulos en línea) porque ya tiene acceso a ese tipo de datos masivos.
Asimismo, dejó claro en su llamada de resultados que la empresa está invirtiendo mucho en inteligencia artificial y realidad virtual. En cuanto a la IA, Zuckerberg se mostró optimista al decir que está “jugando para ganar” en un espacio donde los otros jugadores incluyen a Google, OpenAI y Microsoft.
El mes pasado, Meta anunció un generador de imágenes de IA independiente para competir con empresas como DALL-E y Midjourney.
Cabe mencionar que Meta ya ha admitido que ha utilizado lo que llama datos “disponibles públicamente” para entrenar sus herramientas de inteligencia artificial.