
Reddit, más de un año y medio después de su primer acuerdo de intercambio de datos con Google por $ 60 millones reportados, está en conversaciones para una integración más profunda con los productos de IA de Google, según los ejecutivos familiarizados con las discusiones. Está proponiendo un nuevo tipo de asociación que alentaría a los usuarios a convertirse en contribuyentes activos en los populares foros en línea de Reddit, para que Google Site visitors podría ayudar a la empresa a crecer y generar contenido para futuras capacitación.
Reddit también planea discutir con Google y Openai, que tiene un acuerdo related, una estructura de acuerdos futuros que podría permitir el precio dinámico, donde la plataforma social puede pagarse más a medida que se vuelve más very important para las respuestas de IA, dijeron los ejecutivos, que pidieron no ser nombrados discutiendo conversaciones privadas.
Las discusiones, que no se han informado anteriormente, marcan un intento de Reddit de alejarse de los acuerdos de licencia puramente transaccionales. Por lo normal, las compañías de IA pagan una cantidad específica para mostrar contenido de Reddit dentro de sus productos de IA o para capacitar a sus modelos de IA. Pero Reddit cree que estos términos no reflejan adecuadamente cuán valiosos han sido sus datos en estas plataformas, dijeron los ejecutivos.
Los primeros acuerdos de datos de Reddit con Google y OpenAI permanecen activos. En enero de 2024, Reddit alcanzó los acuerdos de licencia, incluidos esos dos acuerdos, que generarían $ 203 millones en valor del contrato con términos que van de dos a tres años, según un documento Reddit presentado antes de su oferta pública inicial el año pasado.
Reddit, Google y OpenAi declinaron hacer comentarios sobre discusiones relacionadas con futuros acuerdos potenciales.
Los modelos de idiomas grandes, que sustentan el chatgpt de Openai, así como las descripciones de la IA de la función de búsqueda de Google y su asistente de Géminis, están capacitados en conjuntos de datos masivos raspados de Web. Reddit, con su formato único que permite discusiones en profundidad generadas por los usuarios sobre una variedad de temas de nicho y experiencias humanas, es una valiosa fuente de información para capacitar a los modelos de IA, así como informar las respuestas de AI Chatbots a las solicitudes de tiempo actual de los usuarios, a veces incluyendo enlaces a hilos reddit.
Dichos acuerdos de licencia se están volviendo más comunes a medida que las compañías de IA buscan formas legales de capacitar a sus modelos. Operai también ha alcanzado una serie de acuerdos de asociación con los principales editores de medios como Axel Springer SE, Time y Conde Nast para usar su contenido en ChatGPT.
Otros grupos de contenido alegan que varias compañías modelo de IA ya han utilizado ilegalmente sus datos. Los editores, incluidos los New York Occasions Co. y Penske Media, han decidido demandar a Openi y Google, respectivamente, alegando que las compañías han obtenido su trabajo incorrectamente sin permiso, alejando el tráfico de sus sitios net.
Reddit también ha demandado al rival de Operai Anthrope, alegando que la startup de IA raspó ilegalmente sus datos para capacitar a los modelos AI de Anthopic. Anthrope recientemente acordó pagar al menos $ 1.5 mil millones a un grupo de autores en uno de los acuerdos de derechos de autor más grandes en la historia de los Estados Unidos.
Reddit sigue siendo una de las fuentes más citadas en las plataformas de IA, según la compañía de análisis Profound AI. Sin embargo, los ejecutivos de Reddit han notado que el tráfico proveniente de Google tiene un valor limitado, ya que los usuarios que buscan respuestas a una pregunta específica a menudo no se convierten en convertirse en redditores activos, dijeron las personas.
Ahora, Reddit se está involucrando con los equipos de productos en Google con la esperanza de encontrar formas de enviar más de sus usuarios más profundamente a su ecosistema de foros comunitarios, según los ejecutivos. A cambio, Reddit está buscando formas de proporcionar más datos de alta calidad a sus socios de IA. Las discusiones entre Reddit y Google han sido productivas, dijeron las personas.
«Estamos a mitad de vuelo en nuestros acuerdos de licencia de datos y aún aprendemos, pero lo que hemos visto es que los datos de Reddit son altamente citados y valorados», dijo la directora de operaciones de Reddit, Jen Wong, el 31 de julio durante una llamada con los inversores. «Continuaremos evaluando a medida que avanzamos».
Griffin, Alba y Ghaffary Write para Bloomberg.
(Tagstotranslate) Tecnología
Descubre más desde Breaking News 24
Suscríbete y recibe las últimas entradas en tu correo electrónico.