Por MATT O’BRIEN, Associated Press
La plataforma de redes sociales Reddit demandó a la firma de inteligencia artificial Perplexity AI y a otras tres compañías el miércoles, acusándolas de participar en una economía “ilegal a escala industrial” para “eliminar” los comentarios de millones de usuarios de Reddit con fines comerciales.
La demanda de Reddit en el tribunal federal de Nueva York apunta a Perplexity, con sede en San Francisco, un chatbot de inteligencia artificial y “motor de respuestas” que compite con Google, ChatGPT y otros en búsquedas en línea.
También se menciona en la demanda la empresa lituana de extracción de datos OxyLabs UAB, un dominio web llamado AWMProxy que Reddit describe como una “antigua botnet rusa”, y la startup SerpApi, con sede en Texas, que incluye a Confusion como cliente en su sitio web.
Esta es la segunda demanda de este tipo de Reddit desde que demandó a otra importante empresa de inteligencia artificial, Anthropic, en junio.
Pero la demanda presentada el miércoles es diferente porque no solo enfrenta a una empresa de inteligencia artificial, sino también a servicios poco conocidos de los que depende la industria de la inteligencia artificial para adquirir los textos en línea necesarios para entrenar chatbots de inteligencia artificial.
“Los scrapers eluden las protecciones técnicas para robar información y luego venderla a clientes ávidos de material de capacitación. Reddit es un objetivo principal porque es una de las colecciones más grandes y dinámicas de conversaciones humanas jamás creadas”, dijo el director legal de Reddit, Ben Lee, en un comunicado el miércoles.
Las demandas acusan a las empresas de competencia desleal y enriquecimiento injusto, y alegan que algunas de ellas violaron las leyes de derechos de autor estadounidenses.
Paraplexity dijo que aún no ha sido demandado, pero “siempre luchará vigorosamente por el derecho de los usuarios a acceder libre y justamente al conocimiento público. Nuestro enfoque seguirá siendo responsable y basado en principios, ya que brindamos respuestas reales con IA precisa y no toleraremos amenazas contra la apertura y el interés público”.
El director de éxito del cliente de SerpApi, Ryan Shaffer, dijo en un correo electrónico: “Estamos totalmente en desacuerdo con las acusaciones de Reddit y tenemos la intención de defendernos enérgicamente en los tribunales”.
OxyLabs dijo en un comunicado que estaba “conmocionado y decepcionado” y “no dudará en defenderse de estas acusaciones”.
“La posición de OxiLab es que ninguna empresa debería reclamar la propiedad de datos públicos que no le pertenecen”, dijo en un comunicado Denas Grybauskas, director de estrategia y gobernanza de la empresa. “Es posible que esto sea sólo un intento de vender los mismos datos públicos a un precio inflado”.
No se pudo contactar de inmediato a AWMProxy para hacer comentarios.
La búsqueda de datos en línea disponibles públicamente es una práctica común utilizada por empresas e investigadores, pero Reddit compara a las empresas a las que está demandando con “aspirantes a ladrones de bancos” que no pueden entrar en las bóvedas de los bancos, por lo que en su lugar entran en camiones blindados. La demanda alega que están eludiendo las propias medidas anti-scraping de Reddit y están “eludiendo los controles de Google y eliminando el contenido de Reddit directamente de los resultados del motor de búsqueda de Google”.
Lee dijo que si bien no pueden eliminar Reddit directamente, “enmascaran sus identidades, ocultan sus ubicaciones y se hacen pasar por sus raspadores web para robar contenido de Reddit de la búsqueda de Google. Perplexity es un cliente dispuesto de al menos uno de estos raspadores, y el propio Reddit elige comprar los datos robados en lugar de celebrar un acuerdo legal”.
Reddit presentó un argumento similar en su demanda contra Anthropic, alegando que la compañía ignoró las súplicas de Reddit de dejar de usar su contenido. El caso se presentó inicialmente en el Tribunal Superior de California, pero luego se transfirió al tribunal federal y su audiencia estaba prevista para enero.
Además de los libros y artículos de noticias digitalizados, sitios web como Wikipedia y Reddit son depósitos profundos de contenido escrito que pueden ayudar a un asistente de IA a aprender patrones del lenguaje humano.
Hay Reddit Ingrese el acuerdo de licencia de antemano Con Google, Abierto AI Y otras empresas están pagando para poder entrenar sus sistemas de inteligencia artificial a partir de los comentarios públicos de los más de 100 millones de usuarios diarios de Reddit.
Los acuerdos de licencia ayudaron a la plataforma en línea de 20 años a recaudar dinero antes de su debut en Wall Street como empresa que cotiza en bolsa el año pasado.
Publicado originalmente por:











