Hasta hace unas semanas, muy pocas personas en el mundo occidental se enteraron de una pequeña compañía de inteligencia artificial china (AI) conocida como Dipsec. Sin embargo, el 20 de enero, Capturar la atención global Cuando publica un nuevo modelo de IA llamado R1.

R1 es un modelo de “lógica”, lo que significa que funciona a través de tareas de paso por paso y su efectividad se detalla para un usuario. Esta es una versión más desarrollada de DIPSC Modelo V3Que fue publicado en diciembre. La nueva oferta de Depsec es casi tan poderosa como el modelo de IA más avanzado de Operai y 1, pero en una parte del gasto.

En unos pocos días, la aplicación DIPSC superó a Chatzipt en nuevas descargas y establece el precio de las acciones de las agencias de tecnología en los Estados Unidos CaídaEl También lideró la apertura Afirmar Eso fue efectivamente impulsado por algunas gemas de la corona para crearse a partir de sus modelos rivales de OpenAI chinos.

A Declaración en el New York TimesLa compañía dijo:

Estamos conscientes y revisamos los sugerencias que pueden distribuir nuestros modelos de manera inapropiada a nuestros modelos y compartir información que más conocemos. Tomamos los contrarrestantes prácticos y ofensivos para proteger nuestra tecnología y continuamos trabajando en estrecha colaboración con el gobierno de los Estados Unidos para proteger los modelos más capaces aquí.

La conversación contactó a las caídas para el comentario, pero no respondió.

Incluso si el DEPSEC se copia, o, en la parlencia científica, “destila”, al menos un chatzpt por hacer al menos R1, debe recordarse que los modelos de Openi están acusados ​​de faltar el respeto a la propiedad intelectual mientras se desarrollan.

¿Qué es Patan?

La distribución del modelo es una técnica de aprendizaje automático común donde un pequeño “modelo de estudiante” está capacitado para predecir un “modelo de maestro” más grande y más complejo.

Cuando esté terminado, el estudiante puede ser casi tan bueno como el maestro, pero presentará el conocimiento del maestro de manera más efectiva y compacta.

Para hacer esto, el maestro no necesita acceder a las tareas internas. Esta estrategia debe eliminarse para hacerle al modelo las preguntas suficientes al maestro para capacitar a todos los estudiantes.

Openi Dipsec afirma que esto es lo que: OpenAi y 1 han buscado en una gran escala y los modelos más calificados de DIPSC usaron resultados observados para el entrenamiento.

Una fracción de riqueza

Dipsc Afirmar Tanto la capacitación como el uso de R1 necesitan una fracción de recursos necesarios para desarrollar los mejores modelos de sus competidores.

Hay razones para sospechar sobre algunos de los bombines de marketing de la organización, por ejemplo, un Nuevo informe independiente El gasto de hardware R1A sugiere que fue tan alto como $ 500 millones. Sin embargo, sin embargo, DipSec todavía se construyó muy rápido y eficientemente al comparar modelos rivales.

Esto puede deberse a que DIPSEC dispersa la salida del Abierto. Sin embargo, en la actualidad no hay forma de demostrarlo al final. Ser un método de desarrollo en las primeras etapas de desarrollo Salida de AI de marca de aguaEl Es similar a las imágenes aplicadas a derechos de autor, agregando patrones invisibles a las salidas. Hay diferentes formas de hacer esto teóricamente, pero no es efectivo o hábil convertirlo en realidad.

Hay otras razones que ayudan a explicar el éxito del diputado, como el trabajo técnico profundo y desafiante de la compañía.

El progreso técnico realizado por DIPSCS incluyó el beneficio de los chips de IA baratos (llamado unidad de procesamiento gráfico o GPU).

No había otra forma que adaptarse después de Depsec US agencias prohibidas Desde exportar el chip de IA más potente a China.

Aunque las compañías de IA occidentales pueden comprar estas poderosas unidades, las restricciones de exportación obligaron a las empresas chinas a inventar el mejor uso de opciones baratas.

Fig en un chip de computadora cerrado en un panel azul.
Estados Unidos ha prohibido la exportación del chip de computadora más potente de China. No Gal/Shutterstock

Una serie de traje

Opadai Términos de uso Deje en claro que nadie puede usar sus modelos AI para desarrollar productos competitivos. Sin embargo, sus propios modelos están capacitados en enormes conjuntos de datos raspados de la web. Estos incluyen conjuntos de datos Una cantidad adecuada de elementos con derechos de autorQue esta abierto Sobre la base del “uso justo”::

Los modelos de IA son un uso justo de la capacitación utilizando materiales de Internet universalmente disponibles según lo respaldado por notas crónicas y ampliamente adoptadas. Vemos esta política como justa para los fabricantes, necesaria para los inventores y criticamos a nuestra competencia.

Este argumento será probado en la corte. Periódico, Músico, Escritor Y otros creadores han presentado múltiples casos contra el OpenAI sobre la base de violaciones de derechos de autor.

Por supuesto, es absolutamente único que las acusaciones hechas por las inmersiones abiertas. Sin embargo No atrae mucha simpatía El Dipsec que ha reducido ilegalmente su salida modelo para su reclamo.

Una arqueología de cómo la guerra y la guerra de litigios han superado el desarrollo de reglas legales obvias para la industria de la IA. Y aunque estos eventos recientes pueden reducir la fuerza de las llegadas de IA, muchos están involucrados en el resultado de varias disputas legales en curso.

La conversación global está temblando

DEPSEC ha demostrado que es posible desarrollar modelos sofisticados con barato y habilidad. Todavía se ve si pueden competir con el abridor en un parque infantil.

En el fin de semana, Opina intentó mostrar su dominio Liberar Su modelo de cliente más avanzado, O3-Mini.

Operai ha afirmado que este modelo incluso ha excedido su propia versión anterior de mercado, y ha excedido lo suficiente en 1 y es “el modelo más caro de nuestra serie de argumentos”.

Estos desarrollos lo convierten en un heraldo de una era de elección extendida para los clientes con la variedad de modelos de IA en el mercado. Es una buena noticia para los usuarios: la presión competitiva hará que los modelos sean baratos de usar.

Y los beneficios se extienden más.

Entrenar y usar estos modelos a Vastadora tensión Sobre el costo de la energía global. Dado que estos modelos se vuelven más ubicuos, todos nos beneficiamos de la mejora de sus habilidades.

La aparición del DIPSC es definitivamente más barato e identifica eficientemente la nueva zona para crear modelos. Es probable que las compañías de IA también sacuden la conversación global sobre cómo recopilar y usar sus datos de capacitación.Conversación

(Autor: Lia FranmanProfesor titular de procesamiento de lenguaje natural, Universidad de Melbourne, Universidad de Melbourne Y ShannanProfesor de CyberSscurity, Universidad de Melbourne)

Este artículo ha sido reubicado de Conversación Bajo la licencia Creative Commons. Leer LlaveEl

(Excepto por el título, esta historia no es editada por el personal de NDTV y se publica a partir de un feed sindicado)))


Source link