Home Técnica Estos nuevos modelos de IA están diseñados para funcionar en cualquier lugar...

Estos nuevos modelos de IA están diseñados para funcionar en cualquier lugar y en muchos idiomas.

5

desarrollador francés Mistral AI Están lanzando un nuevo conjunto de modelos de lenguaje diseñados para brindar capacidades de inteligencia artificial de alta gama a más personas, independientemente de dónde vivan, qué tan confiable sea su acceso a Internet o qué idioma hablen.

La compañía anunció el martes un nuevo modelo de lengua grande llamado Mistral Large 3, que está destinado a un uso más amplio y de uso general. Piense en ChatGPT o Gemini. Otros modelos vienen en diferentes tamaños y capacidades y están diseñados para usarse en el propio dispositivo. Estos pequeños modelos pueden funcionar en computadoras portátiles, teléfonos inteligentes, automóviles o robots y pueden ajustarse para realizar tareas específicas.

Atlas de IA

Todos los modelos son de código abierto y de peso abierto, lo que significa que los desarrolladores que los utilizan pueden ver cómo funcionan y adaptarlos a sus necesidades. “Creemos firmemente que esto hará que la IA sea accesible para todos, esencialmente poniendo la IA en sus manos”, dijo en una entrevista Guillaume Lampl, cofundador y científico jefe de Mistral AI.

Mistral AI, fundada por ex Google DeepMind y metainvestigadores, no es un nombre tan grande en los EE. UU. como rivales como OpenAI y Anthropic, pero es más conocido en Europa. Junto a los modelos disponibles para investigadores y empresas, ofrece un chatbot llamado Le Chat, que está disponible a través del navegador o en la App Store.

Los modelos de IA están diseñados para ser multilingües

Lampl dice que la compañía tiene el objetivo con su nuevo conjunto de modelos de proporcionar capacidades de inteligencia artificial de vanguardia y de alta gama que sean de código abierto y accesibles. Parte de esto tiene que ver con el lenguaje. Los modelos de IA más populares en EE. UU. se desarrollan principalmente para su uso en inglés, como herramientas de evaluación comparativa que comparan las capacidades de los modelos. Y si bien estos modelos pueden funcionar y traducirse a otros idiomas, es posible que no sean tan buenos como sugieren los puntos de referencia cuando se usan en idiomas distintos del inglés, dijo Lampl.

Échale un vistazo: ¿Puede la IA crear adicción al juego? Guerras de navegadores impulsadas por IA y el futuro del trabajo con Jason Hiner Tech Today de ZDNET

Mistral AI quería que sus nuevos modelos funcionaran mejor para hablantes de todos los idiomas, por lo que aumentó la cantidad de datos de entrenamiento en idiomas distintos del inglés en proporción a los datos en inglés. “Creo que la gente generalmente no pone demasiado énfasis en las capacidades multilingües porque si lo hacen, también degradarán ligeramente el rendimiento de los puntos de referencia populares que todos miran”, dijo Lampl. “Así que si quieres que tu modelo brille en criterios populares, tienes que renunciar al (rendimiento) multilingüe. Y a la inversa, si quieres que el modelo sea realmente bueno en multilingüe, básicamente tienes que renunciar a criterios populares”.

Varios tamaños para diferentes usos.

Además del modelo Mistral Large 3 de uso general, con un total de 675 mil millones de parámetros, hay tres modelos más pequeños llamados Minstral 3 (3 mil millones, 8 mil millones y 14 mil millones de parámetros), cada uno de los cuales viene en tres variaciones, para un total de nueve. (Un parámetro es un peso o función que le dice a un modelo cómo manejar sus datos de entrada. Los modelos más grandes son mejores y más capaces, pero requieren más potencia de cálculo y funcionan más lentamente).

Las tres variaciones de modelos pequeños se dividen así: un modelo base que el usuario puede modificar y ajustar, uno mistral que puede funcionar bien y uno que dedica más tiempo a iterar y procesar una pregunta para obtener una buena respuesta para un argumento.

Leer más: La IA es esencial: 29 formas en las que puedes poner la IA Zen a trabajar para ti, según nuestros expertos

Según Lampl, los modelos más pequeños son especialmente importantes porque muchos usuarios de IA quieren algo que haga una o dos tareas bien y de manera eficiente en lugar de modelos genéricos más grandes y costosos. Los desarrolladores pueden personalizar estos modelos para esa tarea específica y un individuo u organización puede alojarlos en sus propios servidores, ahorrando el costo de ejecutarlos en un centro de datos en algún lugar.

Los modelos más pequeños también pueden funcionar en ciertos dispositivos. Uno pequeño puede ejecutarse en su teléfono inteligente, uno un poco más grande en su computadora portátil. Esto incluye beneficios de privacidad y seguridad (sus datos nunca salen de su dispositivo), así como ahorros de costos y energía.

Un modelo pequeño que se ejecuta en el dispositivo tampoco requiere acceso a Internet para funcionar, lo cual es esencial cuando se piensa en el uso de IA en cosas como robots y automóviles, donde las cosas no dependen de una conexión Wi-Fi confiable para funcionar correctamente.

Enlace fuente