Meta lanza Llama 3.2, su primer modelo de lenguaje multimodal de código abierto

Meta ha presentado su primer modelo de lenguaje multimodal Llama 3.2, compuesto por los modelos de pequeño y mediano tamaño 11B y 90B, capaces de procesar tanto imágenes como texto, y por los modelos livianos de solo texto 1B y 3B. 

Image description

En el marco de su evento Meta Connect 2024, la tecnológica ha dado a conocer sus últimas novedades, incluido su nuevo modelo de lenguaje, que llega dos meses después de la presentación de Llama 3.1, y que introduce la capacidad de procesar imágenes por primera vez en la compañía. 

Así, el nuevo modelo Llama 3.2 se compone de dos modelos multimodales pequeño y mediano, con 11.000 millones de parámetros (11B) y 90.000 millones de parámetros (90B) respectivamente. En este sentido, los casos de uso de estos nuevos modelos admiten razonamiento de imágenes, como puede ser la comprensión de gráficos y diagramas o subtítulos de imágenes. Asimismo, también procesan la localización direccional de objetos en imágenes.

 Es decir, este modelo permite llevar a cabo acciones como extraer detalles de una fotografía, comprender la escena y, tras ello, crear oraciones que podrían utilizarse como título de la imagen o inicio para contar una historia. 

Igualmente, Llama 3.2 se completa con dos modelos de menor tamaño, 1B y 3B, que procesan texto exclusivamente y están ideados para funcionar en dispositivos, como un smartphone. Estos modelos están optimizados para procesadores ARM y pueden resolver múltiples tareas con una latencia mínima, asimismo, admiten una longitud de contexto de 128.000 tokens. 

En concreto, estos modelos permiten a los desarrolladores crear aplicaciones personalizadas en el dispositivo, asegurando los datos se mantienen privados dentro del 'smartphone' o producto en cuestión. Por ejemplo, Meta ha señalado que pueden utilizarse para llevar a cabo resúmenes de los diez últimos mensajes recibidos en una 'app' de mensajería instantánea. Igualmente, pueden aplicarse para enviar de forma automática invitaciones de calendario para organizar reuniones. 

Sin embargo, la tecnológica ha señalado que estos modelos destacan, sobre todo, por su capacidad de ejecutarse localmente. Por un lado, esta función permite que las indicaciones o respuestas del modelos sean instantáneas, ya que se procesan localmente. Por otra parte, garantiza una privacidad total, al no enviar datos como mensajes o información del calendario a la nube. 

COMPETITIVOS CON CLAUDE 3 HAIKU GPT4O-MINI 

Según la evaluación de estos modelos ofrecida por Meta, los modelos 3.2 11B y 90B son competitivos con los modelos básicos líderes, Claude 3 Haiku y GPT4o-mini en el reconocimiento de imágenes y una variedad de tareas de comprensión visual. 

Por su parte, el modelo 3B supera a los modelos Gemma 2 2.6B y Phi 3.5-mini a la hora de ejecutar tareas como seguir instrucciones, resumir, reescribir indicaciones y usar herramientas. Igualmente, el modelo 1B es en este ámbito con Gemma. 

Para llegar a estas conclusiones, Meta evaluó el rendimiento de los modelos en más de 150 conjuntos de datos de referencia que, abarcando una amplia variedad de idiomas. 

Con todo ello, la compañía ha señalado que el modelo de lenguaje grande Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, de cara a que empiecen a probar y experimentar sus posibilidades. Asimismo, todas estas capacidades se han incluido en su asistente de IA, Meta AI.

Tu opinión enriquece este artículo:

Líderes de Alibaba.com, Miravia, Destinia, Just Eat, Ikea o Alain Afflelou se citarán en el Retail Tech Fest para desvelar sus claves de éxito en ecommerce

Con un peso cada vez mayor en la economía comunitaria, el sector del retail representa ya el 11,5% del valor añadido de la Unión Europea y da empleo a cerca de 30 millones de personas. Como consecuencia de esta relevancia en la esfera internacional y del papel estratégico que la innovación tecnológica desempeña en su evolución, Adigital y DES – Digital Enterprise Show 2025 coorganizarán por primera vez el Retail Tech Fest, el nuevo punto de encuentro de referencia para el ecosistema minorista y de comercio electrónico.

Mahou San Miguel impulsa la realización del mural más grande de Madrid en el Palacio Vistalegre

Mahou San Miguel, compañía de bebidas y servicios, 100% española y líder del sector cervecero en nuestro país, refuerza su compromiso con Madrid y la escena creativa de la ciudad con una colaboración única con motivo del 25º aniversario del Palacio Vistalegre, ubicado en Carabanchel. Concretamente, la compañía ha impulsado la creación de "La musa de Vistalegre", un mural de 1.100 m² que cubre la fachada del espacio y que es obra del artista urbano Sfhir, uno de los más reconocidos internacionalmente y originario de este barrio. Con este mural, el más ambicioso hasta el momento para el autor, se quiere rendir homenaje a la cultura local a través de la representación de una figura femenina tocando la guitarra.

Estas son las cervezas preferidas de los españoles en cada comunidad autónoma (y hay algunas con Estrella)

Con la llegada de la primavera y el regreso del buen tiempo, los españoles recuperan uno de sus rituales más esperados: disfrutar de una cerveza bien fría en la terraza de un bar. En este contexto, Tiendeo, la plataforma líder que agrupa todas las ofertas digitales de las tiendas y que forma parte de la empresa tecnológica Shopfully, presenta su informe anual sobre las cervezas preferidas en España. El análisis, basado en millones de búsquedas registradas por los usuarios Tiendeo durante el último año, ofrece una radiografía actualizada de los hábitos de consumo y las preferencias cerveceras a nivel nacional y regional.

Amazon busca pueblo para celebrar una gran fiesta popular y seguir apoyando al mundo rural en España

Las fiestas de los pueblos forman parte de nuestra identidad y son un componente imprescindible dentro de la cultura española a lo largo y ancho de todo el país. Por ello, Amazon ha anunciado el lanzamiento de “Amazon busca pueblo”, una iniciativa que trata de encontrar el pueblo ideal para celebrar una gran fiesta popular como parte de su continuado compromiso con el mundo rural. 

El teletrabajo en Cataluña volvió a aumentar (15,8%, +1,1 p.p.) pero sigue lejos de la media europea (24,1%)

 Los últimos ocho trimestres (todo 2023 y 2024) muestran un aumento en el número de teletrabajadores en la comparación interanual. En el cuarto trimestre de 2024 hubo 3,2 millones de personas que trabajaron al menos ocasionalmente desde su hogar, cifra que es un 4,1% más alta que la de un año antes. La proporción de teletrabajadores en el total de ocupados, tomando como referencia la media móvil de cuatro trimestres, aumentó 0,9 puntos porcentuales en la comparación interanual, situándose en el 14,4%, es decir, en España, el 14,4% de los ocupados trabaja en remoto, al menos ocasionalmente. 

¿Quién dijo que la tele había muerto? El futuro inteligente de la publicidad está conectado

La televisión conectada (Connected TV, CTV) ha consolidado su posición como uno de los canales más eficaces y estratégicos dentro del ecosistema publicitario digital. Dos años después de que plataformas como Netflix comenzaran a incorporar modelos publicitarios, desde Transformance, la unidad especializada en Medios Digitales y Martech de WAM Global, recogen las claves que están convirtiendo la publicidad en CTV en una de las herramientas más rentables del marketing actual.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.