IA en la educación: Calculadora TI-84 hackeada con ChatGPT
septiembre 25, 2024ChatGPT Canvas: La nueva herramienta de ChatGPT
octubre 5, 2024El evento anual de Meta, el Meta Connect 2024, llegó cargado de novedades en el campo de la inteligencia artificial y la realidad aumentada: desde avances en modelos de IA hasta dispositivos que prometen cambiar nuestra interacción con el mundo digital. ¿Te lo perdiste? No te preocupes, aquí te hago un resumen detallado con todo lo que necesitas saber.
La estrella del show: la IA multimodal Llama 3.2
Una de las grandes revelaciones fue la presentación de Llama 3.2, la nueva familia de modelos de LLM de código abierto de Meta. Estos modelos son multimodales, ¿y qué significa esto en la práctica? Que ahora son capaces de entender e interpretar de forma nativa tanto imágenes como texto. Entre sus características principales destacan:
- Capacidad para procesar imágenes y texto simultáneamente.
- Al ser de código abierto están disponibles para que desarrolladores empiecen a trabajar con ellos de inmediato.
- Incluyen modelos de 1.000 millones, 3.000 millones, 11.000 millones y 90.000 millones de parámetros o tokens.
- La ventana de contexto se ha ampliado. Por ejemplo, los modelos más pequeños cuentan ahora con una ventana de contexto de hasta 128.000 parámetros.
- Superan en rendimiento a la anterior generación Llama 3.1 y al modelo Claude 3 en tareas de visión.
Estos modelos ya están disponibles en llama.com y en Hugging Face, y pronto lo estarán en las principales plataformas de cloud computing como Amazon Web Services, Google Cloud y Databricks.
Revolución en la creación de contenido: doblaje automático y avatares inteligentes
Si eres creador de contenido, prepárate para dos novedades que pueden cambiar tu forma de trabajar.
Creación de avatares personalizados
Los creadores ahora pueden diseñar avatares virtuales personalizados que interactúan con su audiencia de manera natural y con conocimiento personalizado. Estos avatares pueden:
- Interactuar en tiempo real con los seguidores respondiendo a preguntas.
- Enviar mensajes directos para compartir contenido y enlaces a recursos.
- Guiar las conversaciones de forma que la comunicación sea más fluida y personalizada.
Por ejemplo, un escritor puede utilizar su avatar para hablar sobre su nuevo libro, respondiendo preguntas y compartiendo detalles exclusivos a su audiencia; o una influencer de moda puede utilizarlo para mostrar las nuevas tendencias, permitiendo que su audiencia vote por sus outfits favoritos.
Doblaje automático para redes sociales
Otra innovación es el doblaje automático de contenido, como en los Reels de Instagram, manteniendo la voz original del creador y sincronizando los labios.
Inicialmente, los idiomas disponibles serán el inglés y español, lo cual es una buena noticia para la comunidad de habla hispana. Además, al conservar el tono y estilo de la voz original, así como la sincronización labial con el audio doblado, los creadores de contenido podrán llegar a audiencias mucho más amplias sin perder su autenticidad.
Nuevas aplicaciones: desde la edición de imágenes hasta la interacción por voz
Meta AI ya está integrando Llama 3.2 en sus aplicaciones, con nuevas herramientas como «Imagine Edit» y la interacción por voz con la IA.
Image Edit para editar fotos sin conocimientos técnicos
Imagine Edit permite a los usuarios subir cualquier foto y editarla de manera precisa utilizando lenguaje natural. Esto significa que puedes describir con palabras los cambios que deseas hacer en una imagen y la herramienta aplicará esas modificaciones de forma inteligente. Esta herramienta supondrá una serie de beneficios para los usuarios:
- No se necesitarán habilidades en edición fotográfica, ya que solo será necesario indicar lo que quieres cambiar o añadir y la IA se encarga del resto. Además, con una interfaz intuitiva y orientada al usuario promedio.
- Las modificaciones se integrarán de manera natural en la imagen, manteniendo una alta calidad visual.
- Al poder describir cualquier idea, las posibilidades de edición son prácticamente ilimitadas.
Por ejemplo, puedes escribir «Añadir un atardecer detrás de mí» o «Cambiar mi camisa a color azul» para que se realicen esos ajustes en la foto. Sin duda, será una herramienta de gran utilidad para mejorar las publicaciones en redes sociales o generar contenido visual adaptado a campañas publicitarias.
La nueva era de la interacción por voz
Mark Zuckerberg destacó la importancia de la voz como medio para interactuar con la inteligencia artificial. En el evento se introdujo una función de interacción por voz en aplicaciones como WhatsApp, Instagram y Messenger, que proporcionará respuestas más naturales y fluidas.
De esta forma, será posible conversar con Meta AI como si fuera una persona, la cual nos responderá de manera rápida, muy similar al funcionamiento del asistente de voz de ChatGPT. Habrá que ver cuál de los dos ofrece una mejor experiencia de usuario.
Orion: el futuro de la realidad aumentada
Sin duda, la guinda del pastel fue la presentación de Orion, el prototipo de las gafas de realidad aumentada que Meta asegura como las más avanzadas del mundo.
Entre sus características principales destacan que son ligeras (menos de 100 gramos) y sin cables, facilitando su uso. También cuenta con pantallas holográficas de alta resolución con un amplio campo de visión y alta nitidez, que prometen una experiencia inmersiva sin precedentes al ser capaces de proyectar una pantalla de cine o múltiples monitores en cualquier entorno. Además, permiten ver los ojos del interlocutor, a diferencia de otros dispositivos que usan pantallas opacas.
Por otra parte, para mejorar la interacción con las gafas, Meta está desarrollando un dispositivo de muñeca que permite controlar las funciones de manera discreta, evitando gestos incómodos o comandos de voz en público. De esta forma, se mejorar la privacidad al evitar tener que hablar en voz alta o hacer gestos visibles para todos. Adicionalmente, está pensada para que tenga una curva de aprendizaje suave para nuevos usuarios.
Aunque aún no hay fecha de lanzamiento, Orion tiene el potencial de ser el próximo gran dispositivo que cambie nuestra relación con la tecnología, similar a lo que fue el smartphone en su momento.
En definitiva, Meta Connect 2024 nos ha dejado un anticipo de un futuro donde la IA es más inteligente, la realidad aumentada es más accesible y la interacción con la tecnología es más natural e intuitiva. Todo ello a través de herramientas que facilitan la creación de contenido y dispositivos que prometen integrar lo digital con el mundo real. Habrá que estar atento a las próximas novedades.
Para mantenerse al día de esta y otras noticias sobre tecnología e inteligencia artificial, te invito a suscribirte a la newsletter y seguir las próximas publicaciones de DigitAIzate.com.