Phi-3 de Microsoft: más eficiente y accesible

Phi-3 de Microsoft representa un avance significativo en modelos de lenguaje pequeños (SLM), pero con altas capacidades. Se enfrenta directamente con los modelos de lenguaje de gran tamaño (LLM), que son superiores, abriendo nuevas posibilidades a una inteligencia artificial (IA) accesible y eficiente. 

El desarrollo de Phi-3 refleja un cambio estratégico en Microsoft hacia la creación de soluciones de IA más accesibles y versátiles, que no solo atraen a las grandes corporaciones, sino también a empresas con recursos más limitados. De hecho, a pesar de su tamaño relativamente pequeño, logra un rendimiento impresionante en comparación con modelos mucho más grandes. 

En su lanzamiento, Phi-3 consta de 3 modelos: Phi-3-mini (3.8B parámetros), Phi-3-small (7B parámetros) y Phi-3-medium (14B parámetros):

  • Phi-3 mini ha sido entrenado con 3.3 billones de tokens, igualando las capacidades de modelos de lenguaje más grandes como Mixtral 8x7B y GPT-3.5 en benchmarks como MMLU y MT-benches. 
  • Phi-3-small y medium, entrenados con 4.8 billones de tokens, superan a modelos como Llama 3 8B en tareas de razonamiento multi-paso como codificación y matemáticas.

Por este motivo, la principal ventaja de Phi-3 es que ofrece un mejor rendimiento, lo que permite una ejecuión más eficiente en dispositivos móviles y ordenadores de menor potencia, abriendo la posibilidad de usar IA avanzada en una gama más amplia de tecnologías. 

Por otra parte, a pesar de no haber tenido un aprendizaje por refuerzo de retroalimentación humana, Phi-3 muestra un mejor comportamiento en términos de toxicidad y sesgos en comparación con otros modelos de código abierto.

phi-3 de microsoft

Como curiosidad, Phi-3 ha sido entrenado utilizando técnicas inspiradas en cómo los niños aprenden a partir de cuentos infantiles, lo que implica un enfoque simplificado pero profundamente efectivo para enseñar conceptos complejos

 

Aplicaciones de Phi-3 de Microsoft

Phi-3 tiene el potencial de democratizar el acceso a tecnología de lenguaje avanzada para una amplia gama de industrias y casos de uso, por ejemplo: 

  • Resumen de documentos largos:  resumir los puntos principales de un documento extenso, extrayendo la información más relevante.
    Análisis de mercado: extraer información clave y tendencias del sector a partir de informes de investigación de mercado.
  • Generación de contenido: generar textos, ayudando a crear contenido para equipos de marketing o ventas, como descripciones de productos o publicaciones en redes sociales.
  • Chatbots de soporte al cliente: implementar chatbots que respondan preguntas básicas de los clientes sobre planes, actualizaciones de servicio, etc. 
  • Ejecución en dispositivos: gracias a su tamaño compacto, Phi-3 se puede ejecutar directamente en dispositivos como smartphones y computadoras portátiles, sin necesidad de depender de la nube. 

En definitiva, prácticamente cualquier aplicación de las que habitualmente desarrollan los grandes modelos de lenguaje, pero a un coste de recursos y económico menor. 

phi-3 mini de microsoft

 

Desventajas de la dependencia de la IA en la nube

  • Vulnerabilidad a fallos técnicos:  se podrían llegar a paralizar sistemas esenciales de las empresas debido a problemas técnicos o interrupciones en los servicios en la nube. 
  • Riesgos de seguridad y privacidad: la IA a menudo requiere acceso a datos sensibles para su funcionamiento, lo que genera preocupaciones sobre la seguridad de la información y posibles violaciones de privacidad al depender de proveedores de nube externos. 
  • Posibilidad de ataques cibernéticos: los ciberdelincuentes pueden aprovechar la IA en la nube para realizar ataques identificando vulnerabilidades en los sistemas. 
  • Dependencia de la conectividad a Internet: se requiere una conexión permanente y estable a Internet para funcionar. Los problemas de conectividad pueden impedir el acceso a aplicaciones y datos críticos.
  • Riesgo de dependencia de un solo proveedor: estar «atado» a un proveedor de nube específico dificultará la migración de servicios y creará dependencia. 
  • Menor control sobre la infraestructura: las empresas tienen menos control directo sobre la infraestructura de la IA, limitando su capacidad de personalización y gestión. 

 

¿Cuándo podremos probar Phi-3? 

Aunque Microsoft ha anunciado la serie Phi-3, la compañía aún no ha revelado una fecha específica en la que los usuarios podremos probar o acceder a esta tecnología. Es probable que inicialmente esté disponible solo para investigadores, tal y como ya sucedió con modelos anteriores como Phi-2.

Por otra parte, tampoco existen detalles concretos sobre el precio de Phi-3. Es probable que inicialmente esté disponible solo para investigadores de manera similar a Phi-2, sin opciones de licencia comercial o precios públicos por el momento.

 

En definitiva, Phi-3 de Microsoft es una apuesta de la compañía para hacer más accesible la IA avanzada e impulsar una nueva era de modelos de lenguaje pequeños pero potentes. De esta forma, Phi-3 puede transformar nuestra experiencia con la inteligencia artificial sin tener que depender de la nube, ya que podremos ejecutarla directamente en nuestros dispositivos móviles.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio