Le 23 avril 2024, Microsoft a annoncé la sortie du Phi-3 Mini, le plus petit des trois modèles. Les modèles Phi-3 sont des petits modèles linguistiques (SLM) performants et rentables qui surpasseront les modèles de même taille en termes de capacités linguistiques, mathématiques, de codage et de raisonnement. Un chercheur en IA, Simon Willison, a déclaré dans une interview : « Phi-3 semble être un petit modèle étonnamment bon si ses critères reflètent ce qu'il peut faire. » Phi-3-mini fonctionne confortablement avec moins de 8 Go de RAM et peut produire des jetons à une vitesse raisonnable même avec un processeur normal. Il est sous licence du MIT et devrait fonctionner correctement sur un Raspberry Pi à 55 $, et la qualité des résultats que j'ai vus jusqu'à présent est comparable à des modèles 4 fois plus grands."
Ce modèle d'IA, avec 3.800 milliards de paramètres, est formé sur un ensemble de données relativement petit par rapport à des modèles de langage plus grands comme GPT-4. Phi-3-mini, le modèle de langage 3,8B, inclut des variantes de longueur de contexte 4K et 128K et est actuellement disponible dans Hugging Face, Ollama et Azure AI Studio.
Un vice-président de Microsoft GenAI a déclaré dans un article de blog : « Phi-3-mini surpasse les modèles deux fois plus grands, et Phi-3-small et Phi-3-medium surpassent les modèles beaucoup plus grands, y compris le GPT-3.5 "T".
Eric Boyd, vice-président de la plateforme Azure AI de Microsoft, a déclaré que les développeurs ont formé Phi03 avec un programme inspiré de la façon dont les enfants apprennent à partir d'histoires au coucher, de livres avec des mots simples et des structures de phrases qui abordent des sujets importants. Boyd a ajouté qu '"il n'y a pas assez de livres pour enfants, nous avons donc pris une liste de plus de 3.000 XNUMX mots et avons demandé à un LLM de créer des "livres pour enfants" pour enseigner le Phi".
Selon les données de performances publiées par Microsoft, les modèles Phi-3 ont surpassé plusieurs modèles de taille comparable ou supérieure, tels que le Gemma 7B et le Mistral 7B, dans des domaines de performances cruciaux.
Dans un article de blog, Microsoft a révélé que des modèles sur Phi-3 devraient être ajoutés dans les semaines à venir. Ces modèles comprendront Phi-3-small (7B) et Phi-3-medium (14B).
ITC, un important conglomérat commercial indien, utilise Phi-3 dans le cadre de sa collaboration actuelle avec Microsoft. Cette collaboration se concentre sur le développement de Krishi Mitra, une application centrée sur les agriculteurs au service de plus d'un million d'agriculteurs. Saif Naik, directeur de la technologie chez ITCMAARS, a déclaré : « Notre objectif avec le copilote de Krishi Mitra est d'améliorer l'efficacité tout en conservant la précision d'un grand modèle de langage. « Nous sommes ravis de collaborer avec Microsoft en utilisant des versions améliorées de Phi-3 pour atteindre nos deux objectifs : efficacité et précision. »