Skip to content

Latest commit

 

History

History
42 lines (25 loc) · 3.49 KB

AzureModel_Inference.md

File metadata and controls

42 lines (25 loc) · 3.49 KB

Inférence du Modèle Azure AI

L'API d'inférence du modèle Azure AI expose un ensemble commun de capacités pour les modèles de base et peut être utilisée par les développeurs pour consommer des prédictions d'un ensemble diversifié de modèles de manière uniforme et cohérente. Les développeurs peuvent communiquer avec différents modèles déployés dans Azure AI Foundry sans changer le code sous-jacent qu'ils utilisent.

Microsoft dispose désormais de son propre SDK pour l'inférence des modèles AI, pour différents modèles hébergés sur MaaS/MaaP.

Les versions Python et JS sont disponibles. La version C# sera publiée prochainement.

Pour Python Exemples

Pour JavaScript Exemples

Le SDK utilise l'API REST documentée ici.

Disponibilité

L'API d'inférence du modèle Azure AI est disponible dans les modèles Phi-3 suivants :

  • Modèles déployés sur des points de terminaison API sans serveur :
  • Modèles déployés pour l'inférence gérée :

L'API est compatible avec les déploiements de modèles Azure OpenAI.

Note

L'API d'inférence du modèle Azure AI est disponible dans l'inférence gérée (Managed Online Endpoints) pour les modèles déployés après le 24 juin 2024. Pour profiter de l'API, redéployez votre point de terminaison si le modèle a été déployé avant cette date.

Capacités

La section suivante décrit certaines des capacités exposées par l'API. Pour une spécification complète de l'API, consultez la section de référence.

Modalités

L'API indique comment les développeurs peuvent consommer des prédictions pour les modalités suivantes :

  • Obtenir des informations : Renvoie les informations sur le modèle déployé sous le point de terminaison.
  • Embeddings de texte : Crée un vecteur d'embedding représentant le texte d'entrée.
  • Complétions de texte : Crée une complétion pour l'invite et les paramètres fournis.
  • Complétions de chat : Crée une réponse de modèle pour la conversation de chat donnée.
  • Embeddings d'image : Crée un vecteur d'embedding représentant le texte et l'image d'entrée.

Avertissement : Ce document a été traduit en utilisant des services de traduction automatique basés sur l'IA. Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, une traduction humaine professionnelle est recommandée. Nous ne sommes pas responsables des malentendus ou des interprétations erronées résultant de l'utilisation de cette traduction.