GPT Image 2 Génération d'images
- Le modèle GPT Image 2 (gpt-image-2) prend en charge les modes texte-vers-image, image-vers-image, édition d’image et autres modes de génération
- Mode de traitement asynchrone, utilisez l’ID de tâche retourné pour interroger
- Les liens d’image générés sont valides pendant 24 heures, veuillez les enregistrer rapidement
Autorisations
##Toutes les API nécessitent une authentification Bearer Token##
Obtenir une clé API :
Visitez la Page de gestion des clés API pour obtenir votre clé API
Ajouter à l'en-tête de requête :
Authorization: Bearer YOUR_API_KEYCorps
Nom du modèle de génération d'image, canal officiel, meilleure stabilité et contrôlabilité, adapté aux scénarios commerciaux
gpt-image-2 "gpt-image-2"
Invite décrivant l'image à générer, ou décrivant comment éditer l'image d'entrée
Limites :
- Jusqu'à
32000caractères (comptés en points de code Unicode, valable pour CJK et autres langues)
32000"Un magnifique coucher de soleil coloré sur l'océan"
Liste d'URL d'images de référence pour les fonctions image vers image et édition d'image
Remarque :
- Nombre d'images d'entrée par requête :
1~16 - Taille d'une seule image : ne dépassant pas
50MB - Formats de fichiers pris en charge :
.jpeg,.jpg,.png,.webp - Les URL d'images doivent être directement accessibles par le serveur, ou l'URL de l'image doit déclencher un téléchargement direct lors de l'accès (généralement ces URL se terminent par des extensions de fichiers image, telles que
.png,.jpg) - Dans les scénarios image vers image / édition d'image, les images de référence fournies entraînent une consommation supplémentaire de tokens d'entrée d'image
[
"https://example.com/image1.png",
"https://example.com/image2.png"
]URL du masque d'inpainting — marque la région de l'image de référence à régénérer. Valide uniquement en mode édition d'image (doit être combiné avec image_urls) ; en texte-vers-image pur, le masque est silencieusement ignoré.
Exigences de format :
- Doit être un PNG avec canal alpha : pixels transparents (
alpha < 255) = zones à régénérer, pixels opaques = préservés - Les dimensions du masque doivent correspondre exactement à celles de l'image de référence (largeur × hauteur en pixels)
- Un seul masque par requête
Remarque :
- Au moins une image de référence est requise dans
image_urls; un masque seul n'a aucun effet - Erreurs courantes :
Invalid mask image format - mask image missing alpha channel: l'image téléchargée n'a pas de canal alpha (JPEG, PNG opaque, etc.). Réexportez le masque en PNG avec des régions transparentes.Invalid mask image format - mask size does not match image size: les dimensions du masque ne correspondent pas à l'image de référence. Redimensionnez le masque aux mêmes dimensions en pixels que votre image de référence.
"https://example.com/mask.png"
Taille de l'image générée. Prend en charge à la fois le format de ratio et le format de pixels explicite, par défaut auto
① Format de ratio (recommandé, 15 options)
1:1: Carré1:2/2:1: Portrait / paysage extrême1:3/3:1: Ultra portrait / paysage (limite 3:1)2:3/3:2: Portrait / paysage standard3:4/4:3: Portrait / paysage classique4:5/5:4: Courant sur les réseaux sociaux9:16/16:9: Écran large mobile / bureau9:21/21:9: Ultra-large
② Format de pixels explicite : WxH (ou W×H), par exemple 1024x1024, 1536x1024, 3840×2160
- La largeur et la hauteur doivent être des multiples de
16 - Plage de chaque côté :
[16, 3840] - Budget de pixels :
655 360 ≤ width × height ≤ 8 294 400(environ 0,65 MP ~ 8,29 MP) - Rapport d'aspect :
≤ 3:1
③ auto : Le modèle détermine la taille automatiquement (dans ce cas resolution ne s'applique pas)
Gestion des dépassements :
- Si une combinaison ratio +
resolutiondépasse le budget de pixels, les dimensions sont automatiquement réduites proportionnellement au maximum (par ex. 4K 2:1 → 3840×1920)
"auto"
Paramètre rapide de palier de résolution, effectif uniquement lorsque size est au format ratio ; ignoré en format pixels explicite
Règles de budget pixel (les dimensions sont calculées à partir du nombre total de pixels cible et du ratio size, alignées sur des multiples de 16) :
1K: ~1 MP (1024² = 1 048 576 pixels)2K: ~4 MP (2048² = 4 194 304 pixels)4K: ~8,29 MP (3840×2160 = 8 294 400 pixels, le maximum)
Dimensions de sortie paysage / carré (les dimensions portrait correspondent au paysage avec largeur/hauteur inversées, par exemple 2:3 = 3:2 inversé) :
| Ratio | 1K | 2K | 4K |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
2:1 | 1456×720 | 2896×1456 | 3840×1920 * |
3:1 | 1776×592 | 3552×1184 | 3840×1280 * |
3:2 | 1248×832 | 2512×1680 | 3520×2352 |
4:3 | 1184×880 | 2368×1776 | 3312×2480 * |
5:4 | 1152×912 | 2288×1824 | 3216×2576 |
16:9 | 1360×768 | 2736×1536 | 3840×2160 (UHD) |
21:9 | 1568×672 | 3136×1344 | 3840×1632 * |
* Indique les combinaisons automatiquement réduites pour respecter le budget de pixels. Les valeurs sont insensibles à la casse.
1K, 2K, 4K "1K"
Qualité de rendu, contrôle la "profondeur de raisonnement" du modèle, affecte directement le nombre de tokens de sortie et le coût. Par défaut medium
| Valeur | Base de tuiles | Coût relatif (1024²) |
|---|---|---|
low | 16 | ~0,11× |
medium | 48 | 1,0× |
high | 96 | ~4,0× |
low, medium, high "medium"
Nombre d'images à générer, chacune facturée indépendamment
Remarque :
- Les tokens d'entrée texte augmentent proportionnellement à
n
1 <= x <= 101
Adresse de rappel HTTPS après l'achèvement de la tâche
Moment du rappel :
- Déclenché lorsque la tâche est terminée, échouée ou annulée
- Envoyé après confirmation de la facturation
Restrictions de sécurité :
- Seul le protocole HTTPS est pris en charge
- Les rappels vers les adresses IP internes sont interdits (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La longueur de l'URL ne doit pas dépasser
2048caractères
Mécanisme de rappel :
- Délai d'expiration :
10secondes - Maximum
3tentatives en cas d'échec (tentatives après1seconde/2secondes/4secondes) - Le format du corps de réponse du rappel est cohérent avec le format de réponse de l'API de requête de tâche
- Un code de statut 2xx renvoyé par l'adresse de rappel est considéré comme un succès, les autres codes de statut déclenchent une nouvelle tentative
"https://your-domain.com/webhooks/image-task-completed"
Réponse
Tâche d'image créée avec succès
Horodatage de création de la tâche
1757156493
ID de tâche
"task-unified-1757156493-imcg5zqt"
Nom du modèle réellement utilisé
"gpt-image-2"
Type spécifique de tâche
image.generation.task Pourcentage de progression de la tâche (0-100)
0 <= x <= 1000
Statut de la tâche
pending, processing, completed, failed "pending"
Informations sur la tâche asynchrone
Type de sortie de la tâche
text, image, audio, video "image"
Informations d'utilisation et de facturation