Google dispose d’un nouveau modèle vidéo d’IA pour les développeurs, et il est moins cher—de manière significative—que ce qui existait auparavant. Veo 3.1 Lite a été lancé cette semaine via l’API Gemini à moins de la moitié du coût de Veo 3.1 Fast, l’option intermédiaire de la gamme de génération vidéo de Google. Le modèle supporte Text-to-Video et Image-to-Video, en formats paysage (16:9) et portrait (9:16), à des résolutions de 720p et 1080p. La durée des vidéos est ajustable à 4, 6 ou 8 secondes, avec un coût qui évolue en conséquence. Pour mettre cela en perspective : Veo 3.1 coûtait auparavant environ 0,40 $ par seconde de vidéo générée avec audio via l’API, tandis que Veo 3.1 Fast coûtait 0,15 $ par seconde. Lite ramène ce coût à 0,05 $ par seconde en 720p—ce qui rend enfin les applications vidéo à fort volume financièrement viables pour les créateurs plus modestes.
Nous avons testé le modèle et les générations se sont révélées très rapides, sans montrer de dégradation majeure de la qualité. Une vidéo de 8 secondes (la plus longue disponible) a pris moins d’une minute à générer. La conformité à la requête était correcte, avec un léger défaut dans la mise en forme des lettres. À part cela, la différence entre Veo 3.1 Lite et Veo 3.1 Fast n’est pas aussi perceptible que celle entre Veo 3.1 Fast et la version originale complète de Veo 3.1.
Google ne s’est pas contenté de positionner son nouveau modèle de manière compétitive sur le plan des prix. Le 7 avril, le prix de Veo 3.1 Fast va également baisser. La société a déclaré qu’il « complète la famille de modèles Veo 3.1, en offrant aux développeurs une flexibilité en fonction de leurs besoins ». Le message aux développeurs est clair : choisissez votre niveau, pas votre plafond. C’est important, car le coût a toujours été le secret le plus gênant de la génération vidéo par IA. Les résultats sont impressionnants en démo, mais il s’agit généralement de générations sélectionnées manuellement, et l’IA vidéo reste encore trop aléatoire pour une utilisation constante.
OpenAI l’a appris à ses dépens. Sora aurait brûlé 15 millions de dollars par jour, et la semaine dernière, la société a annoncé qu’elle arrêtait complètement le produit. OpenAI est désormais « en transition vers la recherche en simulation du monde pour faire avancer la robotique »—une façon très corporate de dire que cela n’a pas fonctionné. Un accord d’un milliard de dollars avec Disney a été emporté dans la tourmente. Veo 3 a été lancé en mai 2025 comme la vitrine IA la plus bruyante de Google, présenté comme un générateur tout-en-un produisant non seulement la vidéo, mais aussi des bandes sonores complètes—bruits ambiants, effets, voire dialogues. Ensuite, en octobre, est arrivée Veo 3.1, en compétition directe avec Sora 2. La qualité était impressionnante, mais le prix n’était pas vraiment attractif pour quiconque cherche à déployer à grande échelle. Les concurrents chinois ont repéré cette faille très tôt. Kling AI de Kuaishou propose une génération vidéo comparable à des prix bien plus bas que le plan Ultra à 250 $ de Google, et même l’alternative pro à 20 $. La vidéo Hunyuan de Tencent est allée encore plus loin, en sortant un modèle open source gratuit, calé pour coïncider avec le lancement de Sora par OpenAI en 2024. Le marché chinois ne se contente pas de rivaliser sur la qualité. Il rivalise aussi sur l’économie, et cela fait un moment qu’il remporte cet argument. Du côté professionnel, des outils comme PAI de Utopai créent une niche totalement différente : une narration cinématographique longue avec des personnages cohérents, des storyboards détaillés, et un montage piloté par l’IA au niveau des scènes. PAI n’est pas bon marché—100 $ pour 10 000 crédits qui s’épuisent rapidement—mais cela indique où vont les efforts des créateurs sérieux. Ils veulent du contrôle, pas seulement de la génération. Veo 3.1 Lite ne cherche pas à devenir le pipeline cinématographique de PAI, ni à battre Kling sur le prix. Il vise le milieu : des développeurs qui doivent déployer des fonctionnalités vidéo à grande échelle sans épuiser leurs crédits API à chaque itération. Le modèle est la stratégie d’infrastructure de Google pour la prochaine génération d’applications qui considèrent la vidéo comme un composant standard, et non comme une astuce premium. Si la baisse de prix du 7 avril pour Veo 3.1 Fast se concrétise comme prévu, le coût de création avec la vidéo IA baisse sur toute la gamme de Google en une seule semaine.