Attention, passionnés d'IA : il existe un nouveau modèle vidéo d'IA en ville, et il s'appelle Lame. Développé par les gars de Kuaishou, plateforme vidéo chinoise, ce petit bijou promet de donner du fil à retordre à Sora, la créature OpenAI qui a récemment il a fait beaucoup de manchettes.
Kling semble avoir tout ce qu'il faut pour devenir le nouveau roi des vidéos IA : des générations plus longues, des mouvements plus fluides, une meilleure interprétation des invites et même des séquences multi-plans. En bref, si Sora était déjà impressionnant, Kling pourrait amener les vidéos générées par l'IA à un tout autre niveau.
Kling vs Sora, c'est déjà un choc de titans
Lorsqu'on parle d'IA vidéo, il est impossible de ne pas penser à Sora, le modèle développé par OpenAI qui a fait sensation lors de son annonce. Avec sa capacité à générer des vidéos réalistes et à suivre fidèlement les instructions des utilisateurs, Sora semble destiné à révolutionner le monde de l’intelligence artificielle appliquée à la vidéo. En effet, même l'esthétique de ces années. Ou peut-être devrais-je dire « semblait » : avec l'arrivée de Kling, les cartes sur la table pourraient être rebattues.
Bien entendu, à première vue, les deux modèles semblent avoir de nombreux points communs. Les deux sont basés sur des architectures transformateur et sont capables de générer des vidéos de haute qualité à partir de simples descriptions textuelles. Mais c’est en entrant dans le détail que Kling semble avoir plusieurs avantages.
Selon ce qui a été déclaré par Kuaishou, en effet, Kling est capable de générer des vidéos IA d'une durée allant jusqu'à deux minutes, en 1080p et à 30 images par seconde. Une capacité remarquable, qui surpasse celle de Sora et qui ouvre la voie à un large éventail d'applications, de la création de contenus pour les réseaux sociaux à la production de films publicitaires ou de divertissement. Et ce n'est pas tout.

La physique n'est plus un problème
Le modèle chinois de conversion texte-vidéo, selon ses développeurs, semble également exceller dans la simulation de la physique du monde réel, un aspect où les modèles vidéo d'IA actuels ont du mal. Les vidéos IA générées par Kling montrent une grande fluidité de mouvement et une interaction réaliste entre les objets et les environnements, rendant l'expérience visuelle encore plus convaincante.
À cela s'ajoute la capacité de Kling à réaliser des reconstructions 3D avancées de visages et de corps, améliorant ainsi l'expressivité et le mouvement des membres dans les vidéos générées. Un détail technique qui peut faire la différence lorsqu'il s'agit de créer des personnages ou des situations complexes.
Une question de diffusion
Malgré les prémisses plutôt intéressantes, la véritable menace de Kling pour Sora s'appelle la « disponibilité ». Alors que le modèle d'OpenAI reste en phase de test, accessible uniquement à un petit groupe de créateurs et de chercheurs, Kling semble prêt à s'adresser à un public plus large.
Kuaishou a en effet ouvert une liste d'attente pour les utilisateurs intéressés à essayer son nouveau modèle. Une approche qui pourrait permettre à Kling de gagner du terrain rapidement, en constituant une base d'utilisateurs et en collectant de précieux retours pendant que Sora reste enfermé dans les laboratoires d'OpenAI.
Video AI, le combat commence
Bien entendu, il est encore tôt pour désigner le vainqueur de ce défi. OpenAI dispose d'une réputation consolidée et d'une équipe de chercheurs de premier ordre, des « cannibales » ambitieux. ce qui pourrait réserver des surprises dans les mois à venir. Et puis, la prudence d'OpenAI lors de la diffusion de Sora au grand public est compréhensible : l'entreprise veut s'assurer que le modèle est prêt et qu'il ne peut pas être utilisé à des fins malveillantes ou pour diffuser de la désinformation.
D’un autre côté, Kuaishou semble déterminé à amener Kling sur la scène mondiale. La société chinoise a déjà démontré sa capacité à gérer avec succès une plateforme vidéo sur son marché national et pourrait disposer des ressources et de l’expérience nécessaires pour évoluer rapidement.
Un scrupule dont on ne sait pas combien de temps Kling voudra entretenir. Et il n'y a pas que Kling : la course à la vidéo IA ne fait que commencer. Avec l’arrivée de nouveaux modèles et la recherche en constante évolution, nous pouvons nous attendre à voir des vidéos de plus en plus longtemps, réaliste et impressionnant dans les années à venir.
L'IA vidéo, l'impact sur l'industrie
Mais qu’est-ce que tout cela signifie pour l’industrie vidéo ? L’arrivée d’outils comme Kling et Sora pourrait révolutionner la manière dont les contenus sont créés et produits. Imaginez pouvoir générer un publicité entière ou un court métrage d'animation partant d'une simple description textuelle. Ou être capable de remplir vos vidéos avec des personnages réalistes sans avoir besoin d'acteurs ou de sessions coûteuses de capture de mouvement.
Bien entendu, cela soulève également des questions sur l’avenir de certains métiers créatifs. Les modèles d’IA remplaceront-ils les artistes, les animateurs et les réalisateurs ? Probablement pas, ou du moins pas à court terme. Mais ces technologies pourraient devenir un outil puissant entre leurs mains, leur permettant d’expérimenter, de prototyper rapidement des idées et de repousser les limites de la créativité.
Que Kling, Sora ou encore un autre modèle émerge comme leader, l’avenir de la vidéo générée par l’IA semble fou.