Des chercheurs de diverses institutions, dont l’Institut Max Planck d’informatique et le Centre de recherche de Sarrebruck pour l’informatique visuelle, l’interaction et l’intelligence artificielle (VIA), ont développé une méthode de traitement d’image assistée par l’IA appelée DragGAN. Cette nouvelle méthode permet un contrôle flexible par glisser-déposer des expressions faciales, des postures, de la perspective et d’autres propriétés dans les photos. Contrairement à d’autres programmes de retouche photo, DragGAN vous demande simplement de marquer les points de début et de fin sur une photo, et l’IA suivra les points marqués pour générer des images qui correspondent aux modifications souhaitées. Les chercheurs ont présenté leur nouvelle méthode en août au salon de l’infographie SIGGRAPH23.
DragGAN utilise une bibliothèque Python optimisée pour l’apprentissage automatique appelée PyTorch, bien que la configuration matérielle requise ne soit pas encore connue. Selon l’auteur principal Xingang Pan, le code source de DragGAN devrait être publié en juin. Bien que la méthode en soit encore à ses débuts, l’efficacité de l’approche permet aux utilisateurs d’attendre quelques secondes avant de procéder à l’édition. DragGAN est censé fournir des résultats réalistes même dans des scénarios difficiles, mais peut également halluciner d’autres contenus.
Les chercheurs n’ont pas encore révélé le fonctionnement de DragGAN, mais des exemples de vidéos sont disponibles sur le site Web de l’Institut Max Planck d’informatique. Les utilisateurs peuvent glisser-déposer pour ajuster les expressions faciales, la posture, la longueur des vêtements et la perspective. Le masquage peut également être utilisé dans DragGAN pour définir des régions que l’IA peut manipuler. Dans l’exemple illustré, la tête d’un chien est tournée sans ajuster la perspective globale de l’image. Les futures possibilités de retouche photo sont passionnantes à l’horizon avec DragGAN.