Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

L’intégration internationale en matière de propriété intellectuelle répond aux exigences du développement national

L’intégration internationale en matière de propriété intellectuelle répond aux exigences du développement national

La propriété intellectuelle est un domaine auquel le Vietnam accorde une attention particulière depuis longtemps. Dès le 8 mars 1949, le pays a adhéré à deux traités internationaux majeurs relatifs à la protection des marques : la Convention de Paris de 1883 pour la protection de la propriété industrielle et Arrangement de Madrid de 1891 concernant l'enregistrement international des marques.

Le leader du Parti a appelé à affiner les politiques et les mécanismes de soutien au développement de l'énergie nucléaire dans un contexte en constante évolution. Photo : VNA

Le leader du Parti souligne le développement de l'énergie nucléaire comme une stratégie à long terme

Le développement de l'énergie nucléaire doit être défini comme un objectif stratégique à long terme, essentiel au développement socio-économique et à la défense et à la sécurité nationales, a déclaré le secrétaire général du Parti, To Lam, lors d'une séance de travail avec l'Institut vietnamien de l'énergie atomique (VINATOM), relevant du ministère des Sciences et des Technologies, à Hanoï le 4 septembre.

Dans le cadre de l’Exposition des réalisations nationales célébrant le 80e anniversaire de la Fête nationale (2 septembre), inaugurée le 28 août à Hanoï, le Groupe de l'industrie et des télécommunications de l'Armée (Viettel) présente 50 produits technologiques civils et militaires, dont plusieurs relèvent des technologies stratégiques nationales.

Exposition des réalisations nationales : Viettel dévoile une gamme de technologies de pointe

Dans le cadre de l’Exposition des réalisations nationales célébrant le 80e anniversaire de la Fête nationale (2 septembre), inaugurée le 28 août à Hanoï, le Groupe de l'industrie et des télécommunications de l'Armée (Viettel) présente 50 produits technologiques civils et militaires, dont plusieurs relèvent des technologies stratégiques nationales, telles que les réseaux de nouvelle génération, les semi-conducteurs, la robotique, la cybersécurité et l’aérospatial.

Un coin dans le Musée de l’Espace du Vietnam. Photo : VNA

Inauguration du Musée de l’Espace du Vietnam

Le Centre spatial national du Vietnam (VNSC), relevant de l’Académie des sciences et des technologies du Vietnam, a inauguré le 21 août le Musée de l’Espace du Vietnam, situé dans le parc de haute technologie de Hoa Lac, à Hanoï.

Photo d'illustration: VNA

80 ans d’indépendance : le Vietnam mise sur la science et la technologie

Au terme de 80 années marquées par de nombreux défis, le Vietnam s’est affirmé avec force, passant des difficultés de l’après-guerre au statut d’un pays doté d’un potentiel de développement, d’une intégration profonde et d’une position ainsi que d’un prestige international de plus en plus reconnus. La science et la technologie sont identifiées comme une force pionnière et constitueront un moteur essentiel du développement dans la nouvelle ère.

Photo : VNA

Le Vietnam renforce sa coopération technologique stratégique

Le Centre national d’innovation (NIC) en coopération avec le groupe Dassault Systèmes (France) a organisé, le 20 août, un forum des dirigeants d’entreprises à Hanoï, visant à promouvoir l’écosystème des semi-conducteurs et de l’innovation au Vietnam.

Olivier Brochet, ambassadeur de France au Vietnam. Photo: VOV

Vietnam–France: un partenariat solide pour bâtir l’avenir de l’innovation

Avec la résolution 57, adoptée en décembre 2024, le Vietnam affirme sa volonté de faire de l’innovation, de la science et de la technologie, les piliers de son futur développement. Cette ambition stratégique, à la fois audacieuse et visionnaire, est soutenue par la France qui, forte de son expertise scientifique et de son partenariat stratégique avec Hanoï, souhaite accompagner le pays dans cette voie.