Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

Pham Quang Huy, ministre-conseiller et chef adjoint de la Mission du Vietnam à Genève, s'exprime à la réunion. Photo: VNA

Le Vietnam lance le processus d’adhésion à l’ATI-2 dans les technologies de l’information

Pham Quang Huy, ministre-conseiller et chef adjoint de la Mission du Vietnam à Genève, a rappelé que le Vietnam avait adressé une note officielle à la directrice générale de l’Organisation mondiale du commerce (OMC), ainsi qu’aux comités concernés, afin de demander l’ouverture des négociations en vue de son adhésion. Cette note a également été transmise à l’ensemble des pays membres.

Les forces des gardes forestiers et de protection des forêts assurent la surveillance via un système de caméras au centre de commandement du parc national d’U Minh Hạ, dans la province de Cà Mau. Photo : VNA

Cà Mau accélère la transformation numérique pour une croissance durable

En mettant en œuvre la Résolution 57-NQ/TW sur le développement des sciences, des technologies, de l’innovation et de la transformation numérique, la province de Cà Mau renforce ses infrastructures, ses politiques et ses ressources humaines pour jeter les bases d’une croissance rapide et durable.

Des participants au dialogue entre le Vietnam et la Suisse sur l’intelligence artificielle et les technologies financières. Photo: VNA

Dialogue Suisse-Vietnam sur l'intelligence artificielle et la fintech

Organisé par le Forum économique Suisse-Vietnam (SVEF) en collaboration avec Rikkeisoft, ce dialogue a abordé les enjeux centraux auxquels le secteur financier est confronté, notamment la manière d’exploiter le potentiel transformateur de l’intelligence artificielle tout en garantissant la confiance, la conformité réglementaire et la sécurité des infrastructures numériques transfrontalières.

Les doctorants sont considérés comme une force de recherche essentielle, directement impliquée dans la réalisation de percées scientifiques, technologiques et d’innovation.. Photo : VNA

Lancement d’un programme de soutien aux doctorants d’excellence pour 2026-2030

Ce programme vise à concrétiser les orientations du Parti, notamment la Résolution n°57-NQ/TW du 22 décembre 2024 du Bureau politique sur les percées en matière de développement des sciences, des technologies, de l’innovation et de la transformation numérique nationale, ainsi que la Résolution n°71-NQ/TW du 22 août 2025 sur le développement de l’éducation et de la formation.

La province de Gia Lai accueille le Symposium ASEAN Plus sur la photonique

La province de Gia Lai accueille le Symposium ASEAN Plus sur la photonique

Près de 40 scientifiques internationaux se sont réunis le 8 avril dans la province de Gia Lai, au Symposium ASEAN Plus sur la photonique, afin d'échanger sur les dernières avancées de la recherche, les tendances émergentes et les perspectives d'avenir en photonique et interactions lumière-matière.

Des enseignants guident les élèves dans la découverte des applications scientifiques. Photo : VNA.

Les résultats comme référence pour la gouvernance scientifique et technologique

Guidé par la Résolution 57 du Bureau politique relative aux percées en matière de développement scientifique et technologique, d’innovation et de transformation numérique nationale, le ministère des Sciences et des Technologies accélère la mise en place d’une gouvernance fondée sur les résultats et appuyée sur les plateformes numériques.

Espace d'exposition et de présentation de produits lors de l'AI Day 2026. Photo : VNA

L’économie de l’IA, une opportunité majeure pour le Vietnam

Le concept d’économie de l’IA a été abordé pour la première fois par le Centre national d’innovation (NIC), l’Agence japonaise de coopération internationale (JICA) et le Boston Consulting Group (BCG) dans un rapport publié à la mi-2025. Selon ce rapport, d’ici 2040, l’IA pourrait apporter jusqu’à 130 milliards de dollars au PIB du Vietnam, soit environ 25 % de la taille actuelle de l’économie.

e séquençage du génome consiste à lire et à décrypter l’intégralité de l’ADN d’un individu, afin de repérer d’éventuelles variations pouvant expliquer sa maladie. Photo: pngtree.com

Des scientifiques vietnamiens identifient les mutations génétiques de maladies rares

Le professeur-Docteur Nguyên Huy Hoàng, directeur adjoint de l’Institut de biologie de l’Académie vietnamienne des sciences et technologies, et son équipe de recherche ont mené un projet intitulé « Analyse des mutations génétiques chez des patients vietnamiens atteints de maladies rares sélectionnées à l’aide de la technologie de séquençage de l’exome entier ». Ce projet, réalisé de 2022 à 2024, vise à élucider les causes génétiques de ces maladies au sein de la population vietnamienne.

Le parc logistique Viettel, qui a ouvert ses portes en décembre 2024 à Lang Son, est le centre logistique le plus moderne et le plus intelligent du Vietnam. Photo: VNA

Le Vietnam affine son mécanisme de propriété intellectuelle pour les technologies stratégiques

De nouvelles orientations et politiques, telles que la résolution n°57-NQ/TW du Politburo, ainsi que les dispositions de la Loi sur la science, la technologie et l’innovation de 2025, de la Loi sur la propriété intellectuelle (amendée) et de la Loi sur le transfert de technologie (amendée), témoignent d’une transition d’une approche de gestion à une approche d’exploitation.