Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

Vérification de la qualité du riz TBR225 dans la commune de Lien Mac dans le district de Me Linh de Hanoi. Photo : hanoimoi.vn

La biotechnologie – un levier pour accroître la valeur de l’agriculture vietnamienne

Dans le contexte actuel où l’agriculture vietnamienne est confrontée à des exigences urgentes en matière de transition verte, de croissance durable, de sécurité alimentaire et d’adaptation au changement climatique, le développement prioritaire de la biotechnologie apparaît comme une orientation incontournable, mais aussi comme un moteur stratégique pour améliorer la productivité, la qualité et la valeur ajoutée des produits agricoles.

Le secrétaire général du Parti, To Lam (au milieu), le Premier ministre Pham Minh Chinh (à gauche) et le permanent du Secrétariat, Tran Cam Tu (à droite), activent trois plateformes numériques. Photo : VNA

Le Vietnam accélère sa transition scientifique, technologique et numérique

Le Comité central de pilotage pour le développement de la science, de la technologie, de l'innovation et de la transformation numérique a tenu une conférence hybride pour faire le bilan de son travail au premier semestre 2025 et lancer les missions pour le second semestre, sous la présidence de son chef, secrétaire général du Parti, To Lam.

Photo d'illustration: Internet

Le gouvernement privilégie la science, la technologie et l’innovation sur les données

Le décret encourage le développement de centres de recherche axés sur la science des données et l’innovation dans des domaines tels que l’intelligence artificielle (IA), le cloud computing, la blockchain, les communications de données, l’Internet des objets (IoT), le big data et d’autres technologies avancées, afin de créer, développer, protéger, gérer, traiter et exploiter efficacement les données.

Lancement de la plate-forme Techmart Online. Photo: VNA

Lancement de la plate-forme Techmart Online

Le ministère vietnamien de la Science et de la Technologie a officiellement lancé, ce 1er juillet à Hanoï, la plateforme des produits scientifiques et technologiques Techmart Online, accessible à l’adresse techmartvietnam.vn. Cet événement marque une étape clé dans le développement de l’économie de la connaissance.

Des experts vietnamiens et indiens supervisent les travaux de restauration de la tour F. Photo : VNA

My Son : Nouvelles fouilles archéologiques en vue de restaurer les tours Cham

Depuis plus de deux semaines, la docteure en archéologie Patrizia Zolese, directrice de la Fondation C.M. Lerici (Italie), est présente chaque matin dès l'aube sur le groupe de tours L. Ce site, situé au cœur du patrimoine mondial de My Son (commune de Duy Phu, district de Duy Xuyen, province centrale de Quang Nam), est le théâtre de fouilles scientifiques qu'elle supervise personnellement.

Des délégués découvrent des produits d’intelligence artificielle présentés lors d’un atelier sur le thème « L’intelligence artificielle : un nouveau moteur pour le développement de Dà Nang». Photo : qdnd.vn

Dà Nang se voit en pôle de l’intelligence artificielle du Vietnam

Selon Lê Son Phong, directeur adjoint du Département des sciences et des technologies de la ville de Dà Nang, la stratégie de développement de l’IA de la ville s’appuie sur 25 ans d’expérience en développement logiciel et en transformation numérique, ainsi que sur une main-d’œuvre qualifiée.

Des scientifiques vietnamiens et polonais ont récemment lancé un projet utilisant l’intelligence artificielle (IA) et la télédétection pour surveiller la qualité des eaux marines dans la baie d’Ha Long et la lagune de Cua Luc. Photo: VNA

Première application de l’IA et de la télédétection au Vietnam pour surveiller la qualité de l’eau de mer

Des scientifiques vietnamiens et polonais ont récemment lancé un projet utilisant l’intelligence artificielle (IA) et la télédétection pour surveiller la qualité des eaux marines dans la baie d’Ha Long et la lagune de Cua Luc, deux zones stratégiques de la province de Quang Ninh (Nord), riches en biodiversité et cruciales pour le tourisme et l’économie régionale.

Le vice-Premier ministre Nguyên Chi Dung et des délégués lors de l'événement. Photo : VNA

La coopération entre le NIC et Google contribue à promouvoir l'innovation, selon le vice-PM Nguyên Chi Dung

Suite au succès de l'initiative "Façonner l'avenir de l'IA" lancée en 2024, Google et le Centre national d'innovation (NIC) relevant du ministère des Finances du Vietnam ont annoncé le 18 juin à Hanoï l'expansion de leur partenariat à travers deux nouveaux programmes de formation dans le cadre de l'écosystème Google for Startups et le lancement de la version vietnamienne du cours Google AI Essentials.

La transformation numérique a favorisé l’émergence d’une nouvelle génération d’entreprises. Photo: VNA

Le gouvernement annonce 11 groupes technologiques stratégiques

Le gouvernement a officiellement publié une nouvelle liste de 11 groupes technologiques stratégiques comprenant 35 produits technologiques stratégiques, en vertu de la décision n°1131/QD-TTg du 12 juin 2025 relative à la liste des groupes technologiques stratégiques.

Photo d'illustration

Partage d'expériences Vietnam - France dans l’énergie nucléaire civile

En marge des activités du Premier ministre Pham Minh Chinh en France, le 10 juin, à Paris, le vice-ministre de l’Industrie et du Commerce, Nguyen Hoang Long, a travaillé avec l'Autorité de Sûreté Nucléaire et de Radioprotection (ASNR) et le Commissariat à l'Énergie Atomique et aux Énergies Alternatives (CEA).

La cérémonie d'inauguration d'un nouveau centre de recherche et développement en intelligence artificielle (IA) au Vietnam. Photo : VNA

Qualcomm inaugure au Vietnam un centre de recherche en intelligence artificielle

Le groupe technologique américain Qualcomm a officiellement inauguré, ce lundi 10 juin, un nouveau centre de recherche et développement en intelligence artificielle (IA) au Vietnam. Cette ouverture s’inscrit dans la continuité du rachat de la division d’IA générative de VinAI, consolidant ainsi la présence de Qualcomm dans la région.