Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

Des entreprises technologiques sont récompensées lors de la quatrième cérémonie des Vietnam Industry 4.0 Top Awards. Photo : nhandan.vn

Le Vietnam lance les I4 Impact Awards 2026 pour promouvoir l’innovation technologique

Le programme "I4 Impact Awards 2026" vise à récompenser les organisations, entreprises et individus ayant démontré une efficacité remarquable dans l’application de technologies numériques telles que l’intelligence artificielle, le Big Data, l’Internet des objets et d’autres technologies avancées afin d’accroître la productivité, la compétitivité et le développement durable du pays.

Des élèves expérimentent la commande de robots lors du tournoi de robotique FPT Schools élargi de Da Nang. Photo: VNA

Mise en place d’un cadre éthique national pour l’intelligence artificielle

Le Vietnam s’est doté d’un cadre éthique national pour l’intelligence artificielle afin d’orienter le développement et l’utilisation de ces technologies dans une approche sûre, responsable et respectueuse des droits humains. Ce dispositif vise notamment à garantir la transparence, l’équité et la sécurité des systèmes d’IA, tout en encourageant l’innovation au service du développement durable et de l’intérêt public.

Le secrétaire général du Parti, To Lâm, aussi président du Comité directeur central pour le développement de la science, de la technologie, de l’innovation et de la transformation numérique. Photo : VNA

Le Vietnam accélère la mise en œuvre de la Résolution 57 sur la science et le numérique

Lors de la première réunion de 2026 du Comité directeur central pour le développement de la science, de la technologie, de l’innovation et de la transformation numérique, le secrétaire général To Lam a appelé à des actions plus résolues afin d’obtenir des résultats concrets, contribuant directement à la croissance économique et à la compétitivité nationale.

La cérémonie remettre la décision de nomination du président de l’Académie des sciences et des technologies du Vietnam.Photo : VNA

L’Académie des sciences et des technologies du Vietnam a un nouveau président

Le Premier ministre Pham Minh Chinh a remis la décision de nomination de Tran Hong Thai, vice-président permanent de l’Académie des sciences et des technologies du Vietnam (ASTV), au poste de président de cette institution lors d'une cérémonie tenue dans l’après-midi du 12 mars, au siège du gouvernement, à Hanoï. 

Lancement de la plateforme numérique du ministère de l’Industrie et du Commerce consacrée au développement des marchés étrangers. Photo: VNA

Le Vietnam lance une plateforme numérique pour développer les marchés étrangers

Cette plateforme numérique doit viser trois objectifs majeurs : améliorer la qualité de la gestion et de la gouvernance dans le domaine du commerce international, devenir un « écosystème d’information sur les marchés » au service des entreprises, contribuer à former un système national unifié d’information commerciale.

Agriculture: Luong Van Truong, une illustration des orientations de la Résolution 57-NQ/TW

Agriculture: Luong Van Truong, une illustration des orientations de la Résolution 57-NQ/TW

Luong Van Truong, jeune agriculteur de la commune de Nghia Hung (province de Ninh Binh), se distingue par l’intégration réussie de nombreuses avancées scientifiques et technologiques dans sa production agricole. Parmi ses innovations figurent des semences à germination ultra-rapide, du riz germé, des techniques de culture sans labour ainsi que l’utilisation de protéines d’escargot hydrolysées comme engrais organique. Au-delà de la protection de l’environnement et de la promotion d’une agriculture moderne et durable, Luong Van Truong inspire l’esprit d’entrepreneuriat chez les jeunes de la région et contribue à insuffler un nouvel élan à la campagne vietnamienne.

Le Centre de coopération Chine-ASEAN pour les applications de l'IA est situé à Nanning, dans la province du Guangxi. Photo : VNA

Le Guangxi (Chine) prêt à renforcer la coopération en intelligence artificielle avec le Vietnam

La proximité géographique avec le Vietnam, les liens étroits et les affinités culturelles, ainsi que l’intensification des échanges économiques et de la coopération scientifique et technologique, constituent des atouts uniques et une base solide pour développer la coopération dans le domaine de l’intelligence artificielle (IA), selon Wei Tao, président du gouvernement de la Région autonome Zhuang du Guangxi (Chine). 

Des citoyens scannent leur carte d’identité citoyenne pour effectuer des démarches administratives. Photo : VNA

Résolution 57 : les technologies numériques au service de la qualité de vie

La mise en œuvre de la Résolution 57 du Bureau politique ouvre de nouvelles perspectives pour le développement de la science, de la technologie et de l’innovation au Vietnam. L’essor de l’intelligence artificielle, des technologies numériques et des partenariats entre l’État, les universités et les entreprises contribue à moderniser la gestion, stimuler la production et améliorer la qualité de vie de la population.

Le Premier ministre Pham Minh Chinh remet le remis le prix Kovalevskaïa 2025 à la professeure-Docteure Trân Thi Viêt Nga, directrice de l’Institut de haute technologie Vietnam-Japon et professeure à l’Université de construction de Hanoi. Photo: VNA

Le PM propose de créer un prix "Femmes talentueuses, créatives et dévouées"

À l’occasion du 116e anniversaire de la Journée internationale des femmes (8 mars) et de la commémoration du 1986e anniversaire de l’insurrection des sœurs Trung, le Premier ministre Pham Minh Chinh a eu vendredi 6 mars une rencontre avec des femmes dirigeantes et gestionnaires d’agences centrales, au cours de laquelle il a remis le prix Kovalevskaïa 2025.