Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

L'ambassadeur du Vietnam en France, Trinh Duc Hai (6e à partir de la droite), et les dirigeants de l'association Global Connect Vietnam France. Photo : VNA

Lancement de l’association Global Connect Vietnam France

Avec pour objectif de rassembler les intellectuels, experts et entrepreneurs vietnamiens vivant en France et en Europe en général, l’association Global Connect Vietnam France (GCVF) vient d'être officiellement lancée à Paris.

Robots humanoïdes VinMotion, un produit de Vingroup. Photo : journal Tiên Phong

La propriété intellectuelle, pilier de la puissance nationale

Pour la première fois, les questions liées à l’intelligence artificielle (IA) et à l’exploitation commerciale des droits de propriété intellectuelle sont intégrées dans la loi, ouvrant de nombreuses opportunités et transformant progressivement les actifs intellectuels en un nouveau moteur de croissance.

Le secrétaire général du Parti communiste du Vietnam (PCV) et président du Vietnam, To Lam (gauche), et le président sri-lankais Anura Kumara Dissanayake. Photo: VNA

Vietnam-Sri Lanka : un nouvel élan pour la coopération scientifique et technologique

La visite d'État au Sri Lanka du secrétaire général du Parti communiste du Vietnam (PCV) et président du Vietnam, To Lam, marque une étape importante dans l’histoire des relations bilatérales et agit comme un « puissant catalyseur » pour approfondir la coopération entre les deux pays dans les domaines de la science, de la technologie et de la transformation numérique, bien au-delà du seul cadre diplomatique.

L’objectif général du programme est de développer une industrie vietnamienne des technologies numériques moderne et hautement compétitive. Photo: VNA

Le Vietnam ambitionne de devenir un centre régional de l’industrie numérique

Le développement de l’industrie des technologies numériques est considéré comme celui d’un secteur économique et technique fondamental, jouant un rôle moteur clé pour créer des percées en matière de productivité, de qualité et de compétitivité de l’économie, jeter des bases solides pour la transformation numérique nationale, favoriser une croissance économique à deux chiffres et contribuer de manière décisive à l’objectif de faire du Vietnam un pays développé à revenu élevé d’ici 2045.

Le secrétaire général du Parti et président de la République, To Lam s'exprime au forum. Photo : VNA

Forum de l'innovation Vietnam - Inde à New Delhi

Le Forum de l'innovation Vietnam - Inde ayant pour thème «Coopération dans le développement des ressources humaines, des sciences, des technologies, de l'innovation et de la transformation numérique », qui a eu lieu dans la soirée du 6 mai à New Delhi a vu la présence du secrétaire général du Parti et président de la République, To Lam.

Le ministre vietnamien des Sciences et des Technologies Vu Hai Quan. Photo : VNA

Vietnam–République de Corée : cap sur des technologies stratégiques communes

La mise en relation des besoins, la formation de partenariats et le déploiement de projets de coopération concrets, générateurs de valeur pour le Vietnam et la République de Corée ont été soulignées lors du forum sur la science, la technologie et l’innovation, organisé dans le cadre de la visite d’État du président sud-coréen Lee Jae-myung, s’est tenu le 24 avril à l’Institut des Sciences et Technologies Vietnam-République de Corée. 

Le vice-ministre des Sciences et de la Technologie, Lê Xuân Dinh, prononce le discours d'ouverture, à Hanoi, le 21 avril. Photo : VNA

Le concours d’innovation scientifique s’ouvre aux Vietnamiens de l’étranger

En réponse à la Journée mondiale de la créativité et de l’innovation 2026, ce concours offre une plateforme aux individus et aux équipes de tout le pays passionnés par la recherche, la créativité et l’application pratique des sciences, tout en promouvant un mouvement de recherche scientifique au sein de la communauté, en particulier chez les jeunes.