Un Docteur vietnamien utilise l’IA pour transformer du texte en image

Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti.
Un Docteur vietnamien utilise l’IA pour transformer du texte en image ảnh 1Le Dr. Luong Minh Thang.



Hanoï (VNA) - Le Dr. Luong Minh Thang et dix experts de Google Brain, un programme de recherche en intelligence artificielle conduit par Google, ont conçu le modèle Parti, qui a la capacité de générer des images à partir de commandes textuelles.

Le Dr. Luong Minh Thang, 34 ans, est le seul Vietnamien du groupe de recherche clé sur le modèle d’intelligence artificielle (IA) Parti (Pathways Autoregressive Text-to-Image). Ce travail a été dévoilé en 2021 par Google.

Le langage est l’un des éléments fondamentaux de la communication humaine, et c’est grâce à la meilleure compréhension de celui-ci que l’IA Parti obtient de si bons résultats dans la création d’images à partir de textes. Grâce à elle, les utilisateurs peuvent désormais transformer leurs propres idées créatives en image. “C’est un grand progrès réalisé grâce à l’IA”, a estimé M. Thang.

Progrès technologique

Il a partagé que les modèles d’IA actuels sont appliqués dans les langages via des modèles de chatbot capables d’interagir avec l’Homme par messages textuels. Dans le domaine des images, l’IA peut reconnaître des objets dans les images. “Si nous combinons ces deux éléments pour transformer le langage textuel en images, cela créera un modèle d’IA très moderne, pouvant soutenir efficacement les personnes dans le domaine de la création d’images”, a-t-il souligné, en parlant de la raison pour laquelle le modèle Parti a été créé.

Le générateur Parti permet de créer des images exactement telles que décrites et souhaitées par l’utilisateur. Dans l’avenir, il sera un outil efficace pour les personnes spécialisées dans la création d’images telles que les artistes, photographes, créateurs de mode, graphistes, etc. Lorsqu’elles auront des idées, il leur suffira de décrire celle-ci de manière suffisamment détaillée, et l’IA fera le reste.

L’IA Parti commence par convertir une collection d’images en une séquence d’entrées de code, semblables à des pièces de puzzle. La commande textuelle de l’utilisateur est ensuite traduite à l’aide de ces séquences de code, créant une nouvelle image. Ceci est important pour l’approche car cela facilite le traitement des commandes longues et complexes. Il aide également à la création d’images de haute qualité. Ce modèle intègre et représente graphiquement des informations globales de manière efficace. D’autant plus qu’il rend des images hyperréalistes à partir des entrées textuelles à l’aide d’un encodeur-décodeur pouvant contenir jusqu’à 20 milliards de paramètres.

“Sur la base de données textuelles et d’images, l’IA se combinera pour créer une nouvelle photo, aidant les gens à avoir de nouvelles idées”, a dévoilé M. Thang.

Les sujets les plus représentés par le modèle Parti sont la nature, les animaux, les objets... Sur le site de Google Research, on trouve de nombreuses images créées à partir d’IA et pouvant passer pour de vraies photos.

Selon l’équipe de recherche, les images liées aux personnes sont soigneusement manipulées par l’équipe : il faut absolument éviter d’affecter négativement les communautés en termes de sexe, d’ethnie, de religion, etc. en les stigmatisant ou en reproduisant des stéréotypes.

Opportunités et risques

L’inconvénient actuel est qu’avec des documents trop longs, apportant trop de détails ou décrivant des images contradictoires (comme une mer à côté d’un désert), l’IA peut mal interpréter, voire ne donner aucun résultat.

Le Dr. Thang a déclaré qu’à l’avenir, l’équipe surmontera cette limitation pour concevoir un modèle d’IA plus complet. L’équipe a envisagé de former l’IA afin qu’elle puisse éditer des images à la demande correspondant au mieux aux textes des utilisateurs, mais aussi rechercher et créer des vidéos à partir de nombreuses photos au contenu similaire.

Aujourd’hui, les modèles texte-image, dont Parti, présentent de nombreuses opportunités mais également des risques, notamment la reproduction de biais et de stéréotypes dans l’ensembles de données d’IA, ou le détournement de l’outil pour la génération de deep fakes avec des conséquences notables pour la sécurité, la communication visuelle, la désinformation, la créativité et l’art. Face à cette situation, le géant technologique américain Google n’a pas utilisé de texte rendu public pour la formation de l’IA. Il a aussi choisi de ne divulguer aucun des modèles, données ou codes de Parti pour des raisons de sécurité, et ce jusqu’à ce que des mesures de protection supplémentaires soient en place.

Luong Minh Thang était ancien élève en mathématiques du Lycée pour surdoués de l’Université nationale du Vietnam à Hô Chi Minh-Ville (VNU-HCM High School for the Gifted). Après avoir obtenu son bac, il a étudié l’informatique à l’Université nationale de Singapour. En 2011, il a obtenu une bourse de doctorat à l’Université de Stanford (États-Unis). En septembre 2016, il a officiellement travaillé chez Google Brain avec une expertise en apprentissage automatique et en traitement du langage naturel.-CVN/VNA

Voir plus

Le ministre des Sciences et des Technologies, Nguyen Manh Hung, lors du Forum. Photo: baochinhphu.vn

Forum de la technologie ouverte 2025

Pour maîtriser l’avenir numérique, le Vietnam doit maîtriser l’intelligence artificielle (IA). Pour y parvenir, la voie la plus rapide passe par la technologie ouverte, avec des données partagées en toute sécurité, une infrastructure informatique nationale et une communauté collaborative et innovante.

Table ronde sur les technologies avancées à Londres. Photo : VNA

Le leader du PCV assiste à une table ronde sur les technologies avancées à Londres

Dans le cadre de sa visite officielle au Royaume-Uni du 28 au 30 octobre, le secrétaire général du Parti communiste du Vietnam (PCV), Tô Lâm, a assisté à une table ronde réunissant d’éminents stratèges et experts britanniques et internationaux dans les domaines de l’intelligence artificielle (IA) et des technologies avancées.

Le secrétaire général du Parti, Tô Lâm (debout), s'adresse à la réception. Photo : VNA

Le Vietnam, "sujet de recherche et partenaire intellectuel des vietnamologues"

Le secrétaire général du Parti, Tô Lâm, a déclaré que la forte participation des universitaires et chercheurs vietnamiens et étrangers a transmis un message important : le Vietnam n’est pas seulement un sujet de recherche, mais est devenu un partenaire intellectuel pour les spécialistes des études vietnamiennes.

Le navire de recherche scientifique Académicien Lavrentyev. Photo: VNA

Lancement de la deuxième campagne d'étude maritime conjointe Vietnam-Russie

Le navire de recherche scientifique Académicien Lavrentyev a accosté au port international de Cam Ranh, dans la province de Khanh Hoa, le 24 octobre, marquant le début de la deuxième étude marine conjointe entre l'Académie vietnamienne des sciences et technologies (VAST) et l'Académie russe des sciences.

Remise du premier prix. Photo: VNA

Remise du Prix de photo et de clips vidéo “La technologie avec le cœur"

La cérémonie de remise des prix et l'exposition des lauréats du Prix de photos et de clips vidéo "La technologie avec le cœur - Technology with Heart" de 2ᵉ édition, se sont tenus le 23 octobre à Hanoï. L'événement, placé sous le thème "Créativité vietnamienne – Voie vers la prospérité", a été organisé conjointement par l'Agence vietnamienne d'Information (VNA) et le Groupe de l'industrie et des télécommunications de l'Armée vietnamienne (Viettel).

Remise du premier prix. Photo: VNA

Remise du Prix de photo et de clips vidéo “La technologie avec le cœur"

La cérémonie de remise des prix et l'exposition des lauréats du Prix de photos et de clips vidéo "La technologie avec le cœur - Technology with Heart" de 2ᵉ édition, se sont tenus le 23 octobre à Hanoï. L'événement a été organisé conjointement par l'Agence vietnamienne d'Information (VNA) et le Groupe de l'industrie et des télécommunications de l'Armée vietnamienne (Viettel).

Visiteurs d'une exposition d'équipements technologiques sur la sécurité et la sûreté des réseaux. Photo d'archives: VNA

Le Vietnam renforce son écosystème de cybersécurité

Le 25 octobre, le Vietnam accueillera la cérémonie d’ouverture à la signature de la Convention des Nations Unies contre la cybercriminalité (Convention de Hanoï), affirmant ainsi son rôle, sa position et son engagement à accompagner la communauté internationale dans la lutte mondiale contre la cybercriminalité.

La directrice générale de l'Agence vietnamienne d'information (VNA), Vu Viet Trang, et le président de l'Association des journalistes vietnamiens (VNA), Le Quoc Minh, ont remis le premier prix aux lauréats lors de la cérémonie et de l'exposition "Technologie avec le cœur" 2024. Photo : VNA

Bientôt la cérémonie de remise de la 2ᵉ édition du Prix de photo et de clips vidéo “La technologie avec le cœur"

La cérémonie de remise du Prix de photos et de clips vidéo "La technologie avec le cœur - Technology with Heart", ainsi que l'exposition de sa 2ᵉ édition, se tiendront le 23 octobre à Hanoï. L'événement sera organisé conjointement par l'Agence vietnamienne d'Information (VNA) et le Groupe de l'industrie et des télécommunications de l'Armée vietnamienne (Viettel).

Forum international « Accroître les investissements numériques : connecter l’offre technologique européenne avec l’avenir numérique du Vietnam » à Hanoï. Photo: VNA

Renforcement de la coopération numérique entre le Vietnam et l’Union européenne

« Accroître les investissements numériques : connecter l’offre technologique européenne avec l’avenir numérique du Vietnam » était le thème du forum international organisé le 21 octobre à Ho Chi Minh-Ville par la D4D Hub, la Délégation de l’Union européenne au Vietnam, AVSE Global et la Chambre de commerce européenne au Vietnam (EuroCham).

Enseignants et élèves du College technique Ly Tu Trong (HCMC) lors d'une séance d'entraînement. Photo sggp.org.vn

La formation professionnelle vietnamienne à l’ère de la transformation numérique

Face à la demande croissante en main-d’œuvre qualifiée et en compétences numériques, de nombreux établissements d’enseignement professionnel au Vietnam, notamment à Hô Chi Minh-Ville, accélèrent leur transition vers le modèle d’“école intelligente”. Objectif : améliorer la qualité de la formation et répondre aux exigences du marché du travail à l’ère numérique.