Création d’un livre de jeunesse avec ChatGPT et LetzAI

Dernière modification : 21.2.2024

Introduction

J’ai commencé le nouvel an 2024 avec la création d’un livre illustré, dédié à mes petits-enfants.

Depuis le 28 janvier 2024, le livre est en vente sur les librairies en ligne, par exemple sur la librairie de Books on Demand (BoD).

L’inspiration de créer un livre d’aventures pour les jeunes, moyennant des outils d’intelligence artificielle, m’est venue fin février 2023, lorsque Thierry Labro, rédacteur en chef de Paperjam, a publié son roman futuriste “Ils ont tué mon avatar !“, conçu en une heure par ChatGPT et illustré par Dall-E. À cette époque, l’intelligence artificielle, bien qu’avancée, ne permettait pas encore de créer des images en haute résolution ou de rédiger de longs textes de manière cohérente.

LetzAI

L’été 2023 a marqué un tournant avec la présentation de LetzAI, un générateur d’images luxembourgeois révolutionnaire, basé sur l’intelligence artificielle. Ce progrès majeur permettait pour la première fois d’entraîner un modèle de manière fiable et aisée avec ses propres personnages, pour produire ensuite des illustrations fidèles et harmonieuses.

Début septembre 2023, j’ai découvert LetzAI pendant mon petit déjeuner, lors de la lecture de l’article “Hier wird der Großherzog zu Iron Man” dans le Luxemburger Wort. Les jours suivants, presque toute la presse (Adada, Paperjam, Farvest, Virgule, RTL, 100Komma7, …) présentait le projet. Dans la suite, les média continuaient de parler de LetzAI (Page, Forbes, …). L’assemblage d’images, générées avec LetzAI, qui suit, donne un aperçu sur les différents modèles disponibles lors du lancement public du projet.

Panoplie des modèles de génération d’images lors du lancement public de LetzAI (image Neon Internet)

Equipe de création

Les créateurs de LetzAI sont les spécialistes de l’agence de communication Neon Internet. Il s’agit de Misch Strotz (chief executive officer), Karim Youssef (chief marketing officer), Sacha Schmitz (chief content officer), Ricardo Prosperi (agency manager), Jacques Weniger (chief operating officer), Julie Wieland (lead designer), Carlos Gonser (chief technology officer), Kim Feyereisen (graphic designer), Daniel Wahl (lead developer), Torge Schwandt (business consultant), Laura Seidlitz (content creator), Michael Klares (video editor), Mathieu Schiltz (business consultant).

Karim Youssef, Sacha Schmitz, Michel Strotz, Ricardo Prosperi, Jacques Weniger (photo: Neon Internet)
Julie Wieland, Carlos Gonser, Kim Feyereisen, Daniel Wahl, Torge Schwandt, Laura Seidlitz, Michel Klares, Mathieu Schiltz (photos : Neon Internet)

Neon Internet

Neon Internet se présente comme agence hybride marketing et technologie. Elle a été co-fondée par Misch Strotz et Karim Youssef en 2018. Sacha Schmitz est partenaire dans la société. Lors de la 7ème édition du Concours de l’Innovation dans l’Artisanat en 2022, organisée par la Chambre des Métiers, Neon Internet a obtenu le prix dans la catégorie Gestion/Organisation/Management pour le développement d’un écosystème d’outils de marketing en ligne, appelé Neontools. Cette application est utilisée par plus de 75.000 créateurs et entrepreneurs à travers le monde.

Prix de l’innovation dans l’artisanat 2022, Gestion/Organisation (image: Chambre des Métiers)

Une autre offre de l’agence est le site web Neon Academy, qui propose des cours de formation et des conseils sur le marketing en ligne.

Maach eppes Lëtzebuergesches

LetzAI a été annoncé sous la devise Maach eppes Lëtzebuergesches, mat LetzAI. Les modèles de génération d’images, présentés au début, se référaient à des produits luxembourgeois comme la Bouneschlupp, les Gromperekichelcher, les bières Battin et Diekirch.

D’autres modèles permettaient de créer des scènes avec des politiciens, par exemple avec l’ancien et le nouveau premier ministre. Des séances photo pour capter les portraits des personnages consentants, aux fins d’entraîner les modèles AI, ont eu lieu pendant les vacances d’été.

D’autres personnes de la vie publique ne manquaient pas, un cardinal, des athlètes, des acteurs, des artistes, des entrepreneurs.

Enfin et surtout on y trouvait des célébrités emblématiques comme Superjemp, Yuppi et Boxemännchen.

Bien sûr les développeurs de LetzAI participaient également au jeu avec leurs propres modèles. Je laisse le plaisir aux lecteurs de deviner les noms des créateurs présentés ci-après.

L’ensemble des images publiques générées peut être visualisé dans le “Feed” sur la page web de LetzAI.

Première page du site web LetzAI avec la galerie des images publiées les plus récentes (Feed)

Réseaux sociaux

Comme Neon Internet est un spécialiste de la communication sur les réseaux sociaux, il est évident que LetzAI se présente sur tous les canaux : Facebook, Instagram, LinkedIn, X(Twitter), Youtube et TikTok.

Early Access

LetzAI a été lancé fin août/début septembre 2023 en mode Early Access. L’achat d’une clé d’accès, à un prix forfaitaire, permettait de générer des images et de créer des modèles à discrétion. J’étais parmi les premiers usagers à profiter de cette offre. Évidemment, le premier modèle que j’ai entraîné était basé sur des photos récentes de moi-même, dans différentes poses et sous différents angles de vue. J’étais ravi des premiers résultats.

Mon premier modèle public @steampunkluucht permettait de générer des images synthétiques de lampes steampunk, dans le style des lampes réelles construites par Gast Klares. Ce bricoleur et artiste génial m’a autorisé à utiliser les photos, en haute résolution, de ses 85 lampes présentées sur son site web. Ensuite j’ai fouillé dans mes archives d’anciennes photos et diapositives pour trouver des motifs pour des modèles LetzAI à créer, par exemple les sculptures de Niki de Saint Phalle (@sculpturesnikidesaintphalle), installées dans la capitale lors de l’année culturelle 1995. Une autre collection se réfère à l’exposition de 103 vaches (@artoncows), décorées par des artistes et installées à travers la capitale en 2001. Avec des photos prises de fleurs (@flowers) et de mannequins de vitrine, j’avais épuisé les collections de photos dans mes archives, qui se prêtaient pour entraîner des modèles LetzAI.

Pour explorer d’autres pistes, j’ai effectué des randonnées dans les environs pour photographier la nature et l’architecture, notamment dans la Réserve naturelle Giele Botter (@gielebotter) et dans le nouveau quartier urbain Esch-Belval. Le modèle @eschbelval était le premier que j’ai combiné avec un autre modèle, à savoir @flowers, pour générer des images imaginaires d’Esch-Belval fleuri. Le Luxembourg Learning Center (LLC), qui abrite la bibliothèque universitaire, se prêtait pour la création d’un modèle LetzAI d’architecture intérieure @learningcenter.

Après une déviation dans le monde animal avec le modèle @black_cat, entraîné avec des photos du chat noir Billy de mon beau-fils, c’était le tour des artistes pour être mis en scène. Le premier était Rosch Bour de Lamadelaine, un multitalent : auteur de plusieurs livres, peintre, dessinateur, illustrateur, musicien, historien, archiviste, acteur de théâtre et athlète. Pour le 150e anniversaire des chemins de fer en 2009, ses aquarelles de locomotives figuraient sur des timbres de POST Luxembourg. Rosch m’a autorisé à utiliser un échantillon de ses aquarelles et de ses fusains pour l’entrâinement des modèles AI @watercolor_by_roger_bour et @charcoal_by_roger_bour. Ainsi lui-même, il a pu ajouter un titre supplémentaire à son palmarès: premier artiste peintre figurant sur LetzAI. Le deuxième artiste est mon ancienne collaboratrice Céline Kruten. De formation ingénieur-multimédia, elle a changé de métier il y a quelques années pour devenir créatrice d’art floral. Elle a fondé son propre entreprise Les Herbes Folles – Floral Design pour créer des décorations florales et pour organiser des événements particuliers, comme des mariages ou banquets. Céline m’a autorisé à sélectionner des photos d’arrangements florales dans le portfolio sur son site web pour créer le modèle LetzAI @les_herbes_folles. Les images générées avec ce modèle ont toutefois du mal à reproduire la beauté, la délicatesse et le naturel des vraies créations florales de Céline.

Le troisième artiste est Harold Cohen, un pionnier à la confluence de l’intelligence artificielle et des arts visuels. En 1972, il a développé AARON, un programme informatique révolutionnaire conçu pour générer de manière autonome des peintures et des dessins. Son croisement innovant de la créativité informatique et de l’art traditionnel lui a valu une renommée internationale, son travail étant présenté dans de nombreuses expositions dans des musées prestigieux du monde entier. En reconnaissance de ses contributions, Harold Cohen a reçu de nombreuses distinctions, tout au long de sa carrière.

Né au Royaume-Uni en 1928, Harold Cohen a déménagé aux États-Unis, où il a partagé son expertise et sa passion pour l’art et la technologie à l’Université de Californie, de 1968 jusqu’à sa retraite en 1998. Même après sa retraite, il est resté activement engagé dans le développement d’AARON, améliorant ainsi ses capacités et sa complexité. Initialement, le programme a été développé en C, mais il est ensuite passé au LISP pour exploiter ses puissantes fonctionnalités pour le développement de l’intelligence artificielle.

Dans les semaines qui ont précédé son décès en 2016, Harold Cohen s’est lancé dans une nouvelle aventure avec AARON, intitulée de manière ambitieuse « La peinture au doigt pour le 21e siècle ». Alors que les premières années l’ont vu utiliser des traceurs x-y pour donner vie aux créations d’AARON, dans les années 1990, il avait conçu une série de machines de peinture numérique. Son évolution continue dans le médium a vu un passage aux imprimantes à jet d’encre et finalement aux écrans tactiles dans son projet final, cherchant toujours à mélanger la technologie avec l’essence tactile de la peinture.

Ray Kurzweil, un éminent informaticien et futuriste américain, a introduit l’héritage de Harold Cohen dans l’ère numérique en développant un programme d’économiseur d’écran AARON en 2000, adapté aux ordinateurs Windows. Ce programme fonctionne encore aujourd’hui sous Windows 11, en mode compatibilité Windows 98. La création de mes propres images AARON, avec le logiciel de Ray Kurzweil m’a permis d’entraîner mon modèle @aaron_by_harold_cohen dans le respect des droits d’auteur pour les oeuvres originales de Harold Cohen. Ray Kurzweil a réalisé en 1987 le film documentaire The Age of Intelligent Machines qui présentait l’état d’art de l’intelligence artificielle à cette époque.

Un créneau que je n’avais pas encore exploré étaient les dessins animés. J’ai effectué un premier essai avec Big Buck Bunny, le protagoniste d’un court métrage néerlandais, réalisé en 2008 par Sacha Goedegebure, exclusivement avec des logiciels libres, dont principalement Blender. Le film, ainsi que l’ensemble des fichiers source et matériaux ayant servi à sa réalisation, ont été publiés sous licence Creative Commons. Comme j’étais moi-même à l’époque créateur 3D sur le web pendant mon temps libre, je dispose de toutes les images du film en haute résolution et c’était facile de créer le modèle LetzAI @big_buck_bunny.

Mon deuxième modèle LetzAI de dessin animé est @velo_cartoon. L’origine de ce modèle remonte à l’été 2022, lorsque j’ai été admis comme testeur-beta pour le générateur d’images DALL*E2 par OpenAI. Ma première image a été générée avec le prompt “cartoon of an elephant and a giraffe riding a bicycle on the beach” et publiée le même jour sur Facebook. Dans la suite j’ai utilisé régulièrement le même prompt pour tester d’autres générateurs d’images comme Dreamstudio, Craiyon, Midjourney et Stable Diffusion.

La galerie qui suit présente quelques images générées avec des modèles LetzAI qui ne sont pas encore à point (@animal_croissant, @artpet, @birthday_cake, @letz_postage_stamps, @minerals, @naive_art, @vase et @vintage_toy) ou qui se trouvent encore en mode privé, notamment les modèles de mes portraits comme bébé, enfant et jeune adulte ainsi que celui des mannequins.

Je clôture ce chapitre avec l’affichage de quelques captures d’écran, exposant les photos utilisées pour entraîner des modèles.

Lors de la période Early Access, j’ai donc pu acquérir les compétences pour faire face au défi de création des illustrations pour le livre d’aventure pour mes enfants.

Animations et vidéos

À côté de la génération d’images fixes avec les outils d’intelligence artificielle, j’ai également commencé à sonder les possibilités de créer des animations et des vidéos avec ces applications. En décembre 2022, j’ai réalisé ma première vidéo avec un générateur text2video, en spécifiant le prompt “A panda playing chess on the beach“. Certes ce n’était pas encore un chef d’oeuvre, mais c’était un début promettant. Avec une image de Big Buck Bunny, j’ai produit plusieurs animations. La première est une synchronisation labiale en langue anglaise. Le deuxième exemple est synchronisé avec une voix synthétique française, la troisième animation parle luxembourgeois, avec ma propre voix. Ensuite c’était mon MiniMoi, une petite figurine de 20 cm, imprimée en 3D à mon effigie, qui apprenait à parler luxembourgeois. Après les élections en octobre 2023, Superjemp, qui avait déjà appris à parler luxembourgeois, racontait avec une voix synthétique qu’il venait de voter la liste 19. Dans tous les cas, j’ai utilisé l’outil AI HeyGen pour réaliser ces animations.

Début novembre 2023, j’ai animé quatre images du Boxemännchen, générées par Sacha Schmitz, moyennant la nouvelle version du module Text + Image2Video Gen-2 de Midjourney.

À l’heure actuelle, les générateurs vidéo, basés sur l’intelligence artificielle, ne sont pas encore à un niveau pour pouvoir envisager la réalisation de longs métrages, même pas des courts métrages, mais les fondations sont posées. J’espère pouvoir enchaîner dans les prochaines années sur mon livre d’aventures pour créer un film animé des jeunes explorateurs, à l’effigie des mes petit-enfants.

Incident avec Mélusine

Retournons à LetzAI. Début octobre 2023, une première communication visuelle, réalisée avec l’outil LetzAI, a été lancée par l’agence Wait, pour le compte de wortimmo.lu, le site internet immobilier du Luxemburger Wort. La campagne présentait Mélusine, la sirène magenta du modèle polygonal 3D «low-poly», créé par Serge Ecker en 2013, installée dans le quartier du Grund au bord de l’Alzette. La campagne avait un défaut : l’artiste n’a jamais été contacté pour l’utilisation de l’image de son œuvre. Serge Ecker s’est référé à la loi de 2001 sur les droits d’auteurs et la campagne est rapidement disparue des supports de publicité et des pages web.

Luxembourg Artweek

La neuvième édition de la foire Luxembourg Artweek s’est déroulée du 10 au 12 novembre 2023. C’était l’occasion pour LetzAI de s’adresser au public. Dans le cadre de l’ArtTalk “Art and New Technologies“, Misch Strotz présentait la plateforme LetzAI et il a démystifié les systèmes d’intelligence artificielle créatifs dans le monde de l’art. La démonstration était suivie par la projection du film Artist Alain Welter tries LETZ.AI.

Ensuite la parole fut donnée aux artistes luxembourgeois présents sur le plateau : Lynn Klemmer, Eric Mangen et Serge Ecker. La discussion entre Misch Strotz, les artistes et le public fut modéré par Hinde Baddou. Le débat était animé et de haut niveau et a permis de dégager les différents sentiments des artistes par rapport aux générateurs d’images, entraînées avec leurs propres œuvres. Serge Ecker a saisi l’occasion pour revenir sur sa réaction au sujet de la campagne publicitaire ratée avec sa sculpture Mélusine. “I would rather cut off my foot than train a public AI model on my art” était une de ses déclarations.

Démarrage beta

Début décembre 2023, LetzAI est entré dans une phase de beta publique. Lors d’une release party le soir du 3 décembre 2023, en présence de la Gëlle Fra, de Yuppi, de Superjemp et d’autres célébrités, les conditions d’utilisation de la plateforme ont été dévoilées. Trois formules d’abonnement, avec facturation mensuelle, sont proposées : Beginner, Fun et Pro. Pour les indécis, la formule Just Testing, au prix de 4,90 € sans engagement, permet de créer environ 30 images. Pendant la phase beta, les quatre formules permettent la création d’un nombre illimité de modèles.

Challenge AI mam Kleeschen

Pour la fête de Saint Nicolas, LetzAI avait lancé son premier concours parmi les anciens et nouveaux usagers. Le défi consistait à créer une image avec le modèle public @kleeschen, plébiscité par l’ensemble des usagers. Plus que mille images furent générées. Le vainqueur était Timothy Bettega, le jeune fondateur du Guide Luxembourg et de Black Thunder, une agence événementielle luxembourgeoise visionnaire.

La galerie ci-après présente l’image couronnée muscular @kleeschen doing a deadlift (en haut à droite), ainsi qu’une sélection d’images de @kleeschen dans d’autres scènes.

Marché Augenschmaus

Quelques jours avant Noël 2023, la quatrième édition du marché des créateurs Augenschmaus a eu lieu dans les Rotondes. Le Jingle Mingle X‑Mas Market by Augenschmaus était une occasion unique pour trouver un cadeau original à mettre sous le sapin. On y trouvait une sélection de créations uniques et de produits artisanaux, tous imaginés avec talent par des artistes, designers et producteurs locaux. LetzAI était présent sur ce marché avec un stand de démonstration de sa plateforme de génération d’images. L’équipe de Neon Internet a eu un grand plaisir de présenter les oeuvres, générées par l’intelligence artificielle, au public.

Evolution LetzAI

Le début du nouvel an 2024 était le moment idéal pour l’équipe de LetzAI d’annoncer plusieurs améliorations de la plateforme. En premier lieu c’était une extension des dimensions des images générées. Dans le passé, le format imposée était un carré de 1080 x 1080 pixels. Maintenant, la sélection de formats “portrait” ou “paysage” est également possible, avec une hauteur ou une largeur maximale de 1600 pixels. On peut également varier deux paramètres pour régler la “créativité” et la “qualité“. C’était le signal de départ de la création de nombreux nouveaux modèles par les usagers, surtout des styles à appliquer à des modèles d’objets ou de personnages. Je n’ai pas pu résister pour créer quelques portraits de moi-même dans différents styles d’images.

LetzAI V2

En mi février 2024, LetzAI a annoncé l’introduction d’une nouvelle version V2, plus polyvalente et plus performante que la version 1, qui est commercialisée depuis décembre 2023. La résolution maximale d’une image générée a été augmentée jusqu’à 1.920 x 1.920 pixels.
L’interprétation de la description (prompt), pour générer une image, a été sensiblement perfectionnée, ce qui permet de créer des images d’une précision et d’une qualité étonnantes. Quelques créations réalisées par Misch Strotz, le développeur principal de LetzAI, sont présentées ci-après, avec affichage du prompt spécifié.

Cliquez sur l’image en haut pour l’agrandir, utiliser la souris pour scroller le prompt.

Le processus de création des modèles LetzAI personnels, publics ou privés, a également été amélioré. Le nombre de photos ou d’illustrations requis pour entraîner un modèle V2 a été réduit. La définition du type d’image, demandée lors de l’activation du modèle, est devenue plus granulaire, ce qui garantit une meilleure fidélité. L’accès public à la plateforme LetzAI V2 est prévue pour début mars 2024. Reste à signaler que les modèles V1 existants sont compatibles avec la version 2.

Partenariat LetzAI – Gcore

Le 21 février 2024, LetzAi a annoncé sur les réseaux sociaux et sur son blog qu’un protocole d’accord, pour un partenariat stratégique, a été signé avec le fournisseur luxembourgeois de cloud et d’IA Gcore, situé à Contern. Grâce à ce partenariat, LetzAI peut étendre les capacités de sa plateforme actuelle, servir plus d’utilisateurs et permettre des cas d’utilisation professionnels.
L’objectif de LetzAI est de fournir une plate-forme qui est non seulement amusante à utiliser, mais qui aide également les professionnels du marketing à accélérer considérablement leurs processus créatifs.
La version V2 de LetzAI constitue déjà une des plateformes d’intelligence artificielle générative les plus inclusives au monde. Au cours des dernières semaines, Gcore a mis son infrastructure GPU Nvidia H100 à disposition de LetzAI pour le développement et l’entraînement de la version V2. Pour le lancement, Gcore fournira des GPUs L40S.
Le partenariat LetzAI-Gcore conclu prévoit d’offrir la technologie LetzAI sur le plan international. À ces fins, Gcore fournira des services de pointe d’une infrastructure GPU, avec 160 points de présence dans le monde entier, en commençant dans les pays voisins comme Allemagne, France et BENELUX.

Partenariat LetzAI – Gcore (photo: LetzAI)

Avec cette information, je termine le récit de l’histoire de LetzAI. Mais cette plateforme constitue seulement la moitié des outils requis pour la réalisation de mon projet de livre “Les Jeunes Explorateurs“. L’autre moitié est ChatGPT, que je vais présenter dans le prochain chapitre.

ChatGPT

Ma première rencontre avec ChatGPT a eu lieu au printemps 2022. J’ai demandé au modèle GPT-3 la génération d’un article au sujet de la guerre qui venait d’éclater entre les créateurs d’oeuvres d’art plastiques et les générateurs d’oeuvres d’art synthétiques. Quelques mois plus tard, j’ai publié sur HuggingFace (une plateforme de collaboration AI renommée), une application qui permettait de générer un poème en langue luxembourgeoise.

Rapidement je suis devenu un utilisateur régulier de ChatGPT et j’ai suivi toutes les évolutions de cet outil de traitement et de génération de textes. Sur les réseaux sociaux, j’ai écrit des contributions au sujet de thèmes variés : génération d’un poème concernant un chien qui est tombé amoureux d’un grille-pain, illustration de ce poème, hallucinations des modèles de langage AI, essai au sujet du cerveau écrit dans la manière d’un élève, rédaction d’un résumé d’un article sur le web, dialogues entre robots, fables de Jean de la Fontaine, messages dans une bouteille.

En décembre 2023, j’ai rédigé une contribution étoffée sur mon site web au sujet de l’évolution de ChatGPT qui progresse avec des bottes de sept lieues : De gestiwwelte ChatGPT. Je recommande à tous les lecteurs qui sont intéressés à plus de détails au sujet de l’histoire, de la technique et des créateurs de ChatGPT, de lire cet article.

Personnalisation de ChatGPT

Il y avait une compétence qui manquait à ChatGPT, à savoir la possibilité d’ajouter ses propres documents et informations, pour étendre son savoir. Cette faculté est indispensable si on souhaite générer des textes avec des connaissances spécifiques ou créer des récits autobiographiques, sauf si on est une célébrité bien documenté sur le web. Lors de la mise en ligne de ChatGPT en automne 2022, la date limite de ses connaissances était septembre 2021. En 2023, les connaissances ont été actualisées jusqu’en janvier 2022, lors d’une mise à jour discrète de ChatGPT. Le processus d’entraînement d’un modèle AI géant de langage comme ChatGPT, avec un corpus qui comprend tout le contenu du web, ainsi qu’un nombre énorme de livres, prend plusieurs mois, sur les ordinateurs les plus puissants qui existent, et il coûte une fortune.

En été 2023, OpenAI a ajouté une option à ChatGPT permettant d’accéder à des informations sur le web. En outre deux entreprises, Dante.ai et Berri.ai, proposaient une interface à ChatGPT pour ajouter son propre contenu à ce robot de dialogue. C’était un premier pas dans le bons sens. J’ai décrit mes propres expériences avec ces outils dans mon article “Ech hunn haut mam Dante AI gechatt !“.

Evolution de ChatGPT

Tout a changé le 6 novembre 2023, lorsque la première conférence de développement OpenAI a eu lieu. Sam Altman, le CEO de OpenAI, présentait une série d’innovations et une réduction sensible des prix pour l’utilisation des produits de son entreprise. Un des atouts était la conversion de ChatGPT en modèle AI multimodale ChatGPT-4, avec l’intégration du module DALL*E3 pour générer des images, du module Vision pour analyser et décrire des images, des modules Voice (TTS) et Whisper (ASR) pour parler avec une voix synthétique et pour comprendre la parole humaine, et du module Code Interpreter pour faciliter la création de programmes informatiques avec ChatGPT.

J’ai exploré de suite ces innovations et rapporté sur mes expériences sur les réseaux sociaux: dialogue vocale avec ChatGPT-4, nombre de personnes sur une image, résumé de ma page web d’accueil, génération d’une image sur base d’un croquis, génération de cartoons.

Les innovations les plus attrayantes étaient l’introduction de ChatGPT-4 Turbo et du concept de Custom GPT.

GPT-4 Turbo est plus performant et connaît les événements mondiaux jusqu’en avril 2023. Il dispose d’une fenêtre contextuelle de 128 000 pages et peut donc contenir l’équivalent de plus de 300 pages de texte dans une session.

J’ai testé les nouvelles compétences et performances de ChatGPT-4 dans un dialogue impressionnant “My discussion with ChatGPT-4 about the evolution of the Internet“.

Ecosystème Custom GPT

Une Custom GPT permet de personnaliser le robot ChatGPT-4 pour des besoins spécifiques, en ajoutant des contenus personnels (textes et images), en écrivant des instructions à effectuer et en ajoutant, éventuellement, du code pour exécuter des actions informatiques, par exemple envoyer un message, faire des recherches dans une base de données, mettre à jour un site web.

Les premières applications luxembourgeoises du type Custom GPT ont été réalisées par les spécialistes suivants:

Il y à quelques jours, OpenAI a ouvert son magasin Custom GPT, permettant à tout abonné de ChatGPT-4 de profiter des applications spécialisées, développées par d’autres usagers. À l’image de GooglePlay et du AppStore, qui offrent des applications pour les smartphones, OpenAI a lancé tout un écosystème, permettant la recherche de modèles gratuits et payants et de rémunérer les développeurs pour leur travail. Ce magasin ouvre une nouvelle dimension dans la popularisation de l’intelligence artificielle.

Rédaction et illustration de mon livre

Mi-novembre 2023, la technique était donc prête pour concrétiser mon rêve et pour procéder à la conception d’un livre d’aventures pour mes petits-enfants, avec l’aide de ChatGPT-4 et de LetzAI.

Concept initial de mon livre

Au début, j’avais esquissé un concept sophistiqué. Les 5 enfants, 2 filles et 3 garçons, parmi eux des jumeaux, étaient accompagnés par leurs animaux de compagnie : le lapin Floppy, le cochon d’Inde Caramel, le poisson rouge Blublu, le coq Cocorico et Léon, le caméléon. La galerie d’images qui suite montre les protagonistes imaginées.

Le voyage aurait du se dérouler comme une grande aventure, parsemée d’imprévus et de complications. Mais ChatGPT était accablé avec mon script, aussi bien au niveau de la génération d’illustrations qu’au niveau de la génération de textes cohérents.

Au niveau des illustrations, je n’ai pas réussi à générer des images correctes avec tous les personnages et les animaux de compagnie : des enfants avec des têtes de caméléon ou avec des jambes de coq, des incohérences avec les habits et les lunettes des enfants, des confusions au niveau de la couleur des cheveux et des yeux, sont quelques exemples des problèmes rencontrés. À côté de DALL*E3, j’ai essayé d’autres applications de génération d’images comme Stable Diffusion (stability.ai) et Midjourney. C’était encore pire. J’ai visité les grands sites web AI communautaires comme Stable Diffusion Art ou CivitAI pour me rendre compte qu’aucun modèle ajusté de génération d’images, développé par les usagers inscrits, permettait de générer des groupes de personnes.

J’ai commencé à entraîner mes propres modèles du type LoRA avec Stable Diffusion, respectivement des modèles LetzAI. Comme supports pour l’entraînement des modèles, j’ai utilisé quelques rares images DALL*E3 réussies, ainsi que des assemblages des différentes personnes à l’aide de Photoshop. Malgré tous les efforts, j’ai dû me rendre compte que la génération cohérente d’images de plus de trois personnes était illusionnaire.

Au niveau de la génération du texte, j’ai constaté que des scénarios complexes embrouillaient ChatGPT et ne permettaient plus de créer des récits cohérents dans une même session. J’avais par exemple imaginé qu’un des acteurs se cassait une jambe lors d’un saut en parachute en Indonésie et devait être rapatrié par Luxembourg Air Rescue. J’avais prévu d’autres complications et incidents, mais c’était trop fastidieux de demander en permanence à ChatGPT des modifications des récits générés, respectivement de procéder à des corrections manuelles.

Mon ambition était d’exposer l’état de l’art de l’intelligence artificielle au début de l’an 2024 par la publication de mon livre, sans procéder à des retouches aux niveaux des illustrations et des récits. J’avais toutefois l’intention de demander différentes créations des illustrations et des textes pour certaines scènes et de sélectionner ensuite les meilleurs résultats.

Concept définitif de mon livre

Pour tenir compte des limitations actuelles de l’intelligence artificielle, je me suis résigné à simplifier mon script initial. Les animaux de compagnie sont restés à la maison et les cinq enfants ont été répartis en deux équipes : la fille ainée formait un groupe avec les deux jumeaux et la fille cadette faisait un team avec son cousin. De cette façon c’était possible de dépicter, d’une façon cohérente, les deux bandes avec 2 et 3 personnes dans des images générées par AI.

Au niveau de la description du voyage, j’ai remplacé l’expédition, avec des imprévues et des complications à travers le monde, par une exploration bien organisée de plusieurs destinations, définies au préalable, dans différents pays. De cette manière ChatGPT-4 a pu mettre en valeur ses riches connaissances du monde, sans devoir trop réfléchir. Malgré ses compétences impressionnantes pour programmer des applications informatiques ou pour résoudre des problèmes logiques, le raisonnement n’est pas encore le trait le plus fort de ChatGPT-4. D’ailleurs les autres robots de dialogue n’ont pas encore atteint le même niveau d’intelligence que l’application d’OpenAI. Sam Altman, le CEO de l’entreprise, a annoncé récemment que la faculté de penser de ChatGPT-5, qui sera lancé en 2024, sera sensiblement améliorée et que la génération de vidéos, à partir de prompts, sera ajoutée au produit. J’espère donc pouvoir reprendre mon concept initial au début de 2025 pour donner une suite aux aventures des jeunes explorateurs dans un deuxième livre.

Au niveau des dimensions du livre, j’ai opté pour un format carré de 17 x 17 cm, en présentant les explorations des deux équipes, jour par jour, sur une double page.

Exemple d’une double page du livre avec le récit des visites des deux équipes pendant le 38e jour

Après la définition des dimensions de i’illustration sur chaque page et le choix de la police de caractères pour le texte, j’ai pu évaluer que le récit sur chaque page ne pouvait pas dépasser 200 mots.

Dialogue avec ChatGPT

Pour s’entretenir avec ChatGPT-4, il faut être abonné payant auprès d’OpenAI, au prix mensuel de 21,29 €, TVA incluse. Je suis un abonné de longue date. Malgré quelques privilèges, je suis de plus en plus souvent confronté au problème de la surcharge des serveurs d’OpenAI, accompagnée d’un temps d’attente pour accéder au service. Pour faire face à l’augmentation continue des usagers, OpenAI a introduit des restrictions pour l’utilisation du service. Après 30 requêtes, il faut attendre 3 heures pour continuer le dialogue. La session reste toutefois établie et ChatGPT garde en mémoire toute la discussion du passé. D’ailleurs, tout le dialogue au sujet de mon livre, pendant des dizaines de jours, s’est passé dans une même session.

Avant d’ouvrir la session de dialogue, j’avais préparé un avant-projet pour le déroulement de l’exploration. Comme je voulais créer quelque chose de consistant, je me suis proposé de dresser une liste de 100 sites du patrimoine mondial de l’UNESCO, à visiter par les enfants dans différents pays, à travers de trajets distincts à parcourir par chaque équipe, moyennant une panoplie de moyens de transport. J’avais également esquissé un itinéraire pour la traversée des différents pays. Comme introduction, j’ai soumis mes réflexions à ChatGPT. Après ses éloges et félicitations au sujet de mon initiative de création d’un livre pour enfants, on a abordé du concret: j’ai demandé à ChatGPT de me proposer une liste des sites UNESCO à visiter, un relevé des moyens de transport disponibles dans les différents pays et une chronologie des visites à faire. Et progressivement, on s’est mis d’accord sur les moments du voyage et sur la chronologie.

J’ai commencé avec la deuxième équipe, composée de deux enfants. Comme commande à soumettre à ChatGPT, c’était suffisant d’entrer un prompt du type : “jour x, visite du site Y, moyen de transport Z, nuitée à Q“. Et progressivement on est arrivé au 60e jour du voyage avec le retour à Luxembourg, après la visite de 50 sites UNESCO dans 25 pays différents, avec des parcours en avion de ligne, en avion privé, en bateau, en taxi, en voiture Uber, en co-voiturage, à pied, etc.

Pour la première équipe, constituée de trois enfants, c’était la même procédure. Mais au lieu de commencer leur exploration au Luxembourg comme l’autre groupe, les enfants sont partis le premier jour en Australie. Et comme les distances à parcourir entre les différents sites étaient plus longues, ils étaient obligés de prendre des moyens de transport plus innovants : un avion privé avec décollage et atterrissage verticale, un hovercraft. Et dans les pays plus exotiques, c’était un Tuk-Tuk.

Dans l’introduction j’avais informé ChatGPT que le texte pour chaque page devait être d’environ 200 mots, ce que le robot a scrupuleusement respecté. C’était rare que j’ai demandé à ChatGPT de reformuler le récit pour une journée, et le plus souvent c’était à cause de ma propre faute, à cause d’une erreur dans le prompt spécifié. Pour les lecteurs intéressés aux détails, je fournis ici le lien pour accéder à la discussion entière avec le chatbot dans la session archivée.

Custom GPT pour les illustrations

Après la validation du texte, c’était le moment de procéder à la création des illustrations pour le livre. Après mes expériences du passé et mes essais réalisés pour générer des images AI d’un groupe de personnes, je suis arrivé à la conclusion que l’entraînement de deux modèles LetzAI, moyennant la génération de quelques dizaines d’illustrations générées avec ChatGPT-4 / DALL*E3, suivie éventuellement de retouches avec l’outil Adobe Photoshop, était la procédure la plus prometteuse pour obtenir rapidement des résultats valables. J’ai eu raison. Je souligne que la génération directe des images voulues dans LetzAI n’était pas encore possible au début de l’année 2024, à cause de la longueur limitée des prompts à entrer sur la plateforme. Cette restriction a été levée récemment dans le cadre des autres évolutions de LetzAI.

La page qui suit affiche une capture d’écran de la page de configuration de ma Custom GPT “Two young explorers“.

Page de configuration de la custom GPT “Two young explorers” sur la plateforme OpenAI

Dans les instructions j’ai défini un groupe, suivi par la spécification des deux membres de ce groupe, comme le genre, l’âge, les cheveux, les yeux, les accessoires (lunettes), les habits, etc. Ensuite j’ai indiqué les caractéristiques des images à générer : dimensions, style, angle de vue, etc. J’ai également fixé les règles à observer : pas d’écriture de textes dans l’image, respect de la cohérence, etc. J’ai ajouté comme référence deux photos avec des portraits de mes petits-enfants concernés. Comme dernière instruction, j’ai invité ChatGPT à demander à l’usager, à chaque requête, le lieu de la scène et les activités du groupe à afficher dans l’image. Ensuite il suffit de cliquer sur le bouton “Exécuter les instructions” et de répondre à la question de ChatGPT, par exemple “site UNESCO de la Grande Barrière en Australie, plongée dans les corails“.

Le modèle personnalisé Custom GPT “Three young explorers” pour l’autre groupe a été configuré de la même manière. Si l’image ne correspondait pas aux attentes, j’ai demandé une nouvelle génération au robot. La capture d’écran qui suit montre que cette tentative se terminait des fois avec un dialogue de sourd.

Échec de ma demande à ChatGPT de générer une image correcte avec les 3 personnes de l’équipe

Il reste à signaler que ChatGPT s’est efforcé pendant tout le cycle de génération d’images de témoigner de ses connaissances du monde, lors de la création des illustrations. Comme les personnes en Afrique sont en général de couleur noire et comme celles en Asie ont les yeux bridées, la physionomie des jeunes explorateurs a été modifiée dans ce sens par ChatGPT, lors de leurs voyages dans ces continents. Quelques exemples sont affichés ci-après :

Après la réalisation de quelques retouches à la collection des illustrations générées pour les deux groupes, j’ai pu procéder à l’avant-dernière étape : l’entraînement des modèles LetzAI.

Création des modèles LetzAI

L’étape de création des modèles LetzAI était la plus facile. Après le login sur la plateforme LetzAI, on se décide pour la création d’un modèle public ou privé. On déclare qu’on dispose des droits sur les images utilisées pour la création du modèle, on choisit un nom, on télécharge les images et on clique sur entraînement. Ensuite on peut passer à autre chose. Après un quart d’heure on est informé que le modèle est prêt et qu’il faut l’activer.

Le 10 novembre 2023, j’examinai quelques nouvelles fonctionnalités de mon éditeur vidéo. Pour se baser sur un cas concret, j’ai profité de l’occasion pour réaliser un tutoriel LetzAI. La vidéo n’est pas parfaite et l’interface de la plateforme LetzAI a un peu changé entretemps, mais le tutoriel donne une vue fidèle comment procéder pour entraîner un modèle et pour générer des images.

Pour commenter la vidéo en anglais, j’ai utilisé une application AI de synthèse de la parole, avec clonage de ma propre voix et synchronisation labiale. La musique de fond a également été composée par une application d’intelligence artificielle, développée par l’entreprise luxembourgeoise AIVA.AI.

Mes deux modèles LetzAI créés pour le livre s’appellent @2_explorers et @3_explorers. Pour les activer, j’ai spécifié le type de modèle comme groupe de 2 ou 3 personnes, en décrivant les membres du groupe dans les sous-types. Pour générer ensuite une image, il suffit alors d’entrer un prompt dans le bon format, par exemple “@2_explorers, group, riding a bicycle in Amsterdam” ou “@3_explorers, group, hiking in Katmandou, Nepal“. Et voilà. Le jeu est joué.

L’ensemble des images générées peut être visualisé dans l’aperçu du livre.

Impression de mon livre

Pour l’impression de mon livre, j’ai opté pour l’auto-édition auprès du fournisseur en-ligne Books on Demand (BoD). Il y a d’autres entreprises qui proposent l’impression de livres en auto-édition, comme Amazon avec son service Kindle Direct Publishing (KDP), mais j’ai fait d’excellentes expériences avec BoD dans le passé, avec mes autres livres.

Pour préparer le fichier avec le texte à fournir à l’imprimerie, j’ai utilisé de logiciel Microsoft Office Word. Sur le site web de BoD on peut télécharger des canevas word (.dotx) pour configurer la mise en page optimale pour l’impression. J’ai copié les différents chapitres générés par ChatGPT-4 dans Word et inséré les illustrations LetzAI dans les pages correspondantes. À la fin, j’ai profité d’un utilitaire de Word pour créer de manière automatique une table des matières du livre et j’ai exporté le document complet en format PDF. Dans le passé j’avais composé, pour mes autres livres BoD, le fichier PDF de couverture à l’aide de Photoshop. Les dimensions à respecter et le code barre à insérer au verso ont été communiqués par BoD. Pour le présent livre, j’ai profité de EasyCover, l’outil gratuit de création automatique de couvertures en-ligne de BoD, qui contient de nombreux spécimen. Les deux fichiers sont téléchargés sur la plateforme BoD et vérifiés par le système. Le cas échéant, des erreurs sont signalées et il faut alors recharger le fichier corrigé.

Pour commander l’impression du livre, on choisit d’abord une formule de publication. La moins chère s’appelle “BoD Fun” et permet de faire imprimer un livre sur papier à partir de 2,05 €. Je conseille de commencer avec cette formule, car elle permet de tenir rapidement un livre imprimé dans les mains pour procéder à une validation finale, avant de commander plus d’exemplaires pour la famille, pour les amis ou pour la vente privée, respectivement pour passer à la deuxième formule, au nom de “BoD Classique“. Cette formule est la plus appréciée, car pour un contrat d’un an au prix unique de 39 €, elle inclut une distribution auprès d’Amazon, auprès des grandes librairies et dans le magasin en ligne de BoD. On peut déterminer soi-même le prix de vente, avec une certaine marge à accorder à l’éditeur BoD et au vendeur, en fonction du montant défini. Le contrat inclut la création d’une version eBook et l’attribution d’un numéro ISBN. D’autres formules plus chères offrent une assistance professionnelle pour la rédaction et l’édition du livre. Dans tous les cas on peut choisir différents formats (de 12x19cm jusqu’à A4), différents types de papier (blanc, crème, photo), différents pelliculages (mat, brillant, relief), différentes couvertures (souple, dure collée, dure cousue, anneaux) et deux modes d’impression (standard, premium). Une calculette en ligne sur le site web de BoD permet de calculer le prix d’impression, en fonction des critères sélectionnés, du nombre de pages, du nombre de pages en couleur et du nombre de livres commandés.

Calculette du prix d’un livre sur le site web de BoD

Pour la première impression j’ai commandé le livre, qui comprend 142 pages, au format 17×17, en trois variantes, du moins cher (10,87 €) jusqu’au plus cher (22,20 €), aux fins d’évaluer la qualité d’impression et de la reliure. Je viens d’être informé en ce moment par UPS que le premier exemplaire sera livré aujourd’hui. Je suis impatient de l’avoir dans mes mains.

Bibliographie

J’ai acheté et vendu mes premiers NFTs sur le web

Dernière mise à jour : 1er décembre 2023

1. Introduction

Depuis plusieurs années on lit ou entend de plus en plus souvent un terme mystérieux: NFT (non-fungible token) ou JNF (jeton non fongible). Il s’agit d’une donnée cryptée qui représente un objet numérique auquel est rattachée une identité numérique, c.à.d. un propriétaire. Cette donnée est stockée et authentifiée grâce à un protocole de chaîne de blocs (blockchain), c.à.d. un registre numérique public et décentralisé. Un NFT est payé avec des unités de crypto-monnaie qui sont gérées, ensemble avec les NFTs, dans un portefeuille numérique.

Avant de présenter en détail ces différentes technologies, je vais les introduire moyennant deux cas concrets, l’achat et la vente d’une oeuvre d’art numérique sur Internet. Les NFTs ne sont pas limités au domaine de l’art, mais sont utilisés surtout dans différents secteurs professionnels. Comme une oeuvre d’art digitale est quelque chose de tangible, elle se prête bien pour expliquer le concept à l’homme de la rue qui sera confronté probablement de plus en plus souvent avec des NFTs, suite à l’explosion récente des générateurs d’art neuronaux basés sur l’intelligence artificielle (images, vidéos, littérature, musique, …).

2. The Happyness Amplified

NFT “The Happyness Amplified” de l’artiste Raphaël Laventure

L’image animée GIF ci-dessus est une oeuvre d’art numérique créée par l’artiste français Raphaël Laventure. L’oeuvre a été frappée le 17 mai 2022 par l’agence marketing luxembourgeoise The Dots, fondée en 2021 par Kamel Amroune. L’oeuvre est mis en vente sur la place de marché objkt.com au prix de 115 ꜩ (Tezos), ce qui correspond à environ 200 €. Elle fait partie d’une collection de 4 NFTs et porte le nom de The Happiness Amplified. En janvier 2022, lors de la présentation de l’événement Metavers Month, l’agence The Dots avait annoncé la création d’un NFT en collaboration avec l’artiste Raphaël Laventure. Quelques mois plus tard, The Dots a confirmé dans son service phare Techsense que le NFT était prêt.

La frappe NFT (minting) est le processus de conversion d’un fichier numérique en un objet de collection crypto. Après la frappe il est impossible de supprimer, d’éditer ou de modifier l’identité numérique ou le fichier afférent stocké sur la chaîne de blocs correspondante.

L’acheteur d’une NFT comme The Happiness Amplified peut la mettre dans un cadre numérique installé dans son salon ou l’afficher sur un grand écran attaché au mur de son salon. Tout comme chacun peut s’accrocher une copie, une affiche ou une impression d’une célèbre peinture dans son salon, il n’existe qu’un seul original dont l’authenticité est certifiée en général par le musée qui détient cette oeuvre. Dans le cas d’une NFT ce n’est pas différent. Un surfeur sur Internet ayant quelques notions techniques peut cloner ou copier l’objet numérique, mais il ne peut pas falsifier l’identité numérique contenue dans la chaîne de blocs qui authentifie l’origine et le propriétaire de l’objet.

Dans une première phase j’ai été tenté d’acquérir une édition de cette oeuvre pour démarrer mes expériences NFT, mais j’ai hésité ensuite pour engager une somme relativement élevée dans une aventure que je ne maîtrise pas encore et qui porte certains risques. Dans un article écrit pour Delano et traduit pour Paperjam, l’artiste luxembourgeois de renom Sumo a confessé qu’il a mis environ un an pour comprendre qu’un NFT n’est pas seulement un jpeg. Dans la suite il est devenu un grand fan des jetons non fongibles.

Un deuxième témoignage, celui de Jil Haberstig, consultant, artiste et fondatrice du Lux NFT Club, va dans le même sens. Dans un entretien publié sur le site web siliconluxembourg en janvier 2022, intitulé Selling NFTs Is Almost A Full-Time Job, Jil Haberstig a déclaré

It requires a lot of technical knowhow. It took me almost a year to have a sense of what I’m doing (laughs) and I still feel that every day. It’s evolving very fast and before you can enter the NFT market or get involved, first of all you have to understand the crypto market, otherwise you’re not able to sell or buy NFTs. If you’re not in the crypto market NFT is just a word.

J’ai donc compris que acheter et vendre ses premiers NFTs n’est pas l’affaire d’une journée et qu’il faut aller en douceur.

N.B. Le 2 novembre 2022 Meta a annoncé qu’elle va bientôt supporter la vente de NFTs à partir de Instagram, ce qui peut faciliter les démarches dans l’avenir. Meta avait démarré en mai 2022 un projet pilote afférent aux Etats-Unis avec quelque artistes sélectionnés.

3. Reunited NFT

Suite à quelques recherches sur Google, j’ai appris que Opensea est la place de marché NFT la plus connue et qu’elle couvre surtout le domaine de l’art. J’ai commencé à explorer cette plateforme et j’ai rapidement trouvé une collection au nom de Cheap NFTs for Sale.

Collection “Cheap NFTs for sale” sur la place de marché Opensea

Les artistes qui créent des oeuvres numériques pour cette collection affirment que leur objectif n’est pas de gagner de l’argent, mais de faciliter l’accès à ces nouvelles technologies à l’homme de la rue. C’est parfait, c’est ce qu’il me faut. Il faut dire que la qualité des images numériques de cette collection n’est pas fameuse. Comme mon souhait n’était pas d’acquérir un chef-d’oeuvre, mais de me familiariser avec la technique NFT, j’ai choisi un objet au nom de Reunited NFT au prix affiché de 0.004 ETH sur la chaîne de blocs Polygon. Ce prix correspondait à environ 6 €. Voilà cette image:

Oeuvre d’art numérique “United NFT”

4. Guide NFT pour les débutants

Pour progresser avec l’achat de mon NFT sélectionné, j’ai cherché des guides et tutoriels afférents sur le web moyennant Google Search. L’article Où et comment acheter un NFT ? Le guide ultime pour débutant, publié le 6 octobre 2022 sur la page web cryptonaute.fr, me paraissait sérieux. J’ai appris que la première étape consiste à acheter de la crypto-monnaie sur une plateforme reconnue et fiable. On me proposait de cliquer sur un bouton vert pour créer un compte sur Crypto.com, ce que j’ai fait.

J’étais étonné de voir qu’après plusieurs redirections je me suis retrouvé sur une page gate.io pour ouvrir ce compte (voir copies-écran ci-dessus). J’étais en outre intrigué au sujet des propositions de m’offrir un cadeau de bienvenu de 100 € lors de l’inscription et un bonus de 5.500 € lors de transactions réussies. Je me suis méfié de ne pas voir des prix ou des conditions générales sur cette page. Probablement c’est ca le monde des NFTs ? Avec une certaine prudence j’ai entré le soir du dimanche 9 octobre 2022 mon numéro mobile et les autres données requises sur la page web de création du compte. A la fin j’étais informé que le minimum d’achat de crypto-monnaie était de 250 €, ce qui m’a amené à interrompre le processus d’inscription. J’ai décidé de m’informer davantage sur le monde NFT avant de continuer.

Le lendemain tôt le matin, une dame m’appelait sur mon mobile pour m’offrir son support à changer ma vie. Elle avait vu que j’avais abandonné la soirée précédente le processus de création d’un compte sur crypto.com. Elle essayait par tous les moyens de me convaincre de compléter mon inscription et ses conseils se ont transformés rapidement dans un vrai harcèlement. J’étais obligé d’interrompre l’appel par la force. Décidément le monde des NFT est particulier !

5. Plateforme Coinbase

Après des recherches et investigations supplémentaires, j’étais persuadé que la société Coinbase, fondée en 2012, était un acteur fiable et j’ai décidé de lancer une deuxième tentative d’achat de crypto-monnaie auprès de ce marchand. Lors de la demande des coordonnées de ma carte de crédit, j’ai indiqué, avec la prudence voulue, les numéros et dates de ma carte Easy VISA prépayée de POST Luxembourg. Quelle était ma stupeur en lisant le message d’erreur que les cartes de crédit prépayées ne sont pas acceptées. Comme l’utilisation de ma carte de crédit standard sur des sites Internet, avec lesquels je n’ai pas de relations établies, me semblait trop risquée, j’ai opté pour une autre méthode de paiement proposée par Coinbase: un virement international SEPA. Sur BIL Online j’ai effectué un virement de 25€ sur une banque en Estonie, au profit d’une société domiciliée en Irlande, à l’attention de Coinbase . Le monde NFT est vraiment international ! Et c’était un succès. Trois jours plus tard j’étais le détenteur d’un compte Coinbase avec un dépôt de 25€. Les images ci-après documentent différentes étapes de mon processus de création de ce compte : téléchargement d’une copie de la carte d’identité, téléchargement d’un document récent de la banque avec mon nom et mon adresse postale, sauvegarde d’une photo selfie avec une notice “For Coinbase Trading 16.10.2022” dans la main, contrôle des données, réception d’un code de vérification par SMS, messages de confirmation, virement etc.

6. Portefeuille MetaMask

Pour convertir le dépôt sur Coinbase en crypto-monnaie il faut disposer d’un portefeuille numérique (wallet en anglais). Coinbase dispose de son propre portefeuille Coinbase Wallet, mais il est recommandé d’utiliser un portefeuille numérique non affilié à un marchand de crypto-monnaie. Dans la documentation sur les NFTs sur le web un nom d’un portefeuille indépendant est souvent référencé: MetaMask, avec comme logo une icône d’une tête de renard.

Portefeuille Metamask

Le portefeuille existe en deux formats: comme extension pour un navigateur (web-browser) ou comme app pour les tablettes et mobiles. Bien que le navigateur Safari de mon MacBook n’est pas supporté par MetaMask, j’ai opté pour démarrer avec l’option extension navigateur. De toute façon je préfère utiliser le navigateur Chrome sur MacBook, car j’avais remarqué que de nombreuses pages web, en relation avec les NFTs, ne sont pas affichées correctement dans Safari. L’installation de l’extension MetaMask dans Chrome a été effectuée avec succès, moyennant quelques clics. La première étape consistait à valider une phrase secrète de 12 mots. Si on ne dispose plus de cette phrase, il n’y a aucun moyen pour récupérer son portefeuille.Une phrase secrète est proposé par MetaMask. L’image ci-après montre la fenêtre afférente:

Activation d’une phrase secrète de 12 mots pour créer un portefeuille numérique

Pour confirmer il faut entrer les 12 mots dans le bon ordre dans la fenêtre qui suit:

Confirmation de la phrase secrète de 12 mots pour le portefeuille numérique MetaMask.

Il va de soi que la copie écran ci-dessus ne montre pas les vrais mots de mon portefeuille ! Après sauvegarde et confirmation de ma phrase de backup, le grand moment était venu pour convertir une partie de mon dépôt sur Coinbase en crypto-monnaie. J’ai commencé avec 10€. La conversion a pris un certain temps et Coinbase a retenu une commission de 0,99€.

Le solde de 0,00665662 ETH, la crypto-monnaie de Ethereum, devait être suffisant pour payer mon NFT sélectionné au prix 0,004 ETH. En plus, j’ai reçu une récompense de 5€.

7. Premières tentatives d’achat d’une NFT

Pour acheter le NFT choisi, je retournais sur le site web Opensea et j’ai ajouté l’objet d’art dans mon caddie virtuel. J’ai été redirigé vers mon portefeuille MetaMask, j’ai confirmé l’achat et après plusieurs heures j’ai été informé que l’achat avait échoué. J’ai pensé que j’avais probablement effectué une mauvaise manipulation et je me suis lancé dans une deuxième tentative. Comme le montant des ETH dans mon portefeuille avait toutefois sensiblement diminué et était même inférieur à 0.001 unités, j’ai d’abord dû convertir le reste de mes 25€, virés sur Coinbase, en crypto-monnaie. Pour le deuxième essai d’achat j’ai soigneusement vérifié chaque pas et j’ai lu en détail toutes les informations affichées dans la séquence des fenêtres qui s’ouvraient après chaque clic sur un bouton de confirmation. Hélas ma deuxième tentative, ainsi qu’une troisième, ont également échoué et à la fin je me suis retrouvé sans NFT et presque sans ETHs restants. Pour me consoler, je me suis dit que la dépense des 25€ constituait un investissement dans mon apprentissage. J’ai passé les jours qui suivaient avec la recherche et la lecture de contributions sur Internet au sujet de l’achat de NFTs. A la fin j’étais conscient que j’avais commis plusieurs erreurs :

  1. J’avais converti mes € en unités de crypto-monnaie ETH sur la chaîne de blocs Ethereum main au lieu de la chaîne Polygon. Il faut donc utiliser un pont (bridge) pour les transférer sur la chaîne dans laquelle le NFT sélectionné a été frappé.
  2. Je n’avais pas pris note que le la version actuelle de l’extension MetaMask ne comporte pas de support natif des NFTs, mais qu’il est recommandé d’utiliser l’application pour mobiles pour gérer les achats.
  3. J’avais sous-estimé les coûts des transactions en relation avec des chaînes de blocs. Pour chaque transaction il faut payer du gaz (ou du carburant; ce sont vraiment les termes techniques de ces opérations) pour les opérateurs qui gèrent d’une façon décentralisée les chaînes de blocs. Et même l’homme de la rue sait aujourd’hui que le gaz est cher ! En cas d’échec d’une transaction, les dépenses pour le gaz ne sont pas remboursées.

A coté des commissions encaissées par les marchands, mon dépôt de 25€ a donc surtout été utilisé pour brûler du gaz.

8. Première réussite d’acquisition d’une NFT

Pour progresser, j’ai d’abord téléchargé et installé l’application mobile MetaMask depuis l’AppStore d’Apple sur mon iPhone. Ensuite j’ai configuré et personnalisé cette app moyennant la saisie de ma phrase secrète à 12 mots. Comme je ne disposais plus de crédits, la prochaine étape consistait à recharger mon portefeuille. Lors de mes derniers recherches sur le web, j’avais appris qu’il était possible d’ajouter des fonds à partir de MetaTask, via le marchand Moonpay, avec une carte de crédit. Le minimum d’achat était de 30€, la commission de Moonpay était le triple (3,33€ pour 30€) de celle de Coinbase, mais en revanche ma carte de crédit prépayée Easy VISA a été acceptée.

Message de confirmation de paiement avec Moonpay

Après la réception d’un montant de 0.0223 ETH (Polygon), j’ai remis le NFT sélectionné dans mon caddy sur Opensea et ajusté le prix maximal à payer pour le gaz de la transaction. Après une dernière vérification de tous les éléments, jai confirmé l’achat. Quelques heures plus tard j’étais l’heureux propriétaire de l’oeuvre d’art numérique United NFT. La galerie d’images qui suit présente quelques copies écran du processus exécuté sur mon iPhone.

9. Création de mon premier NFT

Après ce succès d’achat d’un premier NFT, je me suis dit qu’il convient maintenant de vendre mon premier NFT. Mais avant de le vendre il faut le créer. J’étais d’avis qu’une simple image statique était trop banale et qu’il fallait présenter quelque chose qui bouge, par exemple une animation ou une vidéo. J’ai donc fouillé dans mes archives et j’ai trouvé une animation que j’avais réalisé il y a quelques années pour montrer une partie d’un jeu de moulin où une personne joue contre un ordinateur. J’ai développé et programmé ce tablier électronique d’un jeu de moulin (Elektronesch Millchen) en 1977.

Les 24 intersections du tablier contiennent chacune une photodiode et une LED. L’ordinateur joue avec des pions rouges et il signale par une LED clignotante où il souhaite poser son pion. Son adversaire humain pose un pion rouge sur la position indiquée et l’ordinateur acquitte la manoeuvre correcte en allumant la LED en permanence. Un pion posé par le joueur humain est reconnu par l’ordinateur via la photodiode et l’acquittement se fait également par l’allumage continue de la LED. Le clignotement de deux LEDs signale un changement de position d’un pion rouge voulue par l’ordinateur, tandis que le clignotement à côté d’un pion noir veut dire qu’il faut l’enlever, suite à un moulin fermé par l’ordinateur. Dans la présente animation le jeu se termine par un blocage de l’ordinateur et l’humain sort comme vainqueur. J’ai convertie l’animation en vidéo mp4 et je l’ai hébergée sur Youtube.

Certes cette animation n’est pas un chef-d’oeuvre artistique, mais elle se distingue par trois particularités. C’est d’abord un prédécesseur des systèmes actuels d’intelligence artificielle et un NFT afférent constituerait un témoignage historique. C’est également un objet numérique qui se prête pour former un élément unique parmi une collection de parties du jeu de moulin. Chaque partie serait basée sur une autre stratégie de jeu et chaque animation serait donc unique. Last not least c’est un projet artistique handmade. J’ai pris une photo du tablier après chaque changement de position d’un pion et j’ai retouché la couleur des LEDs dans Photoshop. Ensuite j’ai assemblé la centaine de photos dans une image animée GIF, avec une conversion finale en vidéo.

La création du NFT était facile et a été exécutée sans frais. J’ai téléchargé le fichier vidéo sur mon compte Opensea, j’ai spécifié la phrase The Winner is Black comme nom du NFT et j’ai définie comme prix de vente le même montant que celui de mon premier NFT acheté, c.à.d. 0.004 ETH (Polygon). La copie écran de ma page personnelle sur Opensea ci-après montre le résultat:

10. Vente de mon premier NFT

Pour forcer la vente (fake is in !) de mon NFT “The Winner is Black” j’ai invité mon ami virtuel Lutz Basel à faire l’achat. Pour ce faire il devait disposer de son propre portefeuille MetaMask. Comme on peut seulement installer un seul portefeuille comme extension d’un navigateur, ou comme application sur un mobile, Lutz a utilisé le navigateur Firefox, au lieu de Chrome, sur mon MacBook. Au lieu de mon iPhone il a pris mon mobile Android (Nokia 2.3) pour installer l’application MetaMask à partir du Google PlayStore.

En profitant de mon expérience concernant la configuration du portefeuille MetaMask, Lutz a vite réussi à confirmer une phrase backup de 12 mots pour initialiser son portefeuille. Je souhaitais transférer les frais d’achat de mon portefeuille sur celui de Lutz. C’était facile, au lieu de saisir le code d’identité du portfeuille de Lutz, composé d’une séquence de 42 caractères et chiffres, j’ai pu capter le code QR afférent avec la caméra de mon iPhone. Avec le gaz nécessaire, la transaction a été rapidement exécutée. Il restait à Lutz de chercher son objet d’art sur Opensea, de le mettre dans son caddy, de confirmer l’achat, sans oublier le gaz, et le NFT changait de propriétaire. Ma première vente d’un NFT était une réussite ! Comme d’habitude, je joins ci-après quelques copies écran pour illustrer le processus sur mon mobile Nokia.

11. Inspection de la chaîne de blocs

Pour m’assurer que l’achat et la vente de mes NFT sont correctement enregistrés, je souhaite inspecter la chaîne de blocs correspondante. L’outil pour ce faire s’appelle blockchain explorer. En principe chaque chaîne de blocs dispose de son propre explorateur, mais il y a quelques outils qui supportent plusieurs chaînes. Mes propres transactions pour l’achat et la vente d’un NFT ont été exécutées sur la chaîne de blocs Polygon et l’outil d’exploration afférente s’appelle Polygonscan. Pour trouver une transaction spécifique, on peut spécifier l’identité d’un portefeuille, le numéro d’un bloc, le hash de la transaction, etc, comme critère de recherche. Souvent on connaît seulement l’identité du portefeuille utilisé:

  • Marco Barnig, ID : 0xD8c59cb936Db3767b6d7079563D7BEa9a75720ce
  • Lutz Basel, ID: 0xbf785d93aF1d528d9A2601c256c1530F37cbA014

Je commence avec mon ami virtuel Lutz Basel qui a effectué 3 transactions: la première est liée à mon transfert de fonds, la deuxième constitue l’approbation de la réception de ces fonds et la troisième se réfère à l’achat de mon NFT. La copie écran qui suit montre les résultats de recherche avec l’ID du portefeuille de Lutz Basel.

Transactions effectuées par Lutz Basel

Les trois transactions sont relevées en bas de la page web. Si on clique sur le numéro du bloc d’une transaction, les détails de ce bloc sont affichés dans une nouvelle fenêtre. L’image qui suit montre un exemple, il s’agit du bloc No 34585013 affilié à l’achat du NFT.

Contenu du bloc No 3458013

On constate que le bloc en question contient 53 transactions internes et 11 transactions liées à un contrat interne. Un bloc rassemble plusieurs transactions lancées par différents usagers. Les images qui suivent montrent des extraits des listes détaillées de ces transactions qui sont affichées si on clique sur les liens inclus dans la ligne intitulée Transactions.

Avec le hashtag de la transaction on peut rechercher les données dans le bloc en question. Je l’ai marqué en jaune dans la liste des 53 transactions internes incluses dans le bloc No 3458013.

Pour comprendre le contenu des autres données enregistrées dans le bloc il faut être expert et les explications à ce sujet dépasseraient le cadre de la présente contribution. Je laisse le plaisir aux lecteurs avertis d’explorer les autres blocs, ainsi que les blocs associés à mon propre portefeuille. Ces blocs contiennent également toutes les transactions échouées lors de mes premiers essais.

Si vous éprouvez des problèmes de compréhension, vous devez vous rappeler les témoignages des deux artistes au début de mon article au sujet de la complexité de la technologie NFT et de la durée d’apprentissage d’une année. Ce rappel termine la première partie de la présente. Dans les prochains chapitres je vais ajouter quelques généralités sur les techniques en mettant le focus sur la situation au Luxembourg.

12. Les fondations des NFTs

Dans la première partie de cet article j’ai introduit les technologies qui constituent les fondations des NFTs. Dans la suite je vais compléter la description des éléments suivants:

  • crypto-monnaie (crypto currencies)
  • chaîne de blocs (blockchain)
  • jetons (tokens) et transactions (transactions)
  • portefeuilles (wallets)
  • blocs (blocks) et carburant (gas)
  • plateformes de marché NFT

12.1 Crypto-monnaie

Wikipedia fournit la définition suivante de la crypto-monnaie :

Une crypto-monnaie, dite aussi cryptoactif, cryptodevise, monnaie cryptographique ou encore cybermonnaie, est une monnaie numérique (actif numérique) émise de pair à pair, sans nécessité de banque centrale, utilisable au moyen d’un réseau informatique décentralisé. Elle utilise des technologies de cryptographie et associe l’utilisateur aux processus d’émission et de règlement des transactions.

Comme il n’y a pas de régulateur de la crypto-monnaie, on ne dispose pas de chiffres exactes sur ce marché. La société CoinMarketCap, fondée en 2013 par Brandon Chez, maintient le site web le plus référencé dans ce domaine. On estime qu’en 2022 plus de 20.000 monnaies différentes existent, mais dont la moitié n’est plus marchandé. La valeur totale du marché dépasse 10.000 milliards €.

Dans la première partie de l’article nous avons fait connaissance de quatre crypto-monnaies: Tezos, ETH (main), ETH (Polygon), MATIC. Le Bitcoin (BTC) était la première monnaie cryptographique, présentée dans un livre blanc en 2008, par une personne au pseudonyme de Satoshi Nakamoto. Le code source de l’implémentation de référence a été publié en 2009. Le Bitcoin est toujours la crypto-monnaie la plus connue. Parmi la multitude des monnaies il convient de citer les autres représentants populaires suivants : Tether (USDT), BNB, XRP, Cardano (ADA), Solana (SOL), Dogecoin (DOGE) et Polkadot (DOT).

La valeur d’une crypto-monnaie par rapport aux $ ou € peut varier d’une seconde à l’autre. Les images qui suivent montrent la valeur de mon portefeuille à une intervalle de 24 heures. L’ETH a perdu de 3,6% en valeur.

Les fluctuations de la valeur de l’ETH pendant une journée sont affichées ci-après :

Fluctuations de la valeur de l’ETH

Pour certains internautes le marchandage de crypto-monnaie est devenu une drogue. Certains gagnent gros, mais la majorité fait des pertes. Il faut être conscient que ceux qui gagnent dans tous les cas sont les marchands professionnels avec les commissions et les mineurs avec la vente du gaz.

On ne compte pas seulement des milliers de crypto-monnaies, mais également des milliers de plateformes pour acheter ou vendre des crypto-monnaies.

12.2 Chaînes de blocs (Blockchains)

Dans la première partie de la présente trois blockchains ont été présentées : Tezos, Ethereum et Polygon. Mais il y a des centaines, voire des milliers de chaînes différentes. On distingue quatre types:

  • blockchains publiques
  • blockchains privées
  • blockchains de consortium
  • blockchains hybrides

A coté des blockchains référencées ci-avant (Bitcoin, Ethereum,Tezos et Polygon), quelques autres plateformes de renom sont relevées ci-après :

Les blockchains sont normalisées par le comité technique 37 de l’ISO. L’Institut luxembourgeois de la normalisation, de l’accréditation, de la sécurité et qualité des produits et services (ILNAS), une administration publique sous l’autorité du ministre de l’Économie, a publié unn rapport national de normalisation technique dans le domaine de la blockchain.

Le Luxembourg est bien positionné dans le domaine de ces nouvelles technologies. Sur le site web luxembourg.public.lu on peut lire que le Luxembourg se veut pionnier européen dans le monde du blockchain.

Luxembourg Blockchain

La définition suivante du blockchain est fournie sur ce site :

Décentralisation, transparence et immutabilité sont les mots clé du blockchain. Au Luxembourg les piliers ont été construits pour définir la bonne stratégie de développement de ces chaînes logistiques. En route maintenant pour favoriser l’adoption à grande échelle et pour le bien général du pays.

Un blockchain est un enregistrement numérique des transactions. Son nom vient de sa structure, dans laquelle les enregistrements individuels, appelés blocs, sont reliés entre eux dans une liste unique, appelée chaîne. Aujourd’hui, les chaînes de blocs sont utilisées principalement dans le secteur financier, mais l’identification numérique, la preuve de la propriété foncière, la gestion de la chaîne logistique et même le vote ne sont qu’une fraction des applications potentielles qui seraient d’intérêt pour le secteur public aussi.

Son fonctionnement décentralisé permet en outre de résoudre des problèmes liés à des points d’échec unique en cas de sinistres ou d’attaques et porte ainsi le potentiel d’aider les acteurs publics et les entreprises à réduire la fraude et les erreurs ou à améliorer la transparence de leurs données et transactions.

L’année 2019 a été une année charnière pour les blockchains au Luxembourg. Le 1er mars 2019 un nouveau article a été ajouté à la loi du 1er août 2001 concernant la circulation de titres aux fins d’autoriser les blockchains pour tenir des comptes-titres. La même année, le ministère de la Digitalisation, ensemble avec le Syndicat intercommunal de gestion information (SIGI) et le Centre des technologies de l’information de l’État (CTIE) ont annoncé la création de la première blockchain du secteur public. La digitalisation intégrale des aides financières de l’État pour études supérieures a démarré le 1er août 2019 comme projet phare de la blockchain du secteur public. La Spuerkeess a joué dans ce contexte le rôle de banque-pilote. En décembre 2019 les acteurs suivants ont lancé une collaboration afin de renforcer le Luxembourg en tant que blockchain hub européen par excellence.

  • INFRACHAIN a.s.b.l.
  • LëtzBlock
  • LHoFT (Luxembourg House of Financial Technology)
  • LIST (Luxembourg Institut of Science and Technology)
  • SnT (Interdisciplinary Centre for Security, Reliability and Trust de l’Université du Luxembourg)
Luxembourg Blockchain Lab

Les cinq acteurs ont fondé le Luxembourg Blockchain Lab (LBL) pour créer un large écosystème du blockchain au Luxembourg. Le laboratoire a organisé une première semaine Blockchain (blockchainweeks) du 26 au 30 avril 2021 au Luxembourg. Une deuxième édition des blockchainweeks a eu lieu du 3 au 7 octobre 2022.

Infrachain est présidée par Fabrice Croiseaux, CEO de Intech, une entreprise du groupe POST. Le chef de projet est Tom Kettels. Lëtzblock est présidée par Biba Homsy et dirigée par Arnaud Wenger. Le Conseil d’Administration de LHoFT se compose de 18 personnalités du monde financier luxembourgeois et présidé par Yuriko Backes, ministre des finances. Le CEO est Nasir Zubairi. Le LIST est présidé par Eva Kremer et dirigé par Thomas Kallstenius. Le SnT est dirigé par Björn Ottersten. Les technologies des finances (FinTech) sont une des quatre priorités de recherche du SnT. Parmi les 15 groupes de recherche du SnT il convient de citer CryptoLux et FINATRAX dans ce contexte. Le LBL est dirigé par Emilie Allaert. Le LBL est un partenaire de l’initiative Digital Learning Block (DLB) et en charge de l’enseignement des blockchains. Les autres partenaires du DLB, créé par le Ministère de l’Education, sont Ecole 42, D-School et SECURITYMADEIN.LU (depuis le 17.10.2022 Luxembourg House of Cybersecurity : LHC).

Des formations sur les technologies blockchain sont également proposées par lifelong-learning.lu, Luxinnovation, PWC et Abilways.

12.3 Jetons (tokens) et transactions

L’unité de données stockée dans une chaine de blocs, qui est unique, est appelée jeton (token en anglais). On distingue les jetons fongibles et les jetons non-fongibles. Un jeton fongible appartient à une même catégorie et ne se distingue pas des autres jetons appartenant à cette catégorie. Par exemple, un bitcoin ne possède pas d’identité propre et ne peut pas être tracé. Un bitcoin vaut toujours un autre bitcoin et peut être remplacé par n’importe quel autre bitcoin. On dit qu’il est interchangeable, c.à.d. fongible. La majorité des crypto-monnaies, et toutes les monnaies réelles, sont fongibles.

Les unités de données stockées dans une chaine de blocs qui disposent d’une identité numérique sont appelés jetons non-fongibles (NFT : Non-Fungible Token). Ils ne peuvent pas s’échanger, même s’ils appartiennent à une même catégorie. L’identité numérique constitue un genre de certificat infalsifiable qui atteste de l’authenticité et de la propriété d’un objet virtuel. Nous avons déjà vu les exemples des objets numériques appartenant à la catégorie de l’art contemporain et les contrats des aides financières luxembourgeoises pour les études supérieures. Les domaines d’utilisation des NFT sont innombrables. Par exemple des vignerons utilisent les NFT moyennant des codes QR ou des puces NFC dans les bouchons pour lutter contre la contrefaçon des vins de renom. Au Luxembourg c’est surtout le marché financier qui applique la technologie NFT, mais la société italienne Guala Closures Group, qui produit des bouchons NFC, a installé en 2017 son cinquième centre de recherche dans le monde au Luxembourg. Grâce à une collaboration avec la société luxembourgeoise Compellio les clients peuvent créer leurs propres caves de vin virtuelles avec la technologie NFT.

Wine Developers avec bouchons NFC

Toute manipulation d’un jeton, fongible ou non-fongible, est documentée dans une transaction qui est enregistrée dans un bloc d’une blockchain spécifique.

12.4 Portefeuilles numériques

Pour conserver et gérer ses jetons il faut disposer d’un portefeuille numérique (eWallet). Nous avons déjà fait la connaissance des portefeuilles MetaMask et Coinbase Wallet. Mais il y a une multitude d’autres exemplaires pour tous les goûts. D’abord il faut distinguer les différents supports de portefeuilles numériques:

  • logiciel
  • matériel
  • papier

Les portefeuilles basés sur du matériel procurent la meilleure sécurité. Ceux en forme de logiciel sont les plus flexibles. On distingue des extensions pour navigateurs, des programmes pour ordinateurs ou des applications pour tablettes ou mobiles. On fait encore la différence entre portefeuilles chauds (hot wallets) qui sont toujours connectés à Internet et les portefeuilles froids (cold wallets) qui fonctionnent hors ligne. Les meilleurs combinent et les NFT et les crypto-monnaies et supportent plusieurs blockchains. Les plus simples sont spécialisés pour une seule tâche ou une catégorie NFT déterminée. Des critères de sélection sont bien sûr la sécurité, mais également la facilité de configuration et d’utilisation ainsi que la compatibilité. Les usagers qui veulent éviter tout risque de piratage peuvent revenir au bon vieux papier. Parmi les milliers de portefeuilles proposés sur Internet, quelques exemples populaires sont relevés ci-après:

12.5 Blocs et carburant

Le lecteur sait désormais que toute transaction de jetons est enregistrée dans un bloc qui fait partie d’une chaîne gérée dans un réseau blockchain d’une façon décentralisée. La création d’un nouveau bloc fait référence à une technique ancienne: le minage. Le réseau du type pair-à-pair sur Internet est constitué de serveurs qui fonctionnent grâce à un logiciel dédié. Dans le cas du Bitcoin ce logiciel est Bitcoin-Core. Chaque noeud du réseau dispose d’une copie de la blockchain en question.

Qui sont les gestionnaires de ces réseaux ? Ce sont des individuels, collectifs ou entreprises, appelés mineurs, qui exploitent un noeud de ce réseau. Chacun peut le faire à condition de disposer d’un ordinateur performant, car les calculs cryptographiques à exécuter demandent des puissances de calcul très importantes et des mémoires de taille. En contrepartie les mineurs sont rémunérés pour leurs efforts. Prenons l’exemple de mon transaction pour transférer 15€ à mon ami virtuel Lutz Basel. Le processus se déroule en plusieurs étapes:

  1. Je déclenche la transaction en poussant le bouton confirmation dans mon portefeuille.
  2. La transaction est diffusée dans le réseau par le logiciel du portefeuille MetaMask et placée dans un pool de transactions non confirmées.
  3. Les mineurs sont connectés à ce pool et essayent de rassembler plusieurs transactions du pool pour les intégrer dans un nouveau bloc candidat. Il est probable que mon transaction soit incluse dans des blocs candidats de différents mineurs.
  4. La validité de ma transaction est contrôlée par les mineurs en vérifiant si mon portefeuille dispose des fonds ou jetons suffisants et si toutes les obligations sont respectées.
  5. Les blocs candidats reçoivent une signature nommée preuve de travail en résolvant un problème mathématique très complexe, unique à chaque bloc de transactions. Cette étape est appelée processus de minage.
  6. Le mineur qui a calculé le premier la signature du nouveau bloc candidat diffuse ce blog et la signature à tous les autres noeuds du réseau.
  7. Les autres mineurs vérifient la légitimité de la signature. En cas de validité ils confirment que le bloc peut être ajouté à la chaîne. Ils doivent être tous d’accord, on appelle le processus algorithme de consensus.
  8. Le mineur dont le bloc a été validé reçoit une récompense fixe pour le bloc et une récompense variable (frais de transaction) pour chaque transaction incluse dans le bloc.
  9. Les autres mineurs qui ont inclus mon transaction dans leur bloc candidat doivent recommencer à zéro et la retirer de leur bloc candidat, de même que les autres transactions qui sont déjà intégrées dans le dernier bloc ajouté à la chaîne.

Le succès des mineurs est conditionné par plusieurs facteurs: la performance de leur infrastructure de calcul, la stratégie de minage employée, le trafic et le nombre de noeuds actifs sur le réseau et la chance. Certains mineurs accordent une priorité aux transactions compliquées comportant des frais de transaction importants pour obtenir une meilleure rémunération. D’autres se spécialisent sur des volumes élevés avec des transactions à faible coûts. Le protocole de minage règle la complexité du problème mathématique en fonction des besoins pour maintenir un temps moyen constant entre chaque nouveau bloc.

Dans le cas ou deux nouveaux blocs sont minés simultanément, le protocole prévoit de retenir le bloc le plus long et l’autre est écarté. Après avoir saisi le fonctionnement et la complexité du minage, on comprend mieux la notion de carburant ou de gaz pour rémunérer le travail des mineurs. Si une transaction échoue, par exemple parce que les jetons dans le portefeuille sont insuffisants, les frais de transaction sont encaissés par les mineurs. Si on spécifie un plafond trop bas pour le gaz, les mineurs ont peu d’intérêt pour traiter la transaction en question et elle risque de rester longtemps en attente ou d’atteindre un time-out.

Le minage classique basé sur la preuve de travail a des inconvénients, notamment en ce qui concerne la consommation électrique qui est très conséquente au niveau mondial et qui le classe comme mauvais élève en termes climatiques. Pour pallier à ce problèmes, d’autres méthodes de minage ont été développées:

  • le minage par tiers de confiance: c’est le modèle privilégié des blockchains privés, mais c’est une véritable trahison du modèle original décentralisé.
  • le minage par consensus: des noeuds maîtres décident sur le consensus d’une façon certaine et déterministe; le réseau est donc partiellement centralisé, même si le nombre de noeuds maîtres est élevé.
  • le minage par preuve d’enjeu: des mineurs sont désignés d’une façon pseudo-aléatoire en fonction de leur fortune détenue sur le blockchain pour décider sur le consensus.

Il y a de plus en plus de pays qui envisagent d’interdire le minage par preuve de travail pour des raisons écologiques. Dans le prochain chapitre nous allons nous intéresser pour les plateformes de marchandage, de marché et d’échange.

12.6 Plateformes de crypto-monnaies et de NFTs

Les plateformes de crypto-monnaies Crypto, Coinbase et Moonpay ont été introduites dans la première partie de la présente contribution, de même que les places de marché FNT objkt.com et Opensea.

Quelques autres plateformes de crypto-monnaies sont:

La liste ci-après présente quelques plateformes de marché NFT populaires:

Comme le marché des plateformes de crypto-monnaies et de jetons non-fongibles est très volatil, il importe de se renseigner sur la situation actuelle avant de s’engager dans une plateforme déterminée.

13. Conclusions

Après avoir exploré en détail le monde des NFTs, j’ai l’impression de me retrouver 25 ans en arrière au moment de la bulle Internet. Je crains qu’on se trouve au début d’une bulle NFT et qu’à moyen terme on va se heurter aux mêmes débâcles qu’à la fin des années 1990: endettements, faillites, consolidations, dépréciations, restructurations, démissions, poursuites judiciaires etc.

En tout cas il importe de se familiariser avec la technologie NFT avant de faire des investissements risqués.

Bibliographie

Les plagiats de l’Intelligence Artificielle (AI)

Mise à jour : 2 septembre 2022

Introduction

Une affaire de plagiat qui oppose un jeune artiste luxembourgois et une artiste renommée siné-américaine fait le tour des médias luxembourgeois et internationaux depuis plusieurs semaines. Le 19 septembre prochain, la justice luxembourgeoise entendra les avocats de chaque partie dans le litige qui les oppose. «Le moment sera jouissif», a fait savoir maître Gaston Vogel, l’avocat de l’artiste luxembourgeois.

Comme je suis fasciné par l’évolution fulgurante de l’intelligence artificielle (AI), basée sur des réseaux neuronaux appliqués à l’apprentissage profond des machines, j’ai exploré un modèle AI récent spectaculaire qui permet de créer des images et oeuvres d’art à partir d’une description en langage naturelle. Il s’agit du modèle DALL-E2 présenté en avril 2022 par la société commerciale OpenAI.

Dans l’édition du 14 juillet 2022 du magazine renommé IEEE Spectrum, l’éditrice Eliza Strickland a publié une contribution intitulée DALL-E 2’s Failures Are the Most Interesting Thing About It. Comme une image vaut mieux que qu’un long texte, je me permet d’illustrer les performances de ce modèle AI par deux oeuvres réalisées à la demande de l’IEEE.

L’image en haute résolution ci-dessous est le résultat de la requête soumise au modèle DALL-E2 avec la description “A Picasso-style painting of a parrot flipping pancakes“.

A Picasso-style painting of a parrot flipping pancakes
credit IEEE Spectrum July 2022

Le deuxième exemple avec la description “New Yorker-style cartoon of an unemployed panda realizing her job eating bamboo has been taken by a robot” est encore plus impressionnant.

New Yorker-style cartoon of an unemployed panda realizing her job eating bamboo has been taken by a robot credit IEEE Spectrum July 2022

Création et exploitation du modèle DALL-E2

Le modèle neuronal DALL-E2 a été entraîné avec environ 650 millions d’images, extraites d’Internet et étiquetées avec une description du contenu. Le modèle n’est pas public et jusqu’à présent seulement quelques chercheurs sélectionnés ont eu accès pour l’évaluer. Mais OpenAI vient d’annoncer le 20 juillet 2022 qu’un million d’usagers, qui s’était inscrit sur une liste d’attente, sera invité dans les prochaines semaines pour tester une version beta publique.

Chaque usager aura un crédit d’accueil gratuit de 50 points pour générer 50 images et chaque mois 15 points gratuits supplémentaires seront ajoutés. En outre des crédits de 115 points pour créer 115 images peuvent être achetés pour 15 dollars. Les images générées peuvent être utilisées à des fins commerciales.

OpenAI a installé certaines barrières pour empêcher la création de contenus violents, racistes ou pornographiques. En outre il n’est pas possible de générer des visages humains réalistes.

Les répercussions de l’utilisation de cette technologie à grande échelle sur les agences de communication et sur des professions d’art visuel seront significatives et vont également toucher l’industrie afférente au Grand-Duché de Luxembourg. Il est probable que l’utilisation de ces images synthétiques soit à l’origine d’autres affaires de plagiat qui vont se plaider devant les tribunaux au Luxembourg. L’appréciation d’un plagiat sera encore plus difficile, car il faut démontrer que des images spécifiques à attribuer à un auteur particulier ont été utilisées pendant l’entraînement du modèle et sont à l’origine d’un trait particulier de l’image générée par l’AI. Je parie que maître Gaston Vogel va vivre d’autres moments jouissifs.

Modèle Imagen de Google

Google a présenté le 23 mai 2022 un modèle similaire, appelé Imagen, dans une publication de recherche sur ArXiv. On peut voir des exemples sur le site web Imagen. Contrairement à OpenAI, Google ne s’est pas encore prononcé au sujet de la commercialisation de son modèle, mais prétend que les performances de son modèle sont supérieures à celui d’OpenAI.

Mes images réalisées avec DALL-E mini

Comme je ne fais pas encore partie des usagers beta invités par OpenAI, je me suis limité à tester le modèle DALL-E mini, développé par Boris Dayma. Publié d’abord sur la plateforme AI communautaire géniale HuggingFace, le modèle public DALL-E mini, devenu viral, vient d’être transféré sur un site propre www.craiyon.com. Ce modèle n’a pas la résolution ni la performance de son tuteur, mais les résultats permettent d’apprécier le pouvoir de disruption de cette nouvelle technologie AI. Tout comme l’original, DALL-E mini ne créé pas de visages réalistes pour éviter des abus.

Lors de la soumission d’une description dans la barre de titre de l’application Craiyon, 16 images en faible résolution sont générées et les 9 meilleurs résultats sont affichés. La galerie ci-après présente quatre requêtes associées au nom de l’artiste Jingna Zhang. À vous de juger s’il s’agit de plagiats.

Testeur beta

Le 15 août 2022 OpenAI m’a informé que ma candidature pour participer aux tests de DALL-E2 a été acceptée.

Je n’ai donc pas hésité à faire de suite les premiers essais. Le titre soumis pour la première image était “cartoon of an elephant and a giraffe riding a bicycle on the beach“. J’ai saisi le texte “a painting of the ark Noe in the style of Renoir” pour créer la deuxième image. Parmi les quatre images générées avec la résolution 1024 x 1024 pixels pour chaque description, j’ai choisi les oeuvres d’art suivants qui me plaisent le mieux.

Image générée par DALL-E2 de OpenAI avec la description “cartoon of an elephant and a giraffe riding a bicycle on the beach
Image générée par DALL-E2 de OpenAI avec la description “a painting of the ark Noe in the style of Renoir

Je me propose de créer dorénavant au moins une image par jour et de les partager sur les réseaux sociaux. Le 16 août 2022 j’ai publié les neufs premières créations sur mon compte Instagram.

Bibliographie

Second Life and OpenSim mobile clients

Two mobile grid clients are available for Second Life or OpenSim virtual worlds :

Pocket Metaverse (for iOS ; version 1.8.0 ; $4.99)
The following features are provided :

  • Instant Messaging & Chat
  • Friends List with Who’s Online
  • World Map and Teleporting
  • MiniMap with Who’s Nearby
  • Profiles, Groups, Search
  • Giving, Receiving, and Managing Inventory
  • Read Notecards and view Snapshots and Textures
  • Upload and Download from the Photo Album and Camera (iPhone only)
  • Payments
  • and more

The app does not show a 3D world view.

Mobile Grid Client (for Android ; version 1.19 ; monthly fee L$250)

The following features are provided :

  • messaging client/viewer with local chat
  • IM
  • group chat
  • people search
  • mini map
  • the ability to teleport
  • inventory support
  • and more

The app does not show a 3D world view.

Linden Lab, the company that created Second Life and grew that online community into one of the most colorful, varied online social networks in the world, recently launched some new products. One is Creatorverse, an app for Apple and Android phones and tablets that is designed around a very different type of collaborative, creative play from Second Life.

Aurora-Sim Metaverse

Aurora-Sim is the next generation of the OpenSimulator Project.

Aurora-Sim is a community based project consisting of individuals with a variety of technical and non-technical talents and has been developed with emphasis on security, speed and performance.

The architecture is designed to be as flexible as possible, so that third parties can create modules by pluging into Aurora-Sim’s modular design. By using the .NET framework and Mono, Aurora-Sim can be run on many platforms.

The Aurora-Sim software is still in alpha. There are 3 components :

  • Aurora Simulator (virtual world server ; version 5.0.1)
  • Aurora Web UI
  • Aurora Joomla interface

The source code is available at Github.

Hypergrid Business and Grid Press

Hypergrid Business is the magazine for enterprise users of virtual worlds.

Hypergrid Business is published by Trombly International, a Massachusetts-based communications firm with key staff in Boston, Belgium, Shanghai and Mumbai. Subsidiaries include the China Speakers Bureau. Hypergrid Business offers in-depth and up-to-date coverage of the OpenSim technology and community, which is currently the leading contender to be the hyperlinked 3D Web, with news, case studies, opinion, and feature stories. They cover also alternative open source platforms like Open Wonderland, and proprietary enterprise platforms like ProtoSphere.

The Editor in Chief and publisher of the Hypergrid Business Magazine is Maria Korolov. She has been a journalist for more than twenty years and has worked for the Chicago Tribune, Reuters, and Computerworld.

Another source for news and views from around the OpenSim is Grid Press, covering also the new Aurora-Sim metaverse. Grid Press says to be dedicated to bringing you factual news, reliable information and honest opinions. It promotes the free and open exchange of ideas and opinions in a fashion that is respectful of all persons. Grid Press operates on a not-for-profit basis, though it is not a registered non-profit. Grid Press is supported and hosted by Zetamax, an OpenSim hosting company, claiming to offer a truely managed OpenSim solution.

Microdata vocabularies

Microdata is an extension to HTML5, also known as HTML5 with Microdata, that allows adding some additional structure (semantic meaning) to HTML documents. These machine-readable properties can be processed by software searching for specific types of information. Some search engines, Google in particular, already support microdata in HTML5 and use it to improve search engine results.

I am specifically interested in the following Microdata schemas :

Art Galleries :

Creative Works :

Historical landmarks :

Historical people :

Rental :

HTML microdata

One of the most adavanced technologies for the semantic web is HTML microdata. HTML Microdata is a W3C Working Draft (last version : 29 March 2012).

Most HTML tags tell the browser how to display the information included in a tag. For example <h1>Blackberry</h1> tells the browser to display the text string Blackberry in a heading 1 format. However, the HTML tag doesn’t give any information about what that text string means. Blackberry could refer to a mobile device or to a fruit and this makes it difficult for search engines to intelligently display relevant content to a user.

Microdata vocabularies provide the semantics, or meaning of an item. Web developers can design a custom vocabulary or use vocabularies available on the web. Microdata vocabularies are provided by schema.org.

Microdata introduces five simple global attributes (available for any element to use) which give context for machines about your data :

  • itemscope – creates the Item and indicates that descendants of this element contain information about it (boolean attribute)
  • itemtype – a valid URL of a vocabulary that describes the item and its properties context
  • itemid – indicates a unique identifier of the item
  • itemprop – indicates that its containing tag holds the value of the specified item property (strings, urls, images, …)
  • itemref – properties that are not descendants of the element with the itemscope attribute can be associated with the item using this attribute

Google uses semantic web technologies to create rich snippets (detailed information intended to help users with specific queries) in web search results. Googles suggest to use microdata as a markup format. Actually Google supports rich snippets for the following content types: Reviews, People, Products, Businesses and organizations, Recipes, Events and Music.

Google provides a Rich Snippet Testing Tool to check that their search engines can correctly parse the structured data markup and display it in search results. A Microdata schema creator is provided by Raven.

The next list provide links to more informations about microdata, followed by a list of links to specific vocabularies :

Europeana : think culture

Europeana Logo

Europeana was launched in 2008, with the goal of making Europe’s cultural and scientific heritage accessible to the public. The project is funded by the European Commission. It is based in the National Library of the Netherlands, the Koninklijke Bibliotheek. Over 180 heritage and knowledge organisations and IT experts across Europe support Europeana regarding technical and usability issues. Europeana builds on the experience of The European Library, which is a service of the Conference of European National Librarians.

The Europeana website provides efficient tools for searching, FAQ’s, Help’s, a ThoughtLab, a Blog, Newsletters and a personal space My Europeana to save your favourite items and searches, and to add tags. The content is available in most eurpean languages.

An associated project to Europeana is the Public Domain Calculator.

Pleo – PM 2 Firmware Update

Today, I upgraded my Pleo’s from firmware Life OS 1.1 to the new firmware PM2 ( Personality Module 2.0.) PM 2 is all-new “personality software” from Innvo Labs that evolves Pleo to a new level of interaction. With PM 2 the Pleo is more active. He has more room to grow and learn. He knows new tricks and sounds. And all of the updates from Life OS 1.1 are included too.

The PM2 firmware includes 34 active scripts, 12 new motions, 72 improved motion commands and the following new or modified tricks :

  • Play Dead
  • Stand up and talk to me
  • Watch Dog
  • Conversation
  • Wave
  • Red object tracking