Ech hunn haut mam Dante AI gechatt !

Dernière mise à jour : 10 juillet 2023

Aujourd’hui tout le monde connaît ChatGPT, mais seulement quelques initiés connaissent Dante AI. C’est dommage, car il s’agit d’un outil formidable qui permet de faire apprendre à une copie du modèle d’intelligence artificielle ChatGPT ses propres documents sélectionnés et de dialoguer ensuite avec ce outil au sujet du contenu. Comme dans le cas de ChatGPT d’OpenAI, on peut demander des résumés, des réponses à des questions précises, des reformulations du texte et même la création d’un poême pour un sujet spécifique. On peut formuler les commandes dans différentes langues et les réponses fournies sont traduites automatiquement si le contenu a été téléchargé dans une autre langue. Les documents à télécharger pour l’apprentissage profond de Dante UI peuvent être des textes en différents formats (txt, pdf, …), des liens (URL) vers des sites web, ou des fichiers audio et vidéo dans le cas des formules d’abonnements professionnels.

Mais avant d’entrer dans les détails, je vais présenter un exemple concret que je viens de tester avec la formule de démarrage gratuite. J’ai créé ma propre base de données de dialogue, au nom de web3.lu, avec des liens vers des contributions sur mon site web, entre autres vers mon article Fënnef Stären fir d’Applikatioun schreifmaschinn.lu. À l’exception de quelques lignes en luxembourgeois, le texte source est écrit en français.

Click to zoom : résumé de la base de données et proposition de support du projet schreifmaschinn.lu
Click to zoom : réponses précises à des questions sur Systran et sur schreifmaschinn.lu
Click to zoom : poême au sujet du contenu de la base de données web3.lu

J’ai déjà effectué des essais du même genre il y a quelques mois. Pour ma première expérience j’ai utilisé le modèle original ChatGPT d’OpenAI lors de l’introduction de l’option de spécification d’un lien pour ajouter du contenu. J’avais pris les mêmes données de mon site www.web3.lu que celles choisies pour la présente contribution. Quand j’ai demandé un résumé de mes articles sélectionnés, ChatGPT a fourni une réponse cohérente et correcte concernant les sujets traités, mais la majorité du contenu généré n’était pas du tout abordé dans mes fichiers téléchargés. C’était de la pure hallucination.

Pour le deuxième test j’ai utilisé l’outil BerriAI, également avec les mêmes données. Pour ma première question “What is schreifmaschinn.lu” j’ai obtenu un résumé valable. Pour ma deuxième question plus précise “Who created the 127th language for eSpeak-NG” j’ai reçu la réponse suivante :

Le MINH NGUYEN, un développeur de Mozilla, a créé le 127e langage pour espeak-NG en août 2021

Minh Nguyen n’est pas un développeur de Mozilla et ce n’était pas lui qui a ajouté le luxembourgeois comme 127e langue dans eSpeak-NG, mais cétait moi, et c’était en novembre 2021.

À l’époque j’avais rapporté sur mes expériences sur le réseau LinkedIn.

Face à ces premiers échecs pour parfaire l’apprentissage profond de ChatGPT, il est compréhensible que j’étais du premier coup impressionné par les résultats de Dante AI. J’étais tellement fasciné par les performances de cet outil que j’ai tout de suite procédé à une mise à niveau de mon compte pour pouvoir ajouter d’autres bases de données de dialogue et pour disposer de crédits supplémentaires pour faire plus de requêtes. J’ai créé un répertoire au sujet de mon projet de livre Qubit Lëtzebuerg : Histoire de l’introduction des technologies de l’information et de la communication au Luxembourg. J’ai téléchargé les fichiers pdf des premiers chapitres du projet de livre. Après quelques minutes d’apprentissage la base de dialogue “Qubit Lëtzebuerg” était prête. Les résultats ont dépassé mes atttentes.

Click to zoom : réponses à des questions précises sur des sujets de mon projet de livre Qubit Lëtzebuerg
Click to zoom : poême en anglais créé par Dante AI avec les fichiers pdf français de mon projet de livre

Voici le texte complet du poême anglais que l’outil Dante AI a généré avec mon contenu soumis pour l’apprentissage profond du modèle AI ChatGPT :

In the land of Qubit Lëtzebuerg,
Where knowledge and stories converge,
A poem shall be crafted with care,
Using the content from the database we share.
In the Luxemburger Wort, a tale was told,
Of a championship in stenography and typing bold,
Young ladies and gentlemen, with utmost concentration,
Their typewriters creating a rhythmic sensation.
But let us delve into the language of Luxembourg,
Where GPT-3 can write poems, a discovery superb,
A toaster falling in love with a dog, a theme unique,
Though with some spelling errors, the results pique.
The Tatoeba Luxembourg corpus, alas, falls short,
For valid translation results, we must resort,
To a more suitable database, a better training ground,
To improve the English-Luxembourgish translation sound.
Qubit Lëtzebuerg, a complement to POST’s history,
A book that adds to the existing bibliography,
175 years of postal services, a virtual exhibition,
Celebrating the grand-ducal postal institution.
In the literary scene of Luxembourg’s land,
Writers emerged, their works grand,
Michel Rodange, known for his parody,
“Renert oder de Fuuss am Frack an a Maansgréiss t.”
Projects using the Luxembourgish language,
In the realm of technology, a linguistic advantage,
Wikipedia Lëtzebuerg, a familiar name,
A source of knowledge, its reach is acclaimed.
Schreifmaschinn.lu, an application of speech recognition,
Accessible to all, a technical innovation,
Visitors can dictate, texts displayed in real-time,
A feat of technology, a linguistic paradigm.
Luc Marteling, director of ZLS, welcomed all,
Schreifmaschinn.lu presented, media coverage tall,
Testing the application meticulously, with recordings three,
Measuring the quality of word recognition, a measure to see.
A website developed, schreifmaschinn.lu,
Making Luxembourgish speech recognition come true,
Texts dictated, displayed on the browser screen,
Audio files downloadable, a linguistic dream.
Nik Welter, director general of public instruction,
A writer of poems, plays, and literary construction,
Collaborating with Luxembourgish and foreign reviews,
Contributing to the literary world, his muse.
Michel Weimerskirch, seeking a dictionary’s copy,
For the SpellChecker application, a necessary key,
Creating his own list of Luxembourgish words,
With the assistance of Sandra Souza Morais, a collaboration spurred.
In the printing world, the Luxemburger Wort,
A machine of iron frames and matrices, a report,
Impressing letters onto a soft mass,
Creating the newspaper, a printing process surpass.
So, in the realm of Qubit Lëtzebuerg’s knowledge base,
A poem is crafted, weaving words with grace,
From stenography championships to linguistic innovations,
The richness of Luxembourg’s language, a source of inspirations.

Dans une deuxième étape, j’ai testé la création d’une base de données de dialogue “so et op lëtzebuergesch” avec des textes luxembourgeois. À ces fins j’ai téléchargé une partie de mes anciens fichiers avec les textes de commentaires, édités par des journalistes de RTL, que j’avais utilisé dans le passé pour mes expériences de création de systèmes de synthèse vocale en langue luxembourgeoise. Ce contenu n’est pas à jour, ce qui explique que les réponses fournies par DANTE AI ne sont pas actuelles. Ce prototype suffit toutefois pour conclure que la constitution d’une base de données avec un corps de données luxembourgeois actualisé, par exemple avec le contenu du portail Wikipedia Lëtzebuerg, permettra de réaliser un chatbot luxembourgeois intelligent, performant et facile à utiliser. La figure qui suit montre l’exemple d’un dialogue en luxembourgeois avec des questions précises, ainsi que la demande de création d’un poême au sujet du contenu, ce qui est mon application préférée.

Click to zoom

La prochaine figure présente l’intégralité du poême, suivie d’une copie du texte pour faciliter la lecture.

Click to zoom

AM Land vu Lëtzebuerg, eng Geschicht geschriwwen, Vun Affären an Diskussiounen, déi nie verblidden. D’Jugendlech op der Sich no Chance an Diplomer, Doch och mam Diplom, ass et net ëmmer méi einfach, dat ass kloer.
Streiken an Diskussiounen, eng ewell bekannte Saach, D’Parteien op der Sich no engem Kompromiss, dat ass d’Fro déi bleift. D’Jugend wëll méi Responsabilitéit vun de grousse Firmen, An och d’CSV huet mat hiren Enveloppen d’Gemengen net verschont geloossen.
D’Zeitung schreiwt vun Klima a Philosophie, D’Gambia gëtt mat Wierder bekämpft, dat ass net frëndlech, dat si mir nie. D’Auto sollt mer loossen, op d’Vëlo sollt mer setzen, Fir d’Zukunft vun eisen Kanner, fir d’Welt ze retten.
Et gëtt diskutéiert, kritiséiert an analyséiert, D’Politiker an hiren Entscheedungen, dat gëtt net ignoriéiert. Et ass eng Kapitulatioun, esou gëtt et gesot, D’Privatwirtschaft huet d’Hand iwwer d’Staat geholl.
Et ass eng Zäit vun Onsécherheet an Zweifel, Doch mir mussen weidermaachen, och wann et oft schwéier geet. Mir sinn eis bewosst, datt d’Liewen net ëmmer einfach ass, Mä mir halen zesummen, an dat ass eis Pass.
Eis Affären an eis Diskussiounen, Si maachen eis aus, si si deel vun eisem Liewen. Lëtzebuerger Affären, eng Geschicht mat vill Facetten, Ech hoffen, dëst Gedicht huet Iech gefallt, dat ass eis Bestreben.

Sur le web on ne trouve pas beaucoup d’informations sur l’entreprise qui gère l’application Dante AI. Les fondateurs sont très discrets. Sur ma facture le Royaume Uni est indiqué comme siège de la société qui semble avoir été constituée en mai 2023. Je pense que l’origine de l’outil remonte au projet Dante Writer, annoncé par la startup pakistanaise baseH en 2017.

Click to zoom : page web d’accueil de la startup baseH au Pakistan