Synthèse de la parole

La synthèse de la parole est la seule technologie qui a fasciné les humains depuis l’antiquité jusqu’à nos jours. En débutant avec des têtes parlantes, la synthèse vocale s’est d’abord basée sur des constructions mécaniques. En passant par l’électromécanique et l’électricité, la technologie a évolué vers des systèmes électroniques, puis informatiques.

Spectrogrammes

Les spectrogrammes sont des diagrammes représentant le spectre d’un phénomène périodique, associant à chaque fréquence une intensité ou une puissance. L’échelle des fréquences et celle des intensités ou puissances peuvent être linéaires ou logarithmiques. Pour transformer des données discrètes du domaine temporel dans le domaine fréquentiel, on utilise la transformation de Fourier rapide (FFT).

Les spectrogrammes permettent une représentation visuelle de la parole. On voit quasiment la parole. Inversément, on peut également convertir une image intégrée dans un spectrogramme en sons, mais les paroles générées ainsi ne sont généralement pas compréhensibles.

Anciennes photos numérisées

Fin 2016, Google présentait son application PhotoScan pour smartphone et tablette, permettant de numériser en un temps record toutes ses anciennes photos. Cette application intelligente ne nécessite que peu de travail, les algorithmes de Google se chargent de gommer automatiquement les défauts des photos argentiques et de redonner des couleurs vives pour disposer d’une version numérique et propre des clichés, sans aucun reflet.

Rovio

Rovio est un robot mobile sans fil (WiFi) à trois roues, avec caméra, microphone et haut-parleur intégrés, qui peut être télécommandé à partir de l’Internet pour surveiller sa maison. Il a été lancé en 2008 par la société canadienne Wowwee, localisée à HongKong. Rovio a suscité un grand intérêt auprès de la communauté robotique qui a programmé de nombreux outils pour cet engin.