Regardez la photo ci-dessous et essayez de déterminer avec précision où elle a été prise – vous avez 20 secondes et le fichier n’inclut aucune donnée GPS (la réponse est à la fin de l’article). A défaut d’un élément facilement reconnaissable -comme la Tour Eiffel, par exemple-, avouez que la tâche est ardue.
Eh bien pas pour PlaNet, le projet de reconnaissance de géolocalisation d’image de Google dévoilé par Technology Review. Sans être encore vraiment fiable, ce programme de recherche est déjà plus performant que les humains. Et il apprend vite.
Dirigé par un spécialiste des programmes informatiques dédiés à la vision, Tobias Weyand, le programme PlaNet est un logiciel de deep-learning, c’est à dire qu’il ne se contente pas d’exécuter une tâche, il apprend au fur et à mesure et s’améliore au fil du temps.
Pour faire apprendre des choses à PlaNet, il a fallu lui donner des images à étudier. Oh, une paille : la base de données d’images géo-localisées dévolue à cette tâche comptait pas moins de 126 millions de clichés. L’équipe de Mr Weyand a divisé cette base de données en un premier segment 91 millions de photos pour l’apprentissage, le reste ayant été utilisé pour la confrontation de ses résultats d’analyse.
Les équipes de Google ont découpé la terre en 26 000 zones dont la taille varie selon la densité des prises de vue – les zones urbaines étant plus petites – et PlaNet a commencé à travailler. Et il s’est confronté à 2,3 millions d’images géo-marquées de chez Flickr. Et le résultat est plutôt prometteur : la précision de placement de cliché à l’échelle des continents de PlaNet est déjà de 48% – essayez de faire la différence entre la terre rouge d’une route du Burkina Faso de celle du bush australien !
L’étape suivante était celle de la confrontation avec des humains, 10 voyageurs triés sur le volet.
Et en dépit de son jeune âge, le programme a gagné 28 des 50 manches au jeu GeoGuess contre les humains, tout en s’avérant plus précis : quand les humains ont une précision moyenne de géolocalisation de 2.320 km, PlaNet fait deux fois mieux avec seulement 1131 km. Vous pouvez vous aussi jouer au jeu du « C’est où ça ? » en vous rendant sur la page du projet geoguessr.com.
S’il ne fonctionnait que sur un super calculateur, PlaNet ne serait qu’un programme de recherche comme un autre. Mais selon son concepteur, le logiciel n’occupe que 377 Mo de mémoire vive et pourrait donc tout à fait fonctionner sur un smartphone !
S’il ne donne pas plus de précision quant à la nécessité d’accéder ou non en permanence à une base de donnée ou sur la puissance processeur requise, il semble envisageable votre smartphone devienne, dans les années qui viennent, à la fois plus malin et plus pertinent que vous dans l’analyse des images. Ce qui est aussi excitant… qu’effrayant.
Oh, j’allais oublier : la photo du début de l’article a été prise au col du Sengi-La, dans l’état du Ladakh, région himalayenne du nord de l’Inde. Pas sûr que PlaNet soit encore au point pour ces régions…
Introduction : Maintenant, fini le temps où vous deviez vous connecter chez Adobe, installer les…
Un casino en ligne est un établissement de jeu accessible uniquement via internet. Ce nouveau…
Si au lancement d'un logiciel issu d'un dmg, votre Mac affiche une fenêtre indiquant que…
Nous venons de mettre en ligne un nouveau tutoriel pour les versions 2024 (accessible gratuitement)…
Voici la toute nouvelle procédure concernant la récupération et l'installation d'Adobe 2023 ET 2024 pour Mac…
Vous rêvez de pouvoir télécharger toute la musique que vous écoutez en streaming et ce…