Le projet PlaNet de Google est un cerveau virtuel qui identifie le lieu de prise de vue d’une photo sans avoir besoin de données GPS.
Regardez la photo ci-dessous et essayez de déterminer avec précision où elle a été prise – vous avez 20 secondes et le fichier n’inclut aucune donnée GPS (la réponse est à la fin de l’article). A défaut d’un élément facilement reconnaissable -comme la Tour Eiffel, par exemple-, avouez que la tâche est ardue.
Eh bien pas pour PlaNet, le projet de reconnaissance de géolocalisation d’image de Google dévoilé par Technology Review. Sans être encore vraiment fiable, ce programme de recherche est déjà plus performant que les humains. Et il apprend vite.
Apprendre à lire les photos
Dirigé par un spécialiste des programmes informatiques dédiés à la vision, Tobias Weyand, le programme PlaNet est un logiciel de deep-learning, c’est à dire qu’il ne se contente pas d’exécuter une tâche, il apprend au fur et à mesure et s’améliore au fil du temps.
Pour faire apprendre des choses à PlaNet, il a fallu lui donner des images à étudier. Oh, une paille : la base de données d’images géo-localisées dévolue à cette tâche comptait pas moins de 126 millions de clichés. L’équipe de Mr Weyand a divisé cette base de données en un premier segment 91 millions de photos pour l’apprentissage, le reste ayant été utilisé pour la confrontation de ses résultats d’analyse.
Presque 50% de réussite au niveau du continent
Les équipes de Google ont découpé la terre en 26 000 zones dont la taille varie selon la densité des prises de vue – les zones urbaines étant plus petites – et PlaNet a commencé à travailler. Et il s’est confronté à 2,3 millions d’images géo-marquées de chez Flickr. Et le résultat est plutôt prometteur : la précision de placement de cliché à l’échelle des continents de PlaNet est déjà de 48% – essayez de faire la différence entre la terre rouge d’une route du Burkina Faso de celle du bush australien !
Tout jeune et déjà meilleur que nous
L’étape suivante était celle de la confrontation avec des humains, 10 voyageurs triés sur le volet.
Et en dépit de son jeune âge, le programme a gagné 28 des 50 manches au jeu GeoGuess contre les humains, tout en s’avérant plus précis : quand les humains ont une précision moyenne de géolocalisation de 2.320 km, PlaNet fait deux fois mieux avec seulement 1131 km. Vous pouvez vous aussi jouer au jeu du « C’est où ça ? » en vous rendant sur la page du projet geoguessr.com.
Bientôt sur smartphone ?
S’il ne fonctionnait que sur un super calculateur, PlaNet ne serait qu’un programme de recherche comme un autre. Mais selon son concepteur, le logiciel n’occupe que 377 Mo de mémoire vive et pourrait donc tout à fait fonctionner sur un smartphone !
S’il ne donne pas plus de précision quant à la nécessité d’accéder ou non en permanence à une base de donnée ou sur la puissance processeur requise, il semble envisageable votre smartphone devienne, dans les années qui viennent, à la fois plus malin et plus pertinent que vous dans l’analyse des images. Ce qui est aussi excitant… qu’effrayant.
Oh, j’allais oublier : la photo du début de l’article a été prise au col du Sengi-La, dans l’état du Ladakh, région himalayenne du nord de l’Inde. Pas sûr que PlaNet soit encore au point pour ces régions…