Les collections

L'apprentissage automatique aide les scientifiques citoyens

L'apprentissage automatique aide les scientifiques citoyens

L'apprentissage automatique pourrait aider à mener à bien les tâches de recherche généralement confiées aux scientifiques citoyens. Une nouvelle étude montre comment enseigner à un ordinateur des compétences de reconnaissance d'images spécifiques peut être utilisé dans des projets qui nécessitent la classification de grandes quantités de données d'image.

VOIR AUSSI: GOOGLE FLIGHTS UTILISE UNE MACHINE APPRENANT À PRÉVOIR LES RETARDS DE VOL AVANT LES LIGNES AÉRIENNES

Pendant des années, les scientifiques ont profité de bénévoles qui les aident à trier des ensembles de données massifs qui sont trop volumineux pour les petites équipes de recherche. Auparavant, ce travail devait être effectué par des humains parce que la technologie permettant à une machine de le faire n'existait pas.

Des chercheurs se sont associés à des écologistes

Mais tout cela est sur le point de changer. Pour tester l'idée d'apprentissage automatique, les chercheurs se sont associés à des écologistes qui étudient la faune avec des pièges photographiques. Ces «pièges» sont des caméras cachées qui sont déclenchées par des capteurs de mouvement et infrarouges qui fournissent des images que les écologistes peuvent utiliser dans leurs recherches spécifiques.

Cependant, toutes les images résultantes doivent être examinées et classées afin qu'elles puissent fournir des données utiles pour l'analyse. Souvent, cette tâche est confiée à des volontaires formés qui peuvent terminer la tâche dans les délais impartis. Mais la nouvelle recherche remplace les volontaires par des ordinateurs.

Les scientifiques citoyens seront toujours précieux

"Dans le passé, les chercheurs ont demandé aux scientifiques citoyens de les aider à traiter et à classer les images dans un délai raisonnable", a déclaré l'auteur principal de l'étude, Marco Willi, récent diplômé du programme de maîtrise en science des données de l'Université du Minnesota et chercheur dans le École universitaire de physique et d'astronomie.

«Aujourd'hui, certains de ces récents projets de pièges photographiques ont collecté des millions d'images. Même avec l'aide de citoyens scientifiques, cela pourrait prendre des années pour classer toutes les images. Cette nouvelle étude est une preuve de concept que les techniques d'apprentissage automatique peuvent aider de manière significative réduire le temps de classement. "

Pour tester leur théorie selon laquelle les techniques d'apprentissage automatique pourraient être utiles dans ces cas, les scientifiques ont rassemblé trois ensembles de données d'images d'Afrique - Snapshot Serengeti, Camera catalog et Elephant Expedition - et un ensemble de données de Snapshot Wisconsin avec des images collectées en Amérique du Nord.

L'ordinateur commence à apprendre avec les contours et les couleurs

Chaque ensemble de données contenait entre neuf et cinquante-cinq espèces. Les ensembles de données variaient également dans la façon dont chaque espèce était photographiée, le placement de la caméra, la configuration de la caméra et la couverture des espèces. L'ordinateur a ensuite appris à classer les images en leur montrant les images d'un ensemble de données déjà classé par les humains. Par exemple, la machine verrait des images complètes et partielles d'un phacochère. L'ordinateur commencerait alors à reconnaître les contours et les couleurs des phacochères dans les images avant de pouvoir les classer correctement.

L'ordinateur a également appris à identifier les photographies sans la présence d'animaux, ce qui se produit lorsque le vent déclenche la caméra. Etre capable d’éliminer rapidement ces photographies «vides» peut considérablement accélérer l’effort global de classification.

Les projets de classification se sont considérablement accélérés

«Nos techniques d'apprentissage automatique permettent aux chercheurs en écologie d'accélérer le processus de classification des images et d'ouvrir la voie à des projets de science citoyenne encore plus importants à l'avenir», a déclaré Willi. "Au lieu de devoir classer chaque image par plusieurs volontaires, un ou deux volontaires pourraient confirmer la classification de l'ordinateur."

Alors que ce test de la capacité des techniques d'apprentissage automatique dans la classification d'images était axé sur des images d'animaux provenant de pièges photographiques, les chercheurs affirment que les mêmes idées pourraient être appliquées à d'autres domaines scientifiques qui engagent des scientifiques citoyens comme l'espace et la biologie.

«Les données dans un large éventail de domaines scientifiques augmentent beaucoup plus rapidement que le nombre de bénévoles du projet de science citoyenne», a déclaré Lucy Fortson, co-auteur de l'étude, professeur de physique et d'astronomie à l'Université du Minnesota et cofondatrice de Zooniverse, la plus grande science citoyenne. plateforme en ligne qui a hébergé les projets de l'étude.

"Bien qu'il y ait toujours un besoin d'efforts humains dans ces projets, combiner ces efforts avec l'aide de techniques Big Data peut aider les chercheurs à traiter plus de données encore plus rapidement et permet aux volontaires de se concentrer sur les classifications les plus difficiles et les plus rares."


Voir la vidéo: Intelligence artificielle par apprentissage automatique Francis Bach (Décembre 2021).