Le moteur de recherche Google Dataset Search sort de la version bêta

Google dataset search, la version finale

Le 23 janvier dernier, Google a annoncé la sortie de la version finale de son moteur de recherche d’ensemble de données, baptisé Google Dataset Search. Lancé en septembre 2018, celui-ci s’est doté de nouveaux outils permettant de mieux filtrer les recherches et d’accéder à près de 25 millions d’ensembles de données. Plus de détails à ce sujet avec EPSI.

Google Dataset Search : un outil pour faciliter l’accès aux grands groupes de données

Par la création de Google Dataset Search, Google espère consolider et mettre en ligne de grands ensembles de données sur une plateforme unique tout en les gardant librement accessibles. A travers ce dispositif, toutes les institutions (universités, gouvernements, laboratoires, etc.) pourront partager leurs bases de données en ajoutant des balises de métadonnées open-source à leurs pages web afin de les faire indexer par Dataset Search.  Pour l’instant, la firme de la Sillicon Valley n’a pas encore voulu donner de chiffres précis sur l’utilisation de son nouveau joyau, mais elle a déclaré que des centaines d’utilisateurs l’ont déjà essayé depuis son lancement et que leurs réactions ont été généralement positives. Dans une interview avec le célèbre magazine de haute technologie The Verge, Natasha Noy, une chercheuse de Google AI qui a contribué à la création de Google Dataset Search, a expliqué que « la plupart des dépôts de données ont été très réactifs », avant d’ajouter que « le lancement du moteur signifie que les anciennes institutions scientifiques prennent désormais plus au sérieux la publication des métadonnées ».

Quelles sont les nouvelles fonctionnalités que cette version finale propose ?

Sur cette version officielle de Google Dataset Search, il est désormais possible de filtrer la recherche d’ensembles de données par type (tableaux, images, texte, etc.), par liberté d’utilisation et par zones géographiques couvertes. La solution dispose également d’une version mobile, et offre des descriptions plus détaillées de ceux-ci. Selon Google, près de 25 millions de bases de données sont actuellement répertoriées sur son nouveau moteur de recherche. Celles-ci couvrent des sujets variés tels que la biologie, l’agriculture ou les géosciences, tandis que les requêtes les plus fréquentes concernent l’éducation, la météo, le cancer, la criminalité, le football et les chiens.

Ne souhaitant pas commenter les futurs plans de Google concernant cette nouvelle tendance de stockage de données, Mme Noy a déclaré que son équipe réfléchit à l’intégration de nouvelles fonctionnalités et à l’élargissement du dépôt de données disponibles, mais en premier lieu, il est important de comprendre comment les ensembles de données sont cités et réutilisés, et d’aider les utilisateurs à les explorer lorsqu’ils ne savent pas exactement ce qu’ils recherchent.

La disponibilité d’une quantité titanesque de données portant sur divers thèmes, sur une seule et même plateforme ne peut qu’être bénéfique pour les futurs cadres informatiques dont les connaissances doivent être continuellement mises à jour. Pour affiner leurs connaissances, nous conseillons à ces derniers les formations proposées par EPSI.

Publié le 26.02.2020 - Actus France
Candidature Inscrivez-vous en ligne Documentation Pour tout connaître de l'EPSI Contact Posez-nous vos questions !