Plus la quantité de données numériques augmente, plus le coût financier et horaire de leur traitement devient onéreux. Autrefois, avant d’utiliser une information, l’entreprise prenait le temps d’identifier sa nature, de la classer, de la stocker dans un Data Warehouse… Avec les grands ensembles de données numériques qui sont générés quotidiennement, ce processus est devenu chronophage, voire irréalisable.
C’est pourquoi nous assistons à l’émergence d’une nouvelle tendance : les lacs de données. Il s’agit tout simplement d’une plateforme Cloud où sont stockées les informations de l’entreprise sous leur forme brute (non structurée). Elles ne subissent aucun traitement préalable pour les catégoriser ou les traduire. En 2020, la valeur du marché des Data Lake (lac de données) était de 3,74 milliards de dollars. En 2026, elle devrait atteindre 17,60 milliards de dollars, soit une croissance annuelle de 29,9 %.