Chaque jour, chaque minute, des millions d’images, de vidéos et d’autres types d’informations sont transférés sur Internet via des sites Web tels que Facebook, YouTube, etc. Vous êtes-vous déjà demandé où ces informations sont stockées afin de pouvoir être utilisées efficacement année après année? Une source croissante d’informations, comme les médias sociaux, met au défi les principales technologies de l’information. Dernière sensation, des géants des médias comme Google, Facebook et Yahoo ont décidé de choisir Hadoop pour leurs problèmes de gestion des données.
Pour toute entreprise qui souhaite tirer parti de ses données et analyses, il est recommandé d’installer le framework Hadoop. logiciel open source qui permet de traiter de grandes données dans des grappes d’ordinateurs.
Histoire de Hadoop
Les chercheurs en informatique Doug Reed Cutting et Mike Cafarella ont créé Hadoop en 2005. Doug a nommé Hadoop son fils après un éléphant en peluche et est maintenant dirigé par l’Apache Software Foundation. En 2006, Dough a rejoint Yahoo! qui possédait une équipe pour développer Hadoop. En 2008, d’autres sociétés utilisaient Hadoop Yahoo! Comme Facebook, New York Times et Last.fm.
Architecture Hadoop comprend Hadoop Common, Hadoop Distributed File System (HDFS) et le moteur MapReduce. MapReduce et HDFS sont conçus pour gérer toutes les défaillances de nœuds. L’architecture divise les données en plusieurs morceaux entre de nombreux serveurs afin que les programmeurs puissent facilement les analyser et les visualiser.
Demande Hadoop
Le marché Hadoop devrait passer de 1,5 milliard de dollars en 2012 à environ 16,1 milliards de dollars d’ici 2020, selon un rapport d’Allied Market Research. Les bénéfices devraient provenir de sociétés commerciales Hadoop telles que Amazon Web Services, Cloudera, Hortonworks, etc.
La raison du succès de cette plate-forme est sa faible adoption, qui aide les entreprises à adopter plus facilement cette technologie. Il est également apte à gérer automatiquement les défaillances de nœuds et les réplications de données et fait tout le travail acharné.
De toute évidence, le domaine de la gestion des données s’est étendu des logiciels et des réseaux à la vente au détail, aux hôpitaux, au gouvernement, etc. Cela crée une énorme demande de plates-formes de stockage de données évolutives et rentables telles que Hadoop. Il n’est donc pas surprenant que la compétence de Hadoop soit mieux souhaitée maintenant. L’avenir du stockage de données est infini car il est très peu probable que les entreprises cessent de stocker des données ou trouvent une alternative pour le faire rapidement.
La formation aux rudiments de Hadoop ira certainement loin et vaut la peine à long terme, car les entreprises sont disposées à offrir des salaires compétitifs aux candidats possédant les compétences souhaitées. La banque basée sur cette exigence est certainement bénéfique.
[amazon bestseller= »data storage » items= »3″ ]