8 janvier 2014-
Par : Shirish Netke et M.R. Rangaswami
"La course n'est pas toujours pour les rapides ni la bataille pour les forts, mais c'est ainsi qu'il faut parier" est attribué à Damon Runyon, qui a écrit sur Broadway dans les années 1940. Certains investisseurs s'en inspirent pour prédire les gagnants et les perdants. Nonobstant le conseil sur le Broadway de l'après-dépression, nous avons créé une liste d'acteurs du Big Data sur la base d'un ensemble simpliste de critères résumés en cinq mots :
1. L'histoire
2. L'écosystème
3. La perspicacité
4. Interprofessionnel
5. Influence
La valeur commerciale était une exigence fondamentale. Nous avons également choisi de ne pas prendre en compte les "MISO" (Microsoft, IBM, SAP, Oracle) et les grands acteurs équivalents tels que Cisco, HP et EMC parce qu'ils gèrent des entreprises à multiples facettes. Le palmarès Sand Hill 50 représente un ensemble unique d'acteurs de toutes formes, tailles et couleurs qui se sont démarqués des autres. Les voici par ordre alphabétique.
1) Actian - Solutions de gestion des données orientées vers l'entreprise pour traiter, analyser et prendre des mesures automatisées dans le cadre des activités de l'entreprise. Ils ont intégré avec succès des technologies telles que Ingres, Pervasive et ParAccell. Les 10 000 clients payants constituent un atout majeur.
2) Actifio - Acteur de l'infrastructure avec une proposition de valeur de ROI convaincante pour minimiser les copies de données - un facteur d'hygiène clé dans la gestion des Big Data dans l'entreprise. L'entreprise a le vent en poupe et pourrait être introduite en bourse en 2014.
3) Aérospike - Analyse des données en temps réel avec une approche hybride. Ils promettent la vitesse d'une base de données In-Memory avec la persistance des disques rotatifs. Ils sont classés comme le seul "visionnaire" dans le Magic Quadrant de Gartner pour les systèmes de gestion de bases de données opérationnelles.
4) Alpine Data Labs - Plate-forme d'analyse prédictive utilisant Hadoop. Elle s'adresse aux clients qui ont fait le premier pas avec Hadoop et qui souhaitent déployer des solutions analytiques avancées. L'entreprise compte plusieurs clients du secteur bancaire, dont Barclays. Ses autres clients sont Sony, Nike et Kaiser Permanente.
5) Alteryx - L'alternative SAS pour les applications d'analyse statistique telles que l'analyse marketing avec une visualisation avancée basée sur le langage de programmation statistique R. Leur succès dépendra de leur capacité à tenir leur promesse de convivialité auprès des utilisateurs traditionnels. Parmi ses clients figurent Paychex, Kroger, Michaels et Equifax.
6) Appfluent - Elle répond à un besoin pratique immédiat de gérer la coexistence de Hadoop dans l'environnement informatique traditionnel. Ils promettent de réduire le gaspillage en analysant l'activité de l'entreprise et l'utilisation des données dans les entrepôts de données traditionnels et en identifiant les données qui peuvent être transférées vers Hadoop. Les clients comprennent Pfizer et Union Bank of California.
7) Attivio - Analyse avancée du contenu à travers les silos de données avec quelques nouveautés telles que la corrélation intelligente. Il s'agit d'une variante d'Endeca (acquis par Oracle) avec une proposition de valeur technique avec un ADN centré sur l'ingénierie de Mathworks et Ab Initio.
8) Ayasdi - Apprentissage automatique avec visualisation haut de gamme d'ensembles de données complexes sur la base d'une analyse topologique des données. Partenariat avec le Texas Medical Center et le Lawrence Livermore National Laboratory. Parmi les clients figurent UCSF, Merck et GE.
9) C3global - Analyse opérationnelle prédictive pour les secteurs de la fabrication, de l'énergie et des services publics, basée en Écosse, avec une proposition de valeur de retour sur investissement mesurable. Chevron, National Grid (Royaume-Uni) et SA Water (Australie) comptent parmi ses clients.
10) ClearStory - Analyse et visualisation de données à grande vitesse à l'aide de la technologie de base de données In-Memory, etApache Spark système de regroupement. L'entreprise a été créée par les concepteurs de Google Analytics et de Google Adwords. Les clients sont la société Dannon, Kantar Media et DataSift (voir ci-dessous).
11) Cloudera - Leader du marché qui a fait figure de pionnier en 2009 avec la plateforme Hadoop et des fondateurs issus de Google, Yahoo, Facebook et Oracle. Elle a su tirer parti de son statut de pionnier pour devenir un membre influent de l'écosystème du Big Data.
12) DataKind - L'histoire exceptionnelle d'un organisme à but non lucratif de scientifiques des données au service du changement social. Ils apportent des compétences haut de gamme aux communautés et aux organisations sociales privées de leurs droits et s'attaquent à des problèmes complexes tels que les catastrophes naturelles et les crimes en utilisant l'analyse de données.
13) Datameer - Apporte les technologies Big Data aux utilisateurs professionnels habitués à utiliser des feuilles de calcul pour analyser et présenter des données dans le cadre de solutions BI traditionnelles. La liste de ses clients comprend Sears, Workday et Visa.
14) DataSift - Principal agrégateur et revendeur de données pour Twitter et d'autres sources de médias sociaux. Basé au Royaume-Uni. Acteur majeur dans l'écosystème de données émergent autour de Twitter. Parmi ses principaux clients figurent Dell, Yum Brands et CBS interactive.
15) DataStax - Acteur de l'écosystème et vendeur commercial de Casandra, Apache Hadoop et Apache Solr prêts pour l'entreprise. Adoption rapide au cours des deux dernières années, avec 300 clients, dont Adobe, eBay, Thomson Reuters et Netflix, ainsi que 20 des 100 entreprises les plus importantes du classement Fortune.
16) Elasticsearch - Alternative à Solr pour la recherche ouverte, combinant recherche et analyse, avec plus de deux millions de téléchargements et une large adoption par les entreprises. L'entreprise fournit une assistance, des conseils et des formations de niveau entreprise. Ses clients, tels que McGraw Hill, Klout et FourSquare, sont des exemples de réussite.
17) Gnip - Acteur de l'écosystème pour l'agrégation de données provenant de sources de médias sociaux telles que Twitter, Klout, Tumblr et WordPress. La société compte parmi ses clients IBM, Adobe, Pivotal, Salesforce et 95 % des entreprises du classement Fortune 500.
18) GoodData - Solution permettant d'intégrer des données provenant de sources standard telles que Salesforce et de créer des visualisations et des tableaux de bord. Leur base de 20 000 clients comprend Target, Time Warner Cable et GitHub.
19) Guavus - Solution analytique axée sur les entreprises de télécommunication et les fournisseurs de réseaux, qui disposent tous deux d'importants volumes de données. Parmi ses clients figurent des leaders de l'industrie dans ces domaines.
20) Hadapt - Une plateforme analytique qui intègre nativement SQL avec Apache Hadoop pour faciliter l'interrogation des grands ensembles de données par les utilisateurs grand public. Les cas d'utilisation cités par l'entreprise concernent les domaines de la publicité, de la sécurité et de la découverte électronique.
21) Hazelcast - Grille de données In-Memory open source avec plus de 10 000 déploiements. L'entreprise s'attaque à un problème clé de gestion des données dans le domaine de l'analyse en répartissant les données dans une grille. Leurs exemples de clients se situent dans les domaines du commerce financier et des jeux massivement multijoueurs. Elle vise également les cas d'utilisation qui nécessitent une capacité "en rafale".
22) Hortonworks - Leader commercial de la plateforme Hadoop, avec un grand nombre d'auteurs de codes pour Hadoop et des partenariats étendus dans l'écosystème Big Data. Parmi ses clients figurent Cardinal Health, Western Digital, eBay et Samsung.
23) Jaspersoft - Suite BI open source comptant 14 000 clients commerciaux et un grand nombre de partenaires. Parmi ses clients figurent Alcatel-Lucent, McKesson et Puma.
24) Kaggle - Organise des concours d'analyse prédictive à l'intention de la communauté des scientifiques des données. Des problèmes concrets ont été résolus dans les domaines des services financiers, des soins de santé, de l'énergie et de la vente au détail. Résultats fournis à GE, Allstate, NASA, TESCO et Merck.
25) Karmasphère - Espace de travail analytique collaboratif qui met la science des données à la portée des analystes commerciaux en utilisant SQL. Parmi ses clients figurent Playfish et XGraph.
26) Kontagent - Solution d'analyse mobile pour les développeurs d'applications, les spécialistes du marketing et les producteurs, avec 250 millions d'utilisateurs actifs mensuels. Elle a annoncé le 11 décembre qu'elle fusionnait avec PlayHaven. Parmi ses clients figurent Electronic Arts, eHarmony, Kaiser Permanente et Turner Broadcasting.
27) LucidWorks - Solution de recherche, de découverte et d'analyse basée sur Apache Lucene/Solr. Parmi ses clients figurent Sears, ADP et Raytheon.
28) MapR - Plate-forme Big Data basée sur Hadoop et NoSQL Leurs clients viennent des services financiers, de la vente au détail, des médias, de la santé et de la fabrication, ainsi que des entreprises du Fortune 100. Ils comptent parmi leurs clients CIsco, Xactly, Cision et Rubicon.
29) MarkLogic - Technologie de base de données NoSQL d'entreprise agnostique aux schémas, associée à des services de recherche puissants et à des applications flexibles. La société compte parmi ses clients Warner Brothers, Dow Jones, Citigroup et Boeing.
30) MongoDB - Solution de base de données NoSQL avec quatre millions de téléchargements et 600 clients. Elle compte parmi ses clients MetLife, Forbes, Cisco et FourSquare.
31) Mu Sigma - Consultants fournissant des services d'analyse à 75 entreprises du Fortune 500 dans les domaines du marketing, du risque et de la gestion de la chaîne d'approvisionnement. Ils disposent d'études de cas de sociétés pharmaceutiques, de vente au détail, d'assurance et de banque.
32) Neo Technology - Services basés sur la base de données graphique Neo4j qui dispose d'un large écosystème de partenaires et de déploiements étendus dans le monde entier. Neo4j a été mis en œuvre chez Adobe, Cisco et Deutsche Telekom.
33) NGData - Solutions d'intelligence économique basées sur des données structurées et non structurées, en particulier dans les secteurs de la banque, de la vente au détail et de l'édition. Leur moteur de recommandation est basé sur l'analyse en temps réel du comportement des clients et s'intègre avec des acteurs de l'écosystème tels que SAP, SAS et Tableau.
34) Opera Solutions - Leader en matière de conseil dans le domaine de l'analyse prédictive à l'aide de Big Data. Ils sont partenaires d'Oracle, de QlikView et de SAP. Ils ont des exemples de réussite dans un grand nombre de secteurs verticaux, y compris le crédit à la consommation, l'assurance et les soins de santé.
35) Oxdata - Logiciel d'analyse statistique fonctionnant avec HDFS destiné aux non-statisticiens. L'équipe fondatrice est issue de DataStax et Platfora.
36) Palantir - Solutions analytiques axées sur des problèmes à grande échelle pour le secteur public, tels que la fraude à l'assurance-maladie, l'impact environnemental des marées noires et la violence des gangs. L'entreprise aurait levé $605 millions d'euros de financement au cours des cinq dernières années.
37) ParStream - Base de données en colonnes pour l'analyse des données en temps réel (Big Data). Ils ont des cas d'utilisation dans les domaines de la recherche et de la sélection, de l'analyse commerciale et des systèmes de réponse automatique. Ils ont des clients dans les télécommunications, les services financiers et le marketing.
38) Pentaho - Suite d'applications pour l'accès aux données, la visualisation, l'intégration, l'analyse et l'exploration, avec 10 000 déploiements dans 185 pays. Parmi ses principaux clients figurent Lufthanhsa, Telefonica et Marketo.
39) Pivot - Plateforme de Big Data et d'applications cloud créée en 2013 à partir d'EMC/VMware/Greenplum, avec des produits technologiques et une base de clients bien établis.
40) Platfora - Plate-forme d'analyse de Big Data pour l'analyse des données commerciales à travers les événements, les actions, les comportements et le temps. Parmi ses clients figurent Disney, Shopify et Edmunds.com.
41) PROS - Solutions d'analyse prédictive pour la gestion des ventes, des prix et des revenus. Les domaines ciblés sont les voyages, la distribution, la fabrication et les services. Elle compte parmi ses clients Lufthansa, Cummins et Navistar.
42) Qubole - Plate-forme de données en nuage qui masque la complexité de la gestion de l'infrastructure. Fondée par d'anciens membres de l'équipe du service de données de Facebook. Elle compte parmi ses clients Pinterest, Nextdoor et Quora.
43) Revolution Analytics - Soutien commercial aux utilisateurs du langage "R" pour l'analyse statistique. Parmi ses nombreux clients figurent American Express, Kraft Foods et Merck.
44) Combustible pour fusée - Plate-forme d'achat de médias pour les annonceurs utilisant des outils d'analyse avancés. La base de clients diversifiée comprend BMW, Comcast et Pizza Hut.
45) SISense - Plate-forme d'analyse axée sur l'évolutivité et la visualisation utilisant une base de données en colonnes et les technologies HTML5. Parmi ses clients figurent Caterpillar, Philips et Target.
46) Skytree - Analyse avancée utilisant l'apprentissage automatique et mise en œuvre au moyen d'une architecture distribuée. Parmi ses clients figurent l'Institut SETI, eHarmony et l'Association américaine de golf.
47) Splunk - Logiciel d'intelligence opérationnelle permettant d'analyser les données des machines, utilisé par 6 400 entreprises dans le monde, dont la moitié des entreprises du classement Fortune 100. Les études de cas incluent Tesco.com, Survey Monkey et NPR.
48) Logiciel Tableau - Solution de visualisation pour l'analyse avec des partenariats étendus dans l'écosystème BI. Ils ont des clients dans un large éventail d'industries.
49) La Ruche - Co-créateur et accélérateur pour les entreprises qui utilisent de grands volumes de données pour prendre des décisions intelligentes. The Hive accueille régulièrement des événements mettant en scène des leaders d'opinion dans l'application des technologies Big Data.
50) WibiData - Plate-forme qui permet aux entreprises de créer un site doté d'une capacité d'analyse avancée et qui s'adapte en fonction de l'interaction avec l'utilisateur. Parmi ses clients figurent Wikipedia, Rich Relevance, Opower et Atlassian.
Shirish Netke est président de Amberoon Inc.un fournisseur de solutions de perspectives commerciales basées sur les données. Il a dirigé des entreprises dans le domaine des logiciels, des services et des loisirs électroniques. Il a été l'un des premiers évangélistes de Java lors de son lancement par Sun Microsystems et a été cité en tant que leader d'opinion dans le New York Times, Investors Business Daily, Chief Executive Magazine et Asia Times. Suivez-le sur Twitter @CarpeDatumRx.
M.R. Rangaswami est cofondateur et PDG du Groupe Sand Hill et éditeur de SandHill.com.