Vous avez certai­ne­ment entendu le terme « Big Data » des dizaines de fois, sans savoir quelle réalité il recou­vrait préci­sé­ment. Véri­table fourre-tout, ce terme vague est trop souvent utilisé comme un simple buzz­word marke­ting. Si les béné­fices du trai­te­ment de grands volumes de données ne sont pas prêts d’être remis en cause, le terme Big Data est amené à dispa­raître au profit des tech­no­lo­gies qu’il englobe selon Nico­las Dussi­net, respon­sable Big Data chez Talan. Il livre son analyse à l’Usine Digi­tale dans l’ar­ticle « Le big data est mort, vive le big data » que Data­nergy reprend pour vous aujourd’­hui.


« Auprès du grand public, la confu­sion a été savam­ment entre­te­nue entre le big data et d’autres termes qui lui sont asso­ciés comme la data science, le machine lear­ning ou l’intel­li­gence arti­fi­cielle. Des éditeurs et des four­nis­seurs de services ont parti­cipé à cette confu­sion en appo­sant la mention big data sur toutes leurs offres sans avoir forcé­ment changé quoi que ce soit à ces dernières. Juste pour surfer sur la vague.

Une vague qui s’est brisée en 2015 selon Gart­ner. C’est cette année-là que le cabi­net d’études a fait dispa­raître le terme de big data de sa célèbre courbe d’adop­tion des tech­no­lo­gies (Hype Circle) pour le rempla­cer par plusieurs vocables plus précis. Par exemple, dans les offres d’em­plois, on ne retrouve plus que rare­ment le libellé « ingé­nieur déve­lop­pe­ment big data ». Elles affichent plutôt le langage recher­ché – Scala, R, Python… – ou l’ex­per­tise sur une plate­forme donnée – Hadoop, Elas­tic­search, Cassan­dra…

Une brève histoire du big data

Pour comprendre ce glis­se­ment séman­tique, il faut faire un bref rappel histo­rique. On peut dater l’acte de nais­sance du big data en 2001 avec l’in­ven­tion de la règle des 3V (Volume, Vitesse et Variété). A l’époque, l’ex­pres­sion tradui­sait une rupture dans le volume des données à trai­ter. (…)

[Après les années 90] (…) on a assisté à une explo­sion du volume de données avec l’es­sor de l’e-commerce, des réseaux sociaux, des termi­naux mobiles et, plus récem­ment, de l’inter­net des objets (IoT). Face à cette avalanche de data, les modèles tech­niques exis­tants ont montré leurs limites. La base de données parfaite n’existe plus. En fonc­tion du souhait de privi­lé­gier la volu­mé­trie, la vitesse ou les capa­ci­tés de requê­tage, on choi­sira une solu­tion plutôt qu’une autre une ou bien une combi­nai­son d’ou­tils : la « poly­glot persis­tence » est deve­nue la nouvelle norme.

Pour leurs propres besoins, les GAFAM ont dû créer des outils pour stocker et trai­ter à la volée des données à la fois nombreuses et versa­tiles, leur struc­tu­ra­tion chan­geant avec le temps. Face­book est ainsi à l’ori­gine de Cassan­dra avant de se tour­ner vers HBase (NoSQL), Google de BigTable et GFS (ancêtre d’HDFS) et plus récem­ment de TensorF­low (machine lear­ning). Les géants du web ont ensuite versé ces projets en open source, exter­na­li­sant en quelque sorte leur R&D. Car à leurs yeux, l’or ce sont les données elles-mêmes, pas les tech­no­lo­gies. (…)

Du big data à tous les étages

Les prin­cipes appor­tés par le big data – la règle des 3V à laquelle on peut rajou­ter la notion de scala­bi­lité – se retrouvent aujourd’­hui dans de nombreuses briques du système d’in­for­ma­tion. La busi­ness intel­li­gence (BI), le CRM, la gestion du backend d’une appli­ca­tion mobile ou d’un site web intègrent de plus en plus des tech­no­lo­gies dites de big data.


A lire égale­ment : Ne confon­dez pas Data & Big-Data


Et ce n’est qu’un début. La géné­ra­tion de données ne peut qu’aug­men­ter de façon expo­nen­tielle, ne serait-ce que par la multi­pli­ca­tion des objets connec­tés. Le big data a déjà révo­lu­tionné beau­coup de métiers. Dans la banque-finance, il permet de produire de nouveaux indi­ca­teurs (par exemple dans les prévi­sions bour­sières) et de lutter contre la fraude. Dans l’indus­trie, le big data asso­cié à l’IoT assure la main­te­nance prédic­tive des équi­pe­ments. Dans le trans­port, il permet d’op­ti­mi­ser la consom­ma­tion d’éner­gie. Dans le marke­ting et la rela­tion client, il permet d’avoir une connais­sance plus pous­sée et une rela­tion person­na­li­sée. Dans le monde de la santé, il avance la promesse d’une méde­cine indi­vi­dua­li­sée.

Ce n’est donc en vérité pas la fin du big data… il n’en est même qu’à ses débuts. »

> Retrou­vez l’ar­ticle dans son inté­gra­lité


Pour aller plus loin :






Agathe Monteil

Publié par Agathe Monteil