Nous travaillons tous avec des données. Quelles que soient leur origine, leur format ou leur signification, elles représentent le monde qui nous entoure. Du tableur du service comptable au dernier SMS reçu, les données prennent aujourd’hui de nombreux aspects. Mais peut-on comprendre une donnée seule ? Sans appellation, sans description ou sans contexte, il nous serait bien difficile de saisir le sens des données que nous utilisons chaque jour. Pour les comprendre, nous avons besoin d’autres données. C’est ce qu’on appelle les métadonnées. À quoi servent-elles ? Quelles sont les différences avec des données classiques ?


Que sont les métadonnées ?

Les métadonnées sont l’ensemble des données que nous utilisons pour décrire et comprendre d’autres données. Comme les données, on en trouve sous toutes les formes. L’identité du créateur, la date de mise à jour ou encore les noms des contributeurs sont par exemple des informations qui nous servent à qualifier une donnée. Et il en existe beaucoup d’autres. Il serait même impossible de lister tous les types de métadonnées possibles.

Quelques initiatives de standardisation ont néanmoins vu le jour. Le Dublin Core propose par exemple une liste de métadonnées pour décrire les pages web. Sujet, contributeurs, sources… 15 métadonnées figurent dans la norme ISO 15836 associée. Mais si le Dublin Core se révèle très efficace pour décrire les pages d’un site web, il ne serait pas suffisant pour décrire d’autres types de données comme, par exemple, une base de données de gestion.
Car à chaque type de données ses métadonnées. Pour comprendre un SMS, il est nécessaire de connaître son auteur, son destinataire. En revanche dans le cas d’un relevé de température, c’est plutôt l’emplacement et le modèle du capteur qui vont nous intéresser. C’est donc à l’utilisateur des données de se constituer son propre référentiel de métadonnées. Pour donner du sens aux données utilisées et produites, il est par conséquent stratégique de maîtriser ses métadonnées.


À lire également : Ouverture des données énergétiques publiques en France : la transformation est en marche !


Quelles différences entre données et métadonnées ?

Il n’existe aucune définition légale établissant clairement la séparation avec les données. C’est en réalité à l’usage d’en décider. Dans certaines situations, les métadonnées peuvent être considérées comme des données à part entière. De la même manière, elles peuvent parfois délivrer des informations plus pertinentes que les données elles-mêmes. Dans le cas d’un appel téléphonique, on considère traditionnellement le contenu de l’appel comme des données. L’identité des protagonistes, l’heure de l’appel et sa durée constituent alors les métadonnées pour l’opérateur. Cependant, l’ensemble des métadonnées des appels d’un individu peuvent une fois analysées donner des informations précises sur son entourage. Les métadonnées sont alors devenues les données à part entière de l’analyse.

Et dans le domaine de l’énergie ?

Dans le domaine du Data Analytics appliqué à l’efficacité énergétique, les métadonnées servent à fiabiliser les analyses conduites sur des données. Le cas du traitement de factures énergétiques illustre cette situation. Ainsi, et fort heureusement, une facture ne contient pas seulement un montant à payer. L’adresse du bâtiment, le type de contrat, l’adresse de facturation et le nom du fournisseur que l’on pourrait qualifier de métadonnées permettent au client d’authentifier la facture. Le total des consommations et leur répartition pour une période donnée justifie le montant annoncé. Agrégées, ces métadonnées peuvent ainsi devenir source d’une analyse plus poussée des factures énergétiques d’un parc immobilier. Il devient alors possible de quantifier les consommations par type de contrat, par type de bâtiment. Et pourquoi pas de prédire ses consommations futures pour optimiser ses contrats. Tout ça, grâce aux métadonnées.

Les métadonnées nous permettent donc de comprendre les données que nous exploitons. Il est essentiel de les incorporer à toute analyse de données. Maîtriser l’analyse des métadonnées est une étape essentielle pour mettre en place une politique de gouvernance des données.

Venez découvrir les nombreux usages des métadonnées et du data-analytics :


Pour aller plus loin :


Pour recevoir tous les mois les articles de Datanergy, inscrivez-vous !
Paul Bouchequet

Publié par Paul Bouchequet

Ingénieur chez Deepki, auteur du site FrenchKPI