La structure des données
Pour être exploitables, les données sont stockées dans des fichiers de manière structurée. Plusieurs formats de fichiers peuvent être utilisés en fonction des besoins.
Comment les données sont-elles structurées ?
Les caractéristiques des données structurées
Pour retrouver et traiter des données facilement, on les organise sous la forme d'un tableau appelé « table de données[1] ».
Une collection regroupe des objets partageant les mêmes descripteurs[2] .
Un objet[3] est donné par la liste des valeurs de tous ses descripteurs.
Les données sont alors dites « structurées ».
Les représentations des données
Le choix de la structure de don- nées est essentiel pour retrouver les informations. Ainsi, selon les éléments que l'on souhaite mettre en avant, on choisira certains descripteurs plutôt que d'autres. Une même donnée peut donc être représentée dans différentes tables et de différentes manières.
Dans l'exemple ci-contre, l'image ci-dessus est un objet dans deux collections, avec des descripteurs différents.
Exemple :

Retrouver la date de l'image.
Quelle collection permet de retrouver cette information le plus rapidement ?
Les formats des données
Selon les besoins, les données peuvent être représentées sous différentes formes. Les formats CSV, JSON et XML sont très utilisés.
Le CSV et le JSON sont simples à écrire et à lire, contrairement au XML qui nécessite de longues lignes de code. Le CSV est rigide (tous les descripteurs doivent être renseignés), contrairement au XML et au JSON. Le XML est le format le plus rapide à traiter par la machine.
Exemple :

Combien y a-t-il d'objets dans la collection représentée sous forme CSV, XML et JSON ?
Quels en sont les descripteurs et comment sont-ils placés dans les différents formats ?
Retrouver les métadonnées d'un fichier personnel
Exemple :

Peut-on utiliser librement les informations sur les vélos en libre-service pour faire une application payante qui indique la localisation des stations ?
CONCLUSION.

Quels sont les points communs aux différents formats de données ?