Vocabulaire relatif aux bases de données de photos numériques

18/03/2012 à 15:49

Le_Lion_07

Pour diverses raisons, j'ai dû écrire un petit topo à propos du vocabulaire utilisé dans le monde des bases de données en photo numérique. Donc, concernant directement le stockage des images. Si ça peut éclaircir quelques points qui demeurent parfois confus… Bien sûr, je reste à l'écoute de vos suggestions, compléments d'info ou corrections d'erreurs si j'en ai commises…

Balise (tag) : entrée individuelle d'un bloc de données.

Base de données (database) : fichier(s) contenant des informations relatives au catalogage de photos numériques.

Bloc (de données) : zone d'un fichier où est écrit un ensemble de balises réunies sous une même appellation. Les blocs sont en quelque sorte la partie physique des données. Il peut exister trois blocs dans un fichier de photo numérique : EXIF, IPTC et XMP, plus évidemment le bloc où est stockée l'image elle-même.

Catalogueur (Dam, Digital Assets Management) : logiciel de gestion de photos numériques permettant l'indexation et, partant, la recherche de photos selon divers critères. Les vrais catalogueurs sont rares, la mode étant aux logiciels à tout faire. Aucun logiciel ne possède - à ma connaissance - que des fonctions de catalogage.

Champ (field) : partie d'une balise à compléter avec les informations voulues.

Donnée (data) : valeur numérique ou alphabétique figurant dans le champ d'une balise. Une donnée peut être fixe (non modifiable) ou modifiable par l'utilisateur.

EXIF : bloc de données non modifiables (à l'exception de la date et l'heure de prise de vue) inscrit dans le fichier en général par l'appareil photo. Il comprend essentiellement des données techniques.

Hiérarchie : type d'organisation des balises dans la structure IPTC. La hiérarchie est l'exception, même si nombre de logiciels permettent la hiérarchisation des métadonnées. Les mots clés, par exemple, ne sont normalement pas organisés en hiérarchie dans le bloc IPTC. Ceci signifie que des mots clés hiérarchiques n'existent que dans la structure du catalogue d'un logiciel. L'exemple typique est celui des mots clés Lightroom. Une des rares organisations hiérarchiques officielles des balises IPTC concerne les quatre balises Localisation (1. Pays > 2. Etat/Province/Région/Département > 3. Ville > 4. Lieu).

IPTC : bloc de données modifiables inscrit dans un fichier. Chaque balise du bloc IPTC est normalisée selon différents jeux (IPTC IIM, IPTC Core, IPTC Extension) définis par l'International Press Telecommunications Council.

JPG : norme d'enregistrement des photos numériques. Une photo à la norme JPG possède typiquement : un en-tête, un bloc EXIF, un bloc IPTC, un bloc XMP et un bloc avec la photo elle-même au format JPG. Tous les blocs ne sont pas forcément présents, à l'exception du dernier (la photo elle-même), bien sûr. À noter que du fait de la séparation des blocs dans le fichier, la modification des données IPTC n'altère en rien la qualité de la photo (il n'y a pas de recompression ; autrement dit, on peut changer à volonté les métadonnées d'une photo JPG).

Métadonnée (metadata) : donnée inscrite dans un des blocs du fichier numérique. Toutes les normes de fichiers ne supportent pas l'ajout de blocs de métadonnées (JPG, PDF, TIF - entre autres - les acceptent).

Métadonnée à champ unique : type de métadonnée qui n'accepte qu'un élément. Par exemple, la balise de localisation "Pays" : on ne peut entrer qu'un seul pays. Attention ! Aucun catalogueur ne vérifiera la validité des informations ! La seule limite sera celle de la longueur de la donnée et si on entre : "France-Chine", il n'y aura pas d'erreur générée…

Métadonnée à champs multiples : type de métadonnée qui accepte plusieurs éléments. La balise la plus connue de ce genre est "Mot clé". On peut entrer autant de mots clés que voulu parce que à chaque mot clé correspond un nouveau champ dans la balise "dc :subject" (nom officiel des mots clés).

Sidecar : type de fichier associé à une norme de fichier photo ne supportant pas les métadonnées. Le sidecar porte en principe le même nom que le fichier auquel il est couplé (sauf l'extension) et il contient les métadonnées non incorporées (parce que non incorporables) au fichier.

Synchronisation : mise en conformité d'une base de données et des fichiers qui y sont répertoriés. Les logiciels de catalogage ne font pas en général de synchronisation automatique, pour des raisons pratiques (la synchronisation prend du temps et pas mal de ressources de l'ordinateur ; mieux vaut la lancer à la demande).

XMP : bloc de données inscrites dans un fichier, pouvant être en partie considéré comme une copie des blocs EXIF et IPTC. Le bloc XMP peut comprendre aussi d'autres entrées. XMP, issu du métalangage XML, est développé par Adobe. En principe, on ne s'occupe pas du bloc XMP ; il est mis à jour par le catalogueur. XMP devrait en principe faciliter la portabilité des métadonnées.

Cordialement,

Bonnes photos !


19/03/2012 à 16:21

Meuble

Bien utile tout ça, merci !