Stockage et catalogage : comment renseigner ses photos ?

15/08/2011 à 11:49

Le_Lion_07

Bonjour. Voici queques lignes écrites récemment ; je les livre à vos commentaires éclairés…

1. Pourquoi renseigner ses photos numériques ?

Je ne m'appesantirai pas sur ce pénible sujet. Le (la) photographe qui cherche, parmi ses 11 729 photos stockées en vrac, celle de la jolie maison avec les coquelicots rouge vif devant, prise en mai 2007, se reconnaîtra… Bonne chance.

2. Les deux façons de s'y retrouver.

Elles sont complémentaires.

La première est le rangement physique des photos (si tant est qu'on puisse parler de physique pour des objets virtuels). Autrement dit, renommer ses photos selon des règles logiques et/ou organiser ses images selon la méthode des dossiers et sous-dossiers. Pas de règles particulières, chacun s'y retrouve à sa manière.

Le seconde est justement le renseignement des balises gracieusement fournies avec les .jpg (d'autres formats, .psd entre autres, les conservent).

3. Les balises .jpg.

Les deux balises .jpg portent des noms charmants : EXIF (Exchangeable Image File) et IPTC (International Press Telecommunications Council).

La balise EXIF est celle que crée l'appareil à la prise de vue. Elle est théoriquement impossible à modifier mais de nombreux logiciels permettent de gratter des choses là dedans. A vrai dire, je n'en vois pas bien l'intérêt, exception faite de la date de prise de vue lorsqu'on scanne des négatifs ou des diapos (et qu'on connaît la date originale, évidemment). Dans ce cas, un gratuit comme Exifer, qui autorise cette modif (en lot si besoin) peut être très utile.

La balise IPTC est nettement plus intéressante puisqu'elle est paramétrable par l'utilisateur. Elle a été faite pour ça. C'est d'ailleurs là que les ennuis peuvent vous tomber dessus…

4. IPTC, norme ou bazar ?

En fait, il existe bien une norme IPTC (IPTC Core). Cette norme est à mon avis largement suffisante pour les besoins de l'amateur. Car il existe aussi une norme "PTC Extensions" . Le problème, dans tous les cas de figure, est le suivant : quels champs puis-je renseigner pour être (à peu près) sûr que mes photos seront lisibles par tous (ou presque tous) les logiciels du marché ? Le cas échéant, quelle pérennité pour ces champs ?

Comme je l'écris juste avant, il me semble que s'en tenir aux champs "IPTC Core" basiques permet déjà bien des choses. Voici, à titre d'exemple, les champs que j'utilise. Ces champs sont tirés de la Creative Suite 5 (Ps5 et Bridge utilisent logiquement les mêmes modèles) :

- Créateur (parfois nommé Auteur) : vous. Ce champ peut être renseigné par certains appareils de prise de vues qui autorisent l'entrée de cette donnée.
- Localisation : c'est un des champs les plus intéressants. Il est "à tiroirs" : pays, département, ville, etc. Bien sûr, rien ne vous oblige à tout renseigner. Je préfère n'utiliser que le champ "Pays" et préciser le lieu à la suite. Exemple : France (Grignan-26). Mais utiliser tous les autres champs ne devrait pas poser de problème. Question : pourquoi Bridge ne propose-t-il pas le champ "Pays" dans les filtres de tri ?
- Titre : champ vaste et libre. C'est l'exception de la liste : perso, je ne m'en sers pas, mais là encore, c'est un champ aux normes.
- Description : même chose. Je l'utilise pour des infos complémentaires. Exemple : Jour sans signification (seuls mois et année mentionnés sur le cache des dias).
- Mots clés : de toute évidence, un des principaux champs, à utiliser abondamment. C'est un champ ouvert : le nombre de mots clés est illimité, parce qu'à chaque mot, une entrée est créée (je crois que le nombre de caractères est de 64 par entrée). Liberté totale : untel mettra 30 mots clés par photo, unetelle 2 ou 3 seulement. No problemo, à chacun de s'y retrouver.
- Copyright : le droit de copie a sa place ici. Comme l'auteur, certains appareils photo autorisent l'entrée de cette donnée.

D'autres champs normalisés existent. Que pensez-vous de ceux-là ? C'est déjà pas mal, non ?

J'ai vérifié la normalisation de ces champs en ouvrant des photos test dans plusieurs logiciels : Creative Suite, Exifer, Expression Media, PhotoME, XnView. Dans tous les cas, c'est bon. Il faudrait peut-être tester avec d'autres programmes…

Justement, attention aux champs trompeurs… Bizarrement, aucun champ de l'IPTC Core n'est attribué aux personnes (il y en a un dans IPTC Extension). Pourtant, dans Expression Media, le champ "Personnes" était bien tentant ! Je l'ai donc utilisé sans réfléchir (heureusement qu'Expression Media ne modifie que son propre catalogue ; de toutes façons, j'ai des copies de sécurité, oeuf corse). Résultat : dans XnView et PhotoME, ce champ s'ouvre comme "Contact" (personne à contacter pour avoir des précisions sur la photo). Dans Creative Suite et Exifer, il est aux abonnés absents ! Même chose dans l'autre sens : le champ "Personnes" de Creative Suite reste invisible pour Expression Media… Conclusion : j'ai remis les personnes dans les mots clés et tout va bien.

Dernière astuce : pour garder des mots clés bien rangés, je fais précéder les mots "techniques" d'un "+". Exemple : + Noir & blanc, + Fondu, etc. Les personnes sont précédées d'un "#". Exemple : # Tonton Julot, # Papi Mougeot, etc. Ainsi, ils restent regroupés dans la liste. Tout est possible, il suffit de réfléchir à un système et de s'y tenir.

5. Voilà. N'hésitez pas à corriger mes erreurs, à apporter des précisions, à commenter…

Cordialement.
15/08/2011 à 12:04

Darth

Très bonne chose que de rappeler cela.

Le dernier topic que j'ai posté (voir ICI) je parle justement de cette difficulté à retrouver une image.

Depuis quelques années maintenant mes images sont classées, cataloguées…etc.

Mais au début de mes aventures en numérique et presque jusqu'en 2005 je n'ai jamais vraiment classé mes photos autrement que dans des dossiers datés à l'américaine (année/mois/jour) ce qui m'a un peu facilité la recherche, mais qui n'aide pas vraiment.

Donc, prendre un peu de temps pour cataloguer ces images est une très très bonne chose, car ce matin j'ai presque perdu 2h30 à chercher une simple image !
15/08/2011 à 13:21

Davroom

Très interessant Lion !
15/08/2011 à 17:08

Mini-Renne

merci pour ces informations !
17/08/2011 à 14:50

Le_Lion_07

Je reviens avec un retour d'expérience sur les champs de localisation.

J'ai voulu voir si l'usage des 4 champs rendait le classement - et, partant, la recherche - des photos plus facile. La réponse me semble être oui… J'ai donc repris toutes mes photos sur ce principe (enfin, presque toutes ; certaines ne sont pas renseignées sur ce point). Heureusement qu'EM 2 permet de travailler tranquillement sur les catalogues puis d'exporter vers les photos quand tout est au point. Mais ça reste du boulot : tout reprendre, bien vérifier, envoyer les balises actualisées dans les photos, défragmenter les d.d. (parce qu'après, ils sont véritablement en miettes) et faire les copies de sécurité. Ouf ! Reste à (re)graver les DVD ;c'est malin, je venais de les refaire il y a deux jours ! Bon, enfin, on lance et ça se fait tout seul…

Donc, les 4 champs "Localisation" sont en fait imbriqués. Le champ de niveau 1 est donné pour "Pays", le 2 pour "Région/Département/Province", le 3 pour "Ville" et le 4, plus vaguement, pour "Lieu". Rien n'oblige à renseigner tous les champs ; ceci étant, je préfère, plutôt que de laisser un champ vide coincé entre deux autres pleins, mettre quelque chose comme : "sans ville" pour des photos faites à la campagne, ou : "Département/Région non trouvé" pour un lieu identifié sans possibilité de déterminer la région (surtout pour des photos faites à l'étranger). 

Le truc intéressant, c'est que certains logiciels, comme EM2, présentent alors la localisation avec l'arborescence, qu'on peut développer ou réduire. Si par exemple on développe le niveau 1, on aura tous les pays. En cliquant sur le petit triangle, on aura la liste des département/régions qui va s'ouvrir, etc.

Un petit exemple de ce que ça peut donner :
1. France
    2. 07 (Ardèche)
         3. Privas
             4. Manifs                         < là, j'utilise le champ n°4 pour un événement
    2. 11 (Aude)
         3. Carcassonne
             4. La Cité
    2. 12 (Aveyron)                         < là, pas de détail dispos
    2. 19 (Corrèze)
         3. Ussel                               < là, pas de champ n°4
1. Italie
    2. Vénétie
         3. Venise
etc.
 
Voilà qui me fait d'autant plus regretter que Bridge, parfaitement intégré à la Creative Suite et donc à Ps, ne propose pas le champ Localisation dans ses filtres de recherche. Une vraie aberration !

Enfin, je rappelle que ces champs sont parfaitement intégrés à la norme IPTC Core et reconnus (avec l'arborescence) par tous les programmes de catalogage dignes de ce nom. Je précise pour être complet qu'Exifer ne signale pas le champ n°4 (Lieu) mais ceci peut peut-être s'expliquer par l'ancienneté du logiciel (m. à j. à vérifier).

A plus.
18/08/2011 à 19:41

Le_Lion_07

Suite de mon passionnant feuilleton  : « Perdu dans la jungle des balises photo… »
 
Voilà une quetion qui me tourmente quelque peu  : et si la manipulation des balises (IPTC essentiellement) altérait la qualité des photos .jpg  ?
 
Le format .jpg a forcément des avantages et des inconvénients ; ainsi en va-t-il de toutes choses en ce monde… Son format indépendant de la plate-forme d’accueil et sa compression sont plutôt bienvenus, d’autant qu’une photo .jpg compressée à la qualité maximum ne présente aucune altération. La balise IPTC, la seule théoriquement modifiable est aussi un bel atout. Mais la qualité des photos ne pâtit-elle pas des modifications successives éventuellement apportées à cette balise, puisque le fichier est réenregistré à chaque fois  ? La logique voudrait que non  : on peut avoir à changer de mots clés plusieurs fois, par exemple. Comme la littérature (virtuelle) est bien peu abondante sur ce sujet – peut-être parce que ça doit aller de soi – et aussi par curiosité, me voici plongé au cœur du sujet…
 
Je vais tenter une petite expérience  : une photo est copiée à 7 exemplaires (donc, tous identiques) et je vais opérer sur ces 7 images deux changements  :
- le mot clé « Arbre » sera supprimé et remplacé par « TEST POUR MOT CLE »,
- La champ « Description » qui contient « Date sans signification (aucune indication sur le cache des dias) » sera vidé.
 
Le test sera effectué avec 7 outils différents. Quelle sera la taille du fichier une fois modifié  ? En toute logique, identique…
 
Le fichier source pèse 7 328 828 octets. 

- avec Bridge, la modif étant effectuée directement depuis le panneau latéral « Métadonnées », la taille finale est de 7 327 925, soit - 0,01 %,
- avec Expression Media, la taille finale est de 7 328 565, soit - 0,003 %,
- avec Exifer, la taille finale est de 7 321 444, soit - 0,1 %,
- avec modification directe, la taille finale est de 7 332 743, soit + 0,05 %,
- avec PhotoME, la taille finale est de 7 328 776, soit –  0,0007 %,
- avec Photoshop, la taille finale est de 7 544 810, soit + 2,94 %,
- avec XnView, la taille finale est de 7 319 223, soit - 0,13 %.
 
Qu’en conclure  ? D’abord, que tous ces logiciels, sauf Photoshop, modifient la taille du fichier de façon infime, mais différente. Ceci étant, si l’image était touchée, la différence serait beaucoup plus élevée, la palme revenant à PhotoME suivi de près par Expression Media. Ensuite, que 5 logiciels sur 7 diminuent la taille et 2 l’augmentent. Quid  ? Et pourquoi tous ne présentent-ils pas une taille « harmonisée » en sortie  ? Pourquoi Photoshop ajoute-t-il près de 3 % d’octets  ? Quoi qu’il en soit, la conclusion semble bien être  : changer les champs IPTC ne touche en rien l’image elle-même. Qui a une source officielle pour confirmer  ?
 
Sur ces entrefaites, et pris au jeu, me voici rendu (je ne sais même plus comment…) sur un site passionnant consacré aux normes IPTC pour les photos. Horreur : un tableau m’apprend que le champ n°4 de « Localisation » (voir mon message précédent) est propre à Expression Media ! Un petit tout sur le site officiel de l’IPTC : en effet, pas de champ n°4. Mais alors… pourquoi Photoshop le donne-t-il comme un champ IPTC Core ? (Je n'ai pas la réponse…)
 
J’apprends aussi que les champs « Catégories » et « Catégories supplémentaires » sont voués à disparaître. Mais je m’en sers, moi… Bon, je sais ce qui me reste à faire. Je vais (encore) modifier mes catalogues en respectant les normes. En fait, moins on utilise de champs et mieux ça vaut.
 
Conclusion  : je me sers dorénavant des champs Auteur, Copyright, Description, Mots clés, Pays, Région/Département et Ville. Rien d’autre. Jusqu'à nouvel ordre, ces champs sont parfaitement référencés dans le document IPTC de référence (un .pdf de 55 pages à télécharger sur le site officiel).
 
Je vous laisse  : je vais dans Expression Media faire les corrections. En attendant de nouvelles aventures…  ?