Association des archivistes du Québec 24 avril 1996

La gestion des images en mouvement

James M. Turner Professeur adjoint École de bibliothéconomie et des sciences de l'information Université de Montréal téléphone +1 514 343 2454 télécopie +1 514 343 5753 turner@ere.umontreal.ca http://tornade.ere.umontreal.ca/~turner

Ligne de séparation

Sommaire

Introduction
Mettons les choses en pespective
Profil des collections
Schéma de discussion
Le repérage par matières des documents visuels photographiques
Le lien inévitable entre texte et image
Le «problème du vocabulaire»
Le coeur du problème
Particularités de l'image en mouvement
Le côté technique de l'image en mouvement
L'indexation
Les normes
Conclusions
Références

Ligne de séparation

Introduction

La question de l'iconographie, ou la description, la classification et l'interprétation du sujet des oeuvres d'art date d'au plus tard 1570 (De Picturis et Imaginibus Sacris de Johannes Molanus), selon Ohlgren (1981, 73) ;
On note à la même époque le Journal de Pierre de L'Étoile (1589), réunissant un album de «placards» conservé à la Bibliothèque nationale de France;
Pourtant, le «contrôle intellectuel» des documents visuels est inadéquat;
Il est intéressant de noter que le «contrôle intellectuel» des livres n'est guère mieux (Hancock 1987, 304; Williamson 1985, 29-30).

Ligne de séparation

Mettons les choses en perspective

Ce n'est qu'environ 400 ans après Gutenberg que l'accès par sujet aux livres commence à prendre de l'importance. Vers la fin du dernier siècle, des schémas de classification furent développés en Amérique par Poole, Cutter, et Dewey;
Bien que des collections d'art existent depuis longtemps, les collections de films ne commencent qu'au vingtième siècle;
Les collections vidéo ne commencent que dans les années 1960;
La masse documentaire photographique (i.e. photographie, cinéma, vidéo) s'est accumulée rapidement, et surtout depuis la deuxième guerre mondiale.

Ligne de séparation

Profil des collections

Aujourd'hui, beaucoup de collections visuelles sont caractérisées par une masse importante de documentation et un taux de croissance rapide;
Malheureusement, l'accès par sujet à cette documentation n'est pas facile. Souvent la recherche documentaire s'appuie fortement sur les connaissances des employés dans un dépôt d'images;
Aujourd'hui, les«bases de données» prennent leur retraite;
Typiquement, des techniques ad hoc sont employées dans le design de systèmes de stockage et de récupération de l'information (métadonnées) reliée à cette documentation;
Aujourd'hui, et surtout à cause de la communication en réseau, on sent le besoin de normaliser les méthodes, afin de permettre des recherches entre les divers systèmes.

Ligne de séparation

Schéma de discussion

Les documents visuels par rapport à la bibliothéconomie et l'archivistique (une classification arbitraire) :

NB: pour fins de repérage dans des documents textuels, on ne s'occupe pas du document à son état de manuscrit. Par contre, la catégorie «Éléments de produits potentiels» est probablement le plus grand centre d'activité pour l'indexation des images en mouvement en archivistique;
On cherche des images afin de créer des documents, alors qu'on ne s'adresse pas à une base de données de mots pour rédiger un texte (bien qu'on consulte des dictionnaires, etc.);
Le fait qu'il n'y ait pas d'alphabet indique donc une différence fondamentale dans la problématique de l'indexation entre le texte et les images.

Ligne de séparation

Le repérage par matières des documents visuels photographiques

(c.à.d. créés à partir d'un objectif)

L'ensemble des problèmes de repérage associés à ce genre de documentation se distingue de façon importante des problèmes associés aux livres, ou même à la peinture ou autres documents visuels chirographiques;
Les tableaux dans les collections ont habituellement un auteur et un titre, ou leurs équivalents;
Pour le chercheur dans une collection photographique, le photographe importe peu, sauf exception (par ex. photographies d'art);
Les collections photographiques ressemblent plus aux collections d'archives qu'aux collections de bibliothèques. Est-ce la peine de cataloguer chaque item?
À des fins informatiques, les modèles de représentation de l'image en mouvement doivent être beaucoup plus complexes que ceux employés pour représenter les livres (O'Connor 1985);
Bien qu'il y ait typiquement plusieurs avenues d'accès aux données relatives aux collections de photos, de films, et de vidéos, la recherche par matières est de loin la méthode la plus employée par les usagers;
Comme on verra, la recherche par matières n'est pas nécessairement la plus efficace;
Bien que les livres et les peintures soient classés par leur sujet d'ensemble («aboutness»), un niveau plus primaire («ofness») est plus utile et plus approprié pour l'indexation des photos «ordinaires» ou des chutes de film. Cependant, il y a lieu de revoir cette pratique à la lumière des nouvelles technologies;
Ainsi, les techniques d'indexation pour donner accès par matières aux collections d'images «ordinaires» ont rapport à l'assignation de noms aux objets ou aux événements proéminents dans l'image visuelle;
En principe, le fait de tout simplement nommer ce que l'on voit dans l'image pour l'indexer devrait simplifier les choses, mais ce n'est pas le cas;
Il y a un lien inévitable entre le texte et l'image, et il y a le «problème du vocabulaire» (Furnas et al. 1987).

Ligne de séparation

Le lien inévitable entre texte et image

Parfois on prône des systèmes qui n'utiliseraient que de l'image pour en trouver d'autres images : par ex. on dessine un petit chien et le système nous trouve des images de chiens;
Ou encore : dans le système on repère une image utile, et ensuite on demande au système de nous en trouver d'autres semblables;
Il reste que le plus «naturel» c'est une requête en forme de mots : par ex., "je cherche des images de chiens" ;
Aussi, il faudrait être capable de dessiner un chien qui a l'air d'un chien;

L'idéal, c'est probablement la possibilité d'employer les deux approches (dictionnaire ou thésaurus visuel plus texte);
N.B. : En ce qui concerne les images fixes, la représentation textuelle est moins importante (O'Connor 1988, 208-209), bien que souvent nécessaire (Wright 1981, 131); en ce qui concerne les images en mouvement, la représentation textuelle est incontournable, essentielle (Turner 1994, 34-38);

Ligne de séparation

Le «problème du vocabulaire»

Des études de choix spontanés de mots pour désigner divers objets démontrent qu'une variété surprenante de mots est employée pour désigner une même chose (par ex. Furnas et al. 1987);

Pour expérimenter le problème:
Sur un morceau de papier, écrivez le nom que vous donneriez à un système informatique qui décrirait des activités d'intérêt dans un grand centre métropolitain. Par exemple, un tel système offrirait des suggestions d'activités de divertissement en ville, un samedi soir. Le nom du système doit être d'un maximum de 10 caractères.
Essayez de trouver un nom bien évident, auquel d'autres personnes penseraient aussi.
Comparez votre réponse à celle de votre voisin. Les réponses sont-elles identiques?
Furnas et al. ont demandé à plus de 2000 personnes de faire cette exercice, pour ensuite les mettre en paires de façon aléatoire. Seulement une dizaine de paires ont trouvé à s'accorder;
En utilisant ce modèle de recherche, on apprend que moins de 10 personnes sur 1000 (ou environ 1%) auraient pu accéder directement au logiciel si leur partenaire avait choisi le nom du logiciel.

Ligne de séparation

Le coeur du problème

Au coeur du problème: la possibilité de plusieurs noms pour un objet. Chaque personne ne pense qu'à un nom ou qu'à quelques noms;
À cause de ça, on a tendance à surestimer nos choix, les trouvant évidents;

On finit quand même par surmonter le problème. Dans beaucoup d'études concernant la distribution de mots (par ex. Furnas et al., 1983), dans beaucoup de domaines et pour beaucoup de types de données, l'emploi de mots a tendance à ressembler à la distribution de Zipf, c.à.d. que peu de mots sont employés fréquemment, beaucoup de mots ne sont employés qu'une seule fois, et la plupart des cellules ont la valeur «zéro»;

TERME	Plan 1	Plan 2	Plan 3	Plan 4
arbre	0	0	3	0
CKAC	0	0	0	1
cuisine	0	1	0	0
discussion	0	0	0	4
drapeau	24	0	0	0
esquimau	0	2	0	0
famille	0	2	0	0
hommes	0	0	0	3
Inuit	0	14	0	0
manger	0	5	0	0
oiseau	0	0	22	0
OTAN	2	0	0	0
radio	0	0	0	12
réunion	0	0	0	8
vent	1	0	1	0
[espèce]	0	0	3	0

Ainsi, on finit par extraire les termes utiles pour l'indexation. Il y a des indications qu'il serait relativement facile de dériver automatiquement des index pour l'image fixe et en mouvement, à partir de leurs représentations textuelles (Turner 1995);
Un autre aspect du problème : chaque mot peut référer à plusieurs objets. Sont-ils tous des bons? Par exemple : bouchon, le système a besoin de savoir dans quel sens du mot?

Ligne de séparation

Particularités de l'image en mouvement

On ne peut pas concevoir le stockage et repérage sans texte accompagnateur;
Le fait que le visionnement ait lieu dans le temps fait qu'on n'a pas la liberté de parcourir l'image, comme c'est le cas avec l'image fixe;
Le son est d'une grande importance, peut-etre la moitié de l'expérience;
L'archiviste a besoin d'être formé en techniques de production pour pouvoir faire son travail;
Les RDDA ne vont pas assez loin en ce qui concerne les besoins d'archives d'images «stock», les archives de télévision et de film, parce que celles-ci ont besoin d'être traitées au niveau du plan, c.à.d. qu'un plan=une notice dans la base de données;
Ainsi, inévitablement on parle de multimédia, ce qui nous indique le type de systèmes de gestion qu'il faut pour ce type d'archives.

Ligne de séparation

Le côté technique de l'image en mouvement

Tout avance à grands pas dans l'informatisation et la numérisation des données de toutes sortes;
Pour l'image fixe, il existe maintenant des systèmes performants qui permettent de voir l'image à même la base de données, même plusieurs à la fois;
Pour l'image en mouvement ceci n'est pas encore possible. Voici pourquoi :
- Une image de 1 bit (donc noir et blanc, pas de tons de gris) à résolution 100 dpi 20cm x 25cm (=8x10 po) : 800 Ko;
- Une image de 128 bits à résolution 1200 dpi 20cm x 25cm (= 8x10) = 14 745 600 000 d'octets = presque 15 gigaoctets (= 15 000 Mo);
- En vidéo : 30 images/sec = 450 gigaoctets / seconde !!!;
- Calcul rapide à l'ONF pour les «stockshots» : il faudrait 200 robots contenant chacun 50 vidéodisques et reliés à une même base de données pour gérer l'image en format analogique;
Puisque cette situation n'est pas à la veille de changer (bien qu'on ne sait jamais), il vaut mieux mettre nos efforts actuels dans des structures de données pour l'image en mouvement et dans la création de la méta-information, laquelle est nécessaire de toute façon pour gérer le reste;
Éventuellement, la technologie va nous rattraper. Ne perdons pas de temps à travailler pour l'ordinateur; il va pouvoir travailler pour nous éventuellement.

Ligne de séparation

L'indexation

Comme avec d'autres types de documents, on veut bien se servir de vocabulaire contrôlé pour exprimer les concepts d'indexation;
De nombreuses clés d'accès sont d'une importance particulière pour l'image en mouvement : vu le niveau élémentaire de la description au niveau du plan, on peut se trouver avec un grand ensemble de plans à visionner;
À l'aide des clés d'accès autre que l'indexation par sujet, on peut éliminer un grand nombre de plans de notre sélection;
Quelques clés importantes : les angles de caméra, la couleur, les périodes de temps, l'espace géographique;
Les angles de caméra : le point de vue de la caméra (c.à.d. l'angle d'approche vers l'objet photographié) est souvent important pour le chercheur. Par exemple, «j'ai besoin d'images de Trois-Rivières, mais des images prises d'un avion seulement». Ou encore, «j'ai besoin d'une image de Bernard Landry, mais il faut que ce soit un gros plan»;
Pour ceci, il est utile d'employer une terminologie normalisée, par ex. le Glossaire publié par l'ONF (1984). Cependant, si vous avez des besoins particuliers reliés à votre collection, vous pouvez soit modifier un lexique existant, soit construire de toute pièce votre propre vocabulaire;
La couleur : Dans certains cas la couleur peut être un point d'accès très important, par exemple un musée des arts décoratifs, ou les archives d'un designer de mode;
On peut aussi vouloir employer la couleur afin d'éliciter de l'émotion, par exemple «il me faut un objet rouge comme le sang et qui occupe les trois-quarts de l'image»;
Une fois que les ordinateurs acquierent l'intelligence requise pour identifier des objets et pour les indexer, ils seraient aussi capables de chercher par la couleur associée à un objet (par ex. un chat gris, une auto rouge). Il est déjà facile pour un ordinateur de calculer la proportion d'espace qu'occupe une couleur dans une image;
Les périodes de temps : c'est un point critique dans beaucoup de situations. Par exemple, «j'ai besoin de scènes de rues de Montréal des années 1940». Ou encore : «il me faut des plans d'autos des deux ou trois dernières années»;
Les tables de la Classification décimale universelle sont très utiles pour l'expression de ce genre de concept. Par exemple :

19 20e siècle
194 les années 1940
1945 1945
1945 11 15 le 15 novembre 1945
1945 11 15 22:35:17 le 15 novembre 1945 à 22h35 + 17 sec.
Ces tables permettent aussi des concepts comme «automne», «crépuscule», etc.;
Avec les images fixes et surtout en mouvement, le système doit probablement tenir compte du temps réel (c.à.d. la date de tournage) et aussi du temps représenté (par ex. un film est tourné en 1996 mais l'action a lieu dans les années 1940);
L'espace géographique : comme pour les périodes temporelles, dans bien des situations ce point d'accès peut être critique. Par exemple, pour répondre à une demande pour des plans des rues de Québec dans les années 1940, il faut comprendre que le seul endroit où on peut avoir tourné ces plans c'est Québec;

Pour l'espace géographique, les tables de la CDU constituent un vocabulaire contrôlé fort utile pour l'expression de ce genre d'information. Par exemple :

7	l'Amérique du Nord
71	le Canada
714	le Québec
714.541	Montréal
*714.541H3T**	campus de l'Université de Montréal
*714.541H3T 1N8**	pavillon Lionel-Groulx

Ainsi on peut exprimer des concepts géographiques de façon très précise ou encore de façon générale, en employant la troncature;
Les tables de la CDU tiennent compte aussi du fait que les traits géographiques traversent souvent les frontières politiques. Par exemple :

23 les montagnes
234 les montagnes de l'Europe
234.2 montagnes de la France et de la Belgique
234.24 le Massif central
234.242 montagnes de la région de l'Auvergne
Bien sûr, d'autres vocabulaires existent pour exprimer des concepts géographiques (par ex., les sous-divisions géographiques des vedettes-matière de la Library of Congress). Mais une classification est nettement avantageuse;
N.B. : comme pour l'encodage de périodes temporelles, on peut avoir besoin de distinguer le lieu de tournage de l'endroit représenté.
Autres points d'accès :
1. l'émotion, qui peut être fort utile comme point d'accès dans certaines situations. Toutefois, c'est assez subjectif;
2. l'éclairage, par ex. des plans tournés à l'intérieur ou à l'extérieur, un plan très clair ou plutôt obscur, ou avec beaucoup d'ombres, ou aucune;
3. la texture, par ex. des plans un peu flous, ou encore très nettes, ou des images avec beaucoup de grain, et ainsi de suite;
Autres conditions spéciales : des plans tournés en-dessous de l'eau, par des appareils détecteurs de chaleur, pris de l'espace, sur film infra-rouge.

Ligne de séparation

Les normes

Il faut normaliser le plus possible les méthodes de travail, les structures de données et les vocabulaires contrôlés, afin de favoriser les échanges de données à travers les réseaux;
Il ne faut pas accepter que les normes nous empêchent d'employer la meilleure façon possible d'organiser nos collections;
Matière à réflexion : il faudrait peut-être imposer l'ordre après coup, plutôt que de le planifier à l'avance (le modèle World Wide Web plutôt que les modèles traditionnels en bibliothéconomie, archivistique, muséologie).

Ligne de séparation

Conclusions

Il y a encore beaucoup de travail à faire avant que l'on puisse considérer que nos collections d'images en mouvement soient bien organisées;
Les méthodes normalisées pour l'archivage de l'image en mouvement au niveau du plan sont à établir, bien que pour des produits plus complets ou pour des fonds complets on peut employer les RDDA;
En attendant que les ordinateurs soient plus performants, on ne perdra point notre temps à investir dans la création de méta-données.

Ligne de séparation

Références

Furnas, G.W., T.K. Landauer, L.M. Gomez, and S.T. Dumais. 1983. Statistical semantics: analysis of the potential performance of key-word information systems. The Bell System Technical Journal 62:6 (July-August), 1753-1806.

Furnas, G.W., T.K. Landauer, L.M. Gomez, and S.T. Dumais. 1987. The vocabulary problem in human-system communication. Communications of the ACM 30:11 (November ), 964-971.

Hancock, Micheline. 1987. Subject searching behaviour at the library catalogue and at the shelves: implications for online interactive catalogues. Journal of Documentation 43:4 (December), 303-321.

O'Connor, Brian C. 1985. Access to moving image documents: background concepts and proposals for surrogates for film and video works. Journal of Documentation 41:4 (December), 209-220.

O'Connor, Brian. 1988. Fostering creativity: enhancing the browsing environment. International Journal of Information Management 8: 203-210.

Office national du film du Canada = National Film Board of Canada. 1983. Glossaire = Glossary. Recherche et développement = Research and Development. Montréal.

Ohlgren, Thomas. 1981. Subject indexing of art works. In Computerized inventory standards for works of art, ed. Raymond Vézina, 73-78. Montréal: Fidès.

Turner, James. 1994. Determining the subject content of still and moving image documents for storage and retrieval: an experimental investigation. PhD thesis, University of Toronto.

Turner, James, 1995. Comparing user-assigned terms with indexer-assigned terms for storage and retrieval of moving images. Actes du congrès de l'ASIS Chicago 1995.

Williamson, Nancy J. 1985. Classification in online systems: research and the North American perspective. International Cataloguing 14:3 (July-September), 29-31.

Wright, Richard M. 1981. Arrangement and indexing. In Picture Librarianship, ed. Helen P. Harrison, 131-149. Phoenix, AZ: Oryx Press.

Ligne de séparation

Menu principal | Site de l'EBSI | Commentaires

Autre conférence

19	20e siècle
194	les années 1940
1945	1945
1945 11 15	le 15 novembre 1945
1945 11 15 22:35:17	le 15 novembre 1945 à 22h35 + 17 sec.

23	les montagnes
234	les montagnes de l'Europe
234.2	montagnes de la France et de la Belgique
234.24	le Massif central
234.242	montagnes de la région de l'Auvergne