Association des archivistes du Québec
24 avril 1996
La gestion des images en mouvement
James M. Turner
Professeur adjoint
École de bibliothéconomie et des sciences de
l'information
Université de Montréal
téléphone +1 514 343 2454
télécopie +1 514 343 5753
turner@ere.umontreal.ca
http://tornade.ere.umontreal.ca/~turner
Sommaire
- La question de l'iconographie, ou la description, la classification
et l'interprétation du sujet des oeuvres d'art date d'au plus tard 1570 (De Picturis et
Imaginibus Sacris de Johannes Molanus), selon Ohlgren (1981, 73) ;
- On note à la même époque le Journal de Pierre de L'Étoile
(1589), réunissant un album de «placards» conservé à la Bibliothèque nationale de France;
- Pourtant, le «contrôle intellectuel» des documents visuels est inadéquat;
- Il est intéressant de noter que le «contrôle intellectuel» des livres n'est
guère mieux (Hancock 1987, 304; Williamson 1985, 29-30).
- Ce n'est qu'environ 400 ans après Gutenberg que l'accès par sujet aux livres
commence à prendre de l'importance. Vers la fin du dernier siècle,
des schémas de classification furent développés en Amérique
par Poole, Cutter, et Dewey;
- Bien que des collections d'art existent depuis longtemps, les
collections de films ne commencent qu'au vingtième siècle;
- Les collections vidéo ne commencent que dans les années 1960;
- La masse documentaire photographique (i.e. photographie,
cinéma, vidéo) s'est accumulée rapidement, et
surtout depuis la deuxième guerre mondiale.
- Aujourd'hui, beaucoup de collections visuelles sont caractérisées par une masse importante
de documentation et un taux de croissance rapide;
- Malheureusement, l'accès par sujet à cette documentation n'est pas facile. Souvent la
recherche documentaire s'appuie fortement sur les connaissances des employés
dans un dépôt d'images;
- Aujourd'hui, les«bases de données» prennent leur retraite;
- Typiquement, des techniques ad hoc sont employées dans le design de systèmes de
stockage et de récupération de l'information (métadonnées) reliée à cette documentation;
- Aujourd'hui, et surtout à cause de la communication en
réseau, on sent le besoin de normaliser les méthodes, afin de permettre des recherches entre les
divers systèmes.
- Les documents visuels par rapport à la bibliothéconomie et l'archivistique
(une classification arbitraire) :
- NB: pour fins de repérage dans des
documents textuels, on ne s'occupe pas du document à son état
de manuscrit. Par contre, la catégorie «Éléments de
produits potentiels» est probablement le plus grand centre d'activité
pour l'indexation des images en mouvement en archivistique;
- On cherche des images afin de créer des documents, alors qu'on
ne s'adresse pas à une base de données de mots pour
rédiger un texte (bien qu'on consulte des dictionnaires, etc.);
- Le fait qu'il n'y ait pas d'alphabet indique donc une différence
fondamentale dans la problématique de l'indexation entre le texte et les images.
(c.à.d. créés à partir d'un objectif)
- L'ensemble des problèmes de repérage associés à ce genre de
documentation se distingue de façon importante des problèmes
associés aux livres, ou même à la peinture ou autres
documents visuels chirographiques;
- Les tableaux dans les collections ont habituellement un auteur et un
titre, ou leurs équivalents;
- Pour le chercheur dans une collection photographique, le photographe
importe peu, sauf exception (par ex. photographies d'art);
- Les collections photographiques ressemblent plus aux collections
d'archives qu'aux collections de bibliothèques. Est-ce la peine de
cataloguer chaque item?
- À des fins informatiques, les modèles de
représentation de l'image en mouvement doivent être beaucoup
plus complexes que ceux employés pour représenter les livres
(O'Connor 1985);
- Bien qu'il y ait typiquement plusieurs avenues d'accès aux
données relatives aux collections de photos, de films, et de
vidéos, la recherche par matières est de loin la
méthode la plus employée par les usagers;
- Comme on verra, la recherche par matières n'est pas
nécessairement la plus efficace;
- Bien que les livres et les peintures soient classés par leur
sujet d'ensemble («aboutness»), un niveau plus primaire
(«ofness») est plus utile et plus approprié pour
l'indexation des photos «ordinaires» ou des chutes de film.
Cependant, il y a lieu de revoir cette pratique à la lumière
des nouvelles technologies;
- Ainsi, les techniques d'indexation pour donner accès par
matières aux collections d'images «ordinaires» ont rapport
à l'assignation de noms aux objets ou aux événements
proéminents dans l'image visuelle;
- En principe, le fait de tout simplement nommer ce que l'on voit dans
l'image pour l'indexer devrait simplifier les choses, mais ce n'est pas le
cas;
- Il y a un lien inévitable entre le texte et l'image, et il
y a le «problème du vocabulaire» (Furnas et al. 1987).
- Parfois on prône des systèmes qui n'utiliseraient que de
l'image pour en trouver d'autres images : par ex. on dessine un petit
chien et le système nous trouve des images de chiens;
- Ou encore : dans le système on repère une image utile,
et ensuite on demande au système de nous en trouver d'autres
semblables;
- Il reste que le plus «naturel» c'est une requête en forme de
mots : par ex., "je cherche des images de chiens" ;
- Aussi, il faudrait être capable de dessiner un chien qui a
l'air d'un chien;
- L'idéal, c'est probablement la possibilité d'employer
les deux approches (dictionnaire ou thésaurus visuel plus texte);
- N.B. : En ce qui concerne les images fixes, la représentation
textuelle est moins importante (O'Connor 1988, 208-209), bien que
souvent nécessaire (Wright 1981, 131); en ce qui concerne les images en
mouvement, la représentation textuelle est incontournable, essentielle
(Turner 1994, 34-38);
- Des études de choix spontanés de mots pour désigner divers
objets démontrent qu'une variété surprenante de mots
est employée pour désigner une même chose (par ex. Furnas et
al. 1987);
- Pour expérimenter le problème:
- Sur un morceau de papier, écrivez le nom que vous donneriez à un système
informatique qui décrirait des activités d'intérêt dans un grand centre métropolitain.
Par exemple, un tel système offrirait des suggestions d'activités de divertissement en ville, un
samedi soir. Le nom du système doit être d'un maximum de 10
caractères.
Essayez de trouver un nom bien évident, auquel d'autres
personnes penseraient aussi.
- Comparez votre réponse à celle de votre voisin. Les réponses sont-elles identiques?
- Furnas et al. ont demandé à plus de 2000 personnes de faire cette
exercice, pour ensuite les mettre en paires de façon aléatoire. Seulement une dizaine
de paires ont trouvé à s'accorder;
- En utilisant ce modèle de recherche, on apprend que moins de 10 personnes
sur 1000 (ou environ 1%) auraient pu accéder directement au logiciel si
leur partenaire avait choisi le nom du logiciel.
- Au coeur du problème: la possibilité de plusieurs noms
pour un objet. Chaque personne ne pense qu'à un nom ou qu'à quelques noms;
- À cause de ça, on a tendance à surestimer nos choix, les trouvant évidents;
- On finit quand même par surmonter le problème. Dans beaucoup d'études concernant
la distribution de mots (par ex. Furnas et al., 1983), dans beaucoup de domaines
et pour beaucoup de types de données, l'emploi de mots a tendance à
ressembler à la distribution de Zipf, c.à.d. que peu de mots sont
employés fréquemment, beaucoup de mots ne sont employés qu'une
seule fois, et la plupart des cellules ont la valeur «zéro»;
TERME | Plan 1 | Plan 2 | Plan 3 | Plan 4
|
---|
arbre | 0 | 0 | 3 | 0
|
CKAC | 0 | 0 | 0 | 1
|
cuisine | 0 | 1 | 0 | 0
|
discussion | 0 | 0 | 0 | 4
|
drapeau | 24 | 0 | 0 | 0
|
esquimau | 0 | 2 | 0 | 0
|
famille | 0 | 2 | 0 | 0
|
hommes | 0 | 0 | 0 | 3
|
Inuit | 0 | 14 | 0 | 0
|
manger | 0 | 5 | 0 | 0
|
oiseau | 0 | 0 | 22 | 0
|
OTAN | 2 | 0 | 0 | 0
|
radio | 0 | 0 | 0 | 12
|
réunion | 0 | 0 | 0 | 8
|
vent | 1 | 0 | 1 | 0
|
[espèce] | 0 | 0 | 3 | 0
|
- Ainsi, on finit par extraire les termes utiles pour l'indexation. Il y a des
indications qu'il serait relativement facile de dériver automatiquement
des index pour l'image fixe et en mouvement, à partir de leurs représentations
textuelles (Turner 1995);
- Un autre aspect du problème : chaque mot peut référer à plusieurs objets.
Sont-ils tous des bons? Par exemple : bouchon, le système
a besoin de savoir dans quel sens du mot?
- On ne peut pas concevoir le stockage et repérage
sans texte accompagnateur;
- Le fait que le visionnement ait lieu dans le
temps fait qu'on n'a pas la liberté de parcourir l'image,
comme c'est le cas avec l'image fixe;
- Le son est d'une grande importance, peut-etre la moitié de l'expérience;
- L'archiviste a besoin d'être formé en techniques de production pour pouvoir
faire son travail;
- Les RDDA ne vont pas assez loin en ce qui concerne
les besoins d'archives d'images «stock», les archives de télévision et de film,
parce que celles-ci ont besoin d'être traitées au niveau du plan, c.à.d. qu'un plan=une notice
dans la base de données;
- Ainsi, inévitablement on parle de multimédia, ce qui nous indique le type
de systèmes de gestion qu'il faut pour ce type d'archives.
- Tout avance à grands pas dans l'informatisation et la numérisation
des données de toutes sortes;
- Pour l'image fixe, il existe maintenant des systèmes performants qui permettent
de voir l'image à même la base de données, même plusieurs à la fois;
- Pour l'image en mouvement ceci n'est pas encore possible. Voici pourquoi :
- Une image de 1 bit (donc noir et blanc, pas de tons de gris) à résolution
100 dpi 20cm x 25cm (=8x10 po) : 800 Ko;
- Une image de 128 bits à résolution 1200 dpi 20cm x 25cm (= 8x10) = 14 745 600 000 d'octets
= presque 15 gigaoctets (= 15 000 Mo);
- En vidéo : 30 images/sec = 450 gigaoctets / seconde !!!;
- Calcul rapide à l'ONF pour les «stockshots» : il faudrait 200 robots contenant chacun 50 vidéodisques et reliés
à une même base de données pour gérer l'image en
format analogique;
- Puisque cette situation n'est pas à la
veille de changer (bien qu'on ne sait jamais), il vaut mieux mettre nos
efforts actuels dans des structures de données pour l'image en
mouvement et dans la création de la méta-information, laquelle est
nécessaire de toute façon pour gérer le reste;
- Éventuellement, la technologie va nous rattraper. Ne perdons pas de temps à travailler
pour l'ordinateur; il va pouvoir travailler pour nous éventuellement.
- Comme avec d'autres types de documents, on
veut bien se servir de vocabulaire contrôlé pour exprimer les
concepts d'indexation;
- De nombreuses clés d'accès
sont d'une importance particulière pour l'image en mouvement :
vu le niveau élémentaire de la description au niveau du plan, on
peut se trouver avec un grand ensemble de plans à visionner;
- À l'aide des clés d'accès autre que l'indexation par
sujet, on peut éliminer un grand nombre de plans de notre sélection;
- Quelques clés importantes : les angles de caméra, la
couleur, les périodes de temps, l'espace géographique;
- Les angles de caméra : le point de vue de la caméra (c.à.d. l'angle
d'approche vers l'objet photographié) est souvent important
pour le chercheur. Par exemple, «j'ai besoin d'images de
Trois-Rivières, mais des images prises d'un avion seulement».
Ou encore, «j'ai besoin d'une image de Bernard Landry, mais il
faut que ce soit un gros plan»;
- Pour ceci, il est utile d'employer une terminologie normalisée,
par ex. le Glossaire publié par l'ONF
(1984). Cependant, si vous avez des besoins particuliers reliés à
votre collection, vous pouvez soit modifier un lexique existant, soit construire
de toute pièce votre propre vocabulaire;
- La couleur : Dans certains cas la couleur peut être un point d'accès très
important, par exemple un musée des arts décoratifs, ou les
archives d'un designer de mode;
- On peut aussi vouloir employer la couleur afin d'éliciter de l'émotion, par exemple «il
me faut un objet rouge comme le sang et qui occupe les trois-quarts de l'image»;
- Une fois que les ordinateurs acquierent l'intelligence requise pour
identifier des objets et pour les indexer, ils seraient aussi capables de
chercher par la couleur associée à un objet (par ex. un chat gris,
une auto rouge). Il est déjà facile pour un ordinateur de calculer
la proportion d'espace qu'occupe une couleur dans une image;
- Les périodes de temps : c'est un point critique dans beaucoup de
situations. Par exemple, «j'ai besoin de scènes de rues de
Montréal des années 1940». Ou encore : «il me faut des
plans d'autos des deux ou trois dernières années»;
- Les tables de la Classification décimale universelle sont très utiles
pour l'expression de ce genre de concept. Par exemple :
19 | 20e siècle
|
194 | les années 1940
|
1945 | 1945
|
1945 11 15 | le 15 novembre 1945
|
1945 11 15 22:35:17 | le 15 novembre 1945 à 22h35 + 17 sec.
|
- Ces tables permettent aussi des concepts comme «automne», «crépuscule», etc.;
- Avec les images fixes et surtout en mouvement, le système
doit probablement tenir compte du temps réel (c.à.d. la date de
tournage) et aussi du temps représenté (par ex. un film est tourné
en 1996 mais l'action a lieu dans les années 1940);
- L'espace géographique : comme pour les périodes temporelles, dans bien des
situations ce point d'accès peut être critique. Par exemple,
pour répondre à une demande pour des plans des rues de Québec
dans les années 1940, il faut comprendre que le seul endroit où on
peut avoir tourné ces plans c'est Québec;
- Pour l'espace géographique, les tables de la CDU constituent un vocabulaire contrôlé
fort utile pour l'expression de ce genre d'information. Par exemple :
7 | l'Amérique du Nord
|
71 | le Canada
|
714 | le Québec
|
714.541 | Montréal
|
714.541*H3T | campus de l'Université de Montréal
|
714.541*H3T 1N8 | pavillon Lionel-Groulx
|
- Ainsi on peut exprimer des concepts géographiques de façon très précise
ou encore de façon générale, en employant la troncature;
- Les tables de la CDU tiennent compte aussi du fait que les traits géographiques
traversent souvent les frontières politiques. Par exemple :
23 | les montagnes
|
234 | les montagnes de l'Europe
|
234.2 | montagnes de la France et de la Belgique
|
234.24 | le Massif central
|
234.242 | montagnes de la région de l'Auvergne
|
- Bien sûr, d'autres vocabulaires existent
pour exprimer des concepts géographiques (par ex., les sous-divisions géographiques
des vedettes-matière de la Library of Congress). Mais une classification
est nettement avantageuse;
- N.B. : comme pour l'encodage de périodes
temporelles, on peut avoir besoin de distinguer le lieu de tournage de l'endroit
représenté.
- Autres points d'accès :
- l'émotion, qui peut être fort utile comme point d'accès dans certaines
situations. Toutefois, c'est assez subjectif;
- l'éclairage, par ex. des plans tournés à l'intérieur ou à l'extérieur,
un plan très clair ou plutôt obscur, ou avec beaucoup d'ombres,
ou aucune;
- la texture, par ex. des plans un peu flous, ou encore très
nettes, ou des images avec beaucoup de grain, et ainsi de suite;
- Autres conditions spéciales : des plans tournés en-dessous de l'eau,
par des appareils détecteurs de chaleur, pris de l'espace, sur film
infra-rouge.
- Il faut normaliser le plus possible les méthodes
de travail, les structures de données et les vocabulaires contrôlés,
afin de favoriser les échanges de données à travers les réseaux;
- Il ne faut pas accepter que les normes nous empêchent d'employer
la meilleure façon possible d'organiser nos collections;
- Matière à réflexion : il faudrait peut-être imposer l'ordre après
coup, plutôt que de le planifier à l'avance (le modèle
World Wide Web plutôt que les modèles traditionnels en bibliothéconomie,
archivistique, muséologie).
- Il y a encore beaucoup de
travail à faire avant que l'on puisse considérer que nos
collections d'images en mouvement soient bien organisées;
- Les méthodes normalisées pour l'archivage de l'image en
mouvement au niveau du plan sont à établir, bien que pour des
produits plus complets ou pour des fonds complets on peut employer les RDDA;
- En attendant que les ordinateurs soient plus performants, on ne perdra point notre
temps à investir dans la création de méta-données.
Furnas, G.W., T.K. Landauer, L.M. Gomez, and S.T. Dumais. 1983. Statistical
semantics: analysis of the potential performance of key-word information
systems. The Bell System Technical Journal 62:6 (July-August), 1753-1806.
Furnas, G.W., T.K. Landauer, L.M. Gomez, and S.T. Dumais. 1987. The vocabulary
problem in human-system communication. Communications of the ACM 30:11 (November
), 964-971.
Hancock, Micheline. 1987. Subject searching behaviour at the
library catalogue and at the shelves: implications for online interactive
catalogues. Journal of Documentation 43:4 (December), 303-321.
O'Connor, Brian C. 1985. Access to moving image documents: background concepts and proposals for
surrogates for film and video works. Journal of Documentation 41:4 (December),
209-220.
O'Connor, Brian. 1988. Fostering creativity: enhancing the
browsing environment. International Journal of Information Management 8: 203-210.
Office national du film du Canada = National Film Board of Canada. 1983.
Glossaire = Glossary. Recherche et développement = Research and
Development. Montréal.
Ohlgren, Thomas. 1981. Subject indexing of art works. In Computerized inventory
standards for works of art, ed. Raymond Vézina, 73-78. Montréal: Fidès.
Turner, James. 1994. Determining the subject content of still and moving image documents for storage and retrieval:
an experimental investigation. PhD thesis, University of Toronto.
Turner, James, 1995. Comparing user-assigned terms with indexer-assigned terms for storage and retrieval of moving images. Actes du congrès de l'ASIS Chicago 1995.
Williamson, Nancy J. 1985. Classification in online systems: research and the
North American perspective. International Cataloguing 14:3 (July-September),
29-31.
Wright, Richard M. 1981. Arrangement and indexing. In Picture Librarianship, ed.
Helen P. Harrison, 131-149. Phoenix, AZ: Oryx Press.
Menu principal |
Site de l'EBSI |
Commentaires
Autre conférence