Retour

S. Tollari et H. Glotin, Sélection adaptative des dimensions de l'indexation visuelle d'images mal annotées en fonction du mot recherché, Ingénierie des Systèmes d'Information (RSTI-ISI), Numéro Spécial "Passage à l'Echelle", Hermès, Vol. 11/4, pages 55 à 80, novembre 2006

Résumé :

La construction de modèles de concepts visuels généralistes est difficile, parce que les grandes bases d'images ne sont pas annotées localement pour chaque concept qu'elles contiennent. Ceci invalide les méthodes classiques d'optimisation de l'espace visuel à grande dimension. Pour améliorer la recherche et l'indexation d'images réalistes mal annotées, nous proposons deux méthodes de sélection des traits visuels les plus discriminants pour chaque mot-clé : l'approximation de l'analyse discriminante linéaire (ALDA) et l'approximation de la diversité marginale maximale (AMMD). De plus, nous dérivons par entropie les traits d'hétérogénéité H des 40 traits visuels classiques U. Pour chaque mot, nous réduisons par combinaison, puis sélection, les espaces visuels. Nous démontrons, par classification non supervisée sur 10K images de COREL et 50 mots, la complémentarité des informations visuelles U et H, et que l'on peut réduire l'indexation visuelle de 79 % tout en améliorant la classification de +69 %. Le passage à l'échelle de ces méthodes est discuté.

Abstract:

The construction of generic visual concept models is difficult, because the great image databases are not well labeled. This invalidates the traditional optimzation methods for the high dimensional visual space. In order to enhance image search and index system we propose novel visual features based on entropy analysis, and two methods to reduce the features space allowing to estimate the most discriminant visual features for a given keyword. We approximate LDA or MMD on real misslabled image databases. Then, we use a non supervised clustering algorithm to build visual clusters, using all the features of the visual space, or several subspaces made up with the most discriminant features depending of each keyword. Results on COREL show classification enhancement of 69 \% while reducing the number of dimensions by 79 \%. The collections size impacts for our methods are discussed.

Mots clés :

indexation multidimensionnelle d'images, LDA, MMD, hétérogénéité, classification.

Keywords :

high dimensional image indexing, LDA, MMD, heterogeneity, clustering.

@article{TG2006ISI,
 	author = {S. Tollari and H. Glotin},
 	title = {S\`election adaptative des dimensions de l'indexation visuelle d'images mal annot\'ees
	         en fonction du mot recherch\'e},
 	journal = {Ing\'enierie des Syst\`emes d'Information (RSTI-ISI)},
	pages={55-80},
	month={novembre},
 	year = {2006},
 }
 
 
Retour