La vision artificielle dans le proche infrarouge

Dominique Bertrand
INRA, PHYTEC, Rue de la Géraudière
B.P. 71627, 44316 Nantes CEDEX 3 FRANCE
Tél : 02 40 67 51 05.


Le développement de systèmes de vision artificielle capables d'enregistrer des séquences d'images dans le proche ou le moyen infrarouge est un thème de recherche en pleine croissance. La vision artificielle multispectrale devrait permettre d'analyser les échantillons en chaque point de la surface visible. Il serait alors possible de caractériser l'hétérogénéité des produits et de détecter des défauts locaux à la surface des échantillons. Dans un système de vision artificielle, chaque image associée à une condition spectrale est numérisée est mise sous la forme d'une matrice. Chaque élément de cette matrice, appelé niveau de gris, est un nombre proportionnel à l'intensité lumineuse du point (ou pixel ) correspondant. Sur des systèmes de vision artificielle habituels, ces matrices comprennent plusieurs centaines de lignes et de colonnes. Elles sont typiquement de dimensions 1024 x 1024 ou 2048 x 2048. Les niveaux de gris sont souvent codés sur 8 bits, ce qui permet de disposer de 256 niveaux d'intensité lumineuse. Le noir est souvent codé par la valeur 0, et le blanc par 255.

Les premiers travaux dans le domaine de la vision artificielle dans le proche infrarouge (PIR) ont été effectués par Taylor et MacClure (1989). Un dispositif utilisé par ces auteurs est présenté figure 1. Les échantillons sont éclairés par des lampes à filament de tungstène. Des filtres interférentiels placés devant la caméra permettent de sélectionner les longueurs de la lumière réfléchie. Il est ainsi possible d'acquérir des séquences d'images du même échantillon, correspondant à différentes conditions spectrales. Une application de ce système a été la robotisation de la mise en germination de graines dans des serres. En effet, les places dans les serres sont limitées et il est nécessaire de les utiliser au mieux. Le taux de germination des graines varie entre 70 et 95 pour cent, et il est utile de remplir les places libres correspondant à des grains qui n'ont pas germé. Taylor et MacClure ont participé au développement d'un robot, mettant en œuvre la vision artificielle, destiné à transférer des plants d'une cellule à une autre. Dans les premières étapes du projet, les plants ont été identifiés par une caméra travaillant dans le visible. Ils apparaissaient comme des taches blanches sur le sol. Le taux d'erreurs d'identification était élevé, et compris entre 7 et 18 pour cent. Dans une autre série d'essais, ces auteurs ont exploité deux conditions spectrales, de manière à identifier la présence de chlorophylle, qui donne un pic d'absorption dans le visible à 670 nm. L'absorption à 800 nm sert de référence. La différence des images prises à ces deux longueurs d'onde est très pertinente pour le problème considéré. En exploitant cette différence, le taux d'erreurs d'identification n'est plus que de 2 pour cent. Taylor et MacClure ont également montré les possibilités offertes par la vision artificielle multispectrale pour caractériser l'état de santé de feuilles de différentes plantes. La différence des images enregistrées à 800 et 670 nanomètres (nm) permet de " cartographier " la chlorophylle dans les feuilles de Magnolia. De la même manière, la différence des images à 800 nm et à 990 nm rend possible d'identifier les parties de feuilles de tabac qui sont endommagées ou malades. Des tentatives de détection de l'eau ont également été menées. La différence des images à 910 et 960 nm semble appropriée pour cette détection.

Robert et al. (1991) ont également construit un système de vision artificielle PIR (figure 2). La source lumineuse est une lampe à filament de tungstène dont le spectre s'étend de 340 à 2000 nm. Un monochromateur à réseau permet la sélection des longueurs d'onde lumineuse. La caméra PIR est ici équipée d'un tube Vidicon et est sensible jusqu'à 2000 nm. Le système est réglé de manière à enregistrer des séquences d'images entre 900 et 1900 nm, avec un pas de 50 nm. Pour tester le système, les auteurs ont tenté de discriminer des constituants isolés du blé (Robert et al., 1992). L'essai porte sur du son, du gluten et de l'amidon de blé mis sous la forme de granulés et placés séparément sous la caméra. Le fond de la coupelle est formé de céramique en poudre, non-absorbante dans le PIR. Chaque échantillon est ainsi caractérisé par 21 images numériques, comprenant 256 lignes et 256 colonnes. Un pixel de l'image est lui-même représenté par un vecteur de 21 niveaux de gris. Sur un petit nombre de pixels qui servent de collection d'apprentissage, on applique une analyse discriminante pas à pas, avec comme objectif de classer ces pixels en fonction de leurs 4 natures qualitatives (son, gluten, amidon, céramique). Ceci permet de sélectionner les longueurs d'onde qui ont un pouvoir discriminant et d'établir le modèle prédictif. L'analyse discriminante est appliquée sur des images n'ayant pas servi à l'étalonnage. Chaque pixel peut alors être représenté par une couleur arbitraire associée à chaque groupe qualitatif. En utilisant 7 longueurs d'onde (dans l'ordre de leur introduction: 950, 1500, 1450, 1000, 1600 et 900 nm) les erreurs de classifications sont très faibles: l'amidon et le son sont identifiés sans erreur. Cinq pour cent des pixels associés à la céramique, et 10 pour cent de ceux correspondant au gluten sont incorrectement identifiés. Les bases statistiques de la discrimination appliquée à des images multispectrales ont été décrites par Bertrand et al. (1996).

Park et al. (1995) ont développé un système d'analyse d'images mutispectrales destiné à automatiser l'inspection des carcasses de volailles dans les abattoirs. La caméra CCD est équipée de 6 filtres interférentiels à 542, 571, 641, 700, 720 et 847 nm. Les images comprennent 752 lignes et 480 colonnes, et les niveaux de gris sont codés sur 8 bits. Les essais de validation portent sur 28 carcasses de poulets jugées normales, 24 cadavériques et 24 septicémiques. Les carcasses de poulet sont placées devant la caméra et éclairées en lumière diffuse par deux lampes à filaments de tungstène. Parallèlement à cette caractérisation par vision artificielle, une mesure spectrale entre 500 et 1000 nm est également effectuée sur chaque carcasse. Les auteurs tentent de prédire la qualité des carcasses, soit en n'utilisant qu'un seul de leur dispositif de mesure (spectromètre ou vision artificielle) soit en combinant ces deux méthodes. De plus, les tentatives de classification portent soit sur 3 classes de qualité des carcasses (normal, cadavérique et septicémique), soit sur seulement 2 classes (normal ou anormal). La méthode de classification repose sur les réseaux neuronaux. Dans tous les cas, les résultats ne sont suffisamment fiables que lorsqu'on combine les deux systèmes, en ne distinguant que deux classes de qualité. Avec cette combinaison, les carcasses identifiées comme normales font bien partie de ce groupe. Seules les carcasses jugées anormales par le système doivent être examinées par des inspecteurs qualifiés. Les auteurs estiment que des essais complémentaires sont encore nécessaires pour valider le système.

Treado et al. (1992) ont combiné un dispositif AOTF (Acoustico-optic tunable filter, ou filtres photo-acoustiques modulables) avec un système d'analyse d'images. Dans leurs essais, la lumière sélectionnée par le dispositif AOTF est dirigée sur l'échantillon, placé sous l'oculaire d'un microscope. Une caméra CCD refroidie permet d'enregistrer des séquences d'images de 128 x 128 pixels. Le champ utile de la caméra est voisin de 100 µm. Les auteurs utilisent le système pour l'étude de cellules épithéliales humaines.

Le développement de la vision artificielle dans le PIR est actuellement limité par plusieurs facteurs. Tout d'abord la plage spectrale de sensibilité des caméras CCD ordinaires ne couvre pas toute la région du PIR, et s'étend seulement de 400 à 1100 nm. La numérisation se fait souvent sur 8 bits, ne donnant que 256 niveaux de gris. Des caméras plus perfectionnées possèdent une plus grande résolution avec un codage des niveaux de gris sur 12 ou même 16 bits, mais elles restent très onéreuses. Le bruit de la mesure spectrale est considérablement plus élevé que celle des spectromètres PIR habituels. Il atteint (avec des caméras non-refroidies) 500 x 10-6 à 1000 x 10 -6 unités de densité optique, tandis qu'un spectromètre ordinaire présente un bruit de seulement 20 x 10 -6 unités. Pour traiter les images, il est nécessaire de disposer d'ordinateurs puissants, et les algorithmes adaptés aux images mutispectrales sont encore du domaine de la recherche.

 



Figure 1 : Vision artificielle multispectrale.
(McClure, 1994).

Figure 2 : Diagramme d'un système de vision artificielle
(Robert et al., 1991).

 

REFERENCES BIBLIOGRAPHIQUES

Bellon-Maurel V, Guizard C, Vigneau JL, Bertrand D. Camera for near infrared spectroscopy. In : Davies A.M.C and Williams P (1996). Near Infrared Spectroscopy: the future waves. NIR publications, Chichester, UK, 72-90.

Bertrand D, Robert P, Novales B, Devaux M. Chemometrics of multichannel imaging.
In : Davies A.M.C and Williams P (1996). Near Infrared Spectroscopy: the future waves. NIR publications, Chichester, UK, 72-90.

Guizard C, Bellon V, Sévila F. (1992). Vision artificielle dans les industries agro-alimentaires. Méthodes / Techniques / Choix. CEMAGREF-DICOVA, Antony.

Park B, Chen YR, Huffman RW . Integration of visible/NIR spectroscopy and multispectral imaging for poultry carcass inspection. In Meyer GE, DeShazer JA (1994). Optics in Agriculture, Forestry, and Biological Processing, Proc SPIE 2345,Washington, 162-171.

Robert P, Bertrand D, Devaux MF, Sire A (1992). Identification of chemical constituents by multivariate near infrared spectral imaging. Analytical Chemistry, 64: 664-667.

Robert P, Devaux MF, Bertrand D (1991). Near Infrared video image analysis. Science des aliments, 11: 565-574.

Taylor SK, McClure WF. NIR imaging spectroscopy: measuring the distribution of chemical components. In : Iwamoto M, Kawano S Eds (1989). The proceedings of the international near infrared spectroscopy conference. Koring publishing, Tokyo, 393-404.

Treado PJ, Levin IW, Lewis EN (1992). Near-Infrared Acoutisco-optic filtered spectroscopic microscopy: a solid-state approach to chemical imaging. Applied Spectroscopy, 46(4) : 553-559.

retour page d'accueil