Les applications chemiometriques a l’analyse quantitative des systèmes multicomposantes relèvent dans les derniers ans beaucoup d’intérêt. L’avantage principal est surtout dans la possibilité d’utiliser simultanément une très grande quantité de données par des opportunes algorithmes. Les méthodes chemiometriques se basent sur l’acquisition simultanée de beaucoup de signaux (variables), en les combinant dans un modèle multivarié, qui viendra, en suite, utilisé pour surveiller des ultérieurs objets d’analyse. Le balai de ce travail consiste dans établir des modèles de classification multivariée pour le contrôle analytique d’un élevé nombre de sources d’eau situées à sud de Paris. À tel balai on a utilisées deux méthodiques de chemiometrie entre des plus diffuses: Analyse de Cluster et Classification. La construction des méthodes a été exécutée avec le software dédiés "MINITAB 14®", (Minitab Inc.) et "THE UNSCRAMBLER 9.2®", (Camo Process As). L’ensemble des objets est composé de 69 sources d’eau chacune décrite de 9 paramètres analytiques (escherichia coli, entérocoques, température, turbidité, conductivité à 25°C, titre alcalimétrique complet, chlorure, sulfate, nitrate, nitrite, titre hydrotimétrique) relatifs à des analyses effectuées en 2004. Dans une première phase on a effectué la distribution dans cluster en appliquant à la matrice de données des objets l’algorithme défini Single Linkage [ skf = max (sks, skt) ], en utilisant comme discriminatoire le calcule de la Distance Euclidienne entre les objets. Pour examen de la similarité on a définies 5 classes, chacune composée d’un nombre variable d’objets. Dans une seconde phase on a construit un modèle multivarié, en soumettant la matrice des données d’origine à l’algorithme de régression PLS1 (Partial Least Squares). Le modèle a été optimisé et validé. En dernière phase, le modèle élaboré a été appliqué à une nouvelle matrice de données, relatifs aux analyses effectuées dans 2005. Il a été possible mettre en évidence les sources qui, avec passer du temps, sont restées à l’intérieur du cluster d’origine, et celles qui ont été classifiés dans un autre cluster suite à varier de ses paramètres analytiques.
ANALYSE DE CLUSTER ET CLASSIFICATION CHEMIOMETRIQUE DES EAUX AU SUD DE PARIS
IOELE, Giuseppina;RAGNO, Gaetano;DE LUCA M;
2005-01-01
Abstract
Les applications chemiometriques a l’analyse quantitative des systèmes multicomposantes relèvent dans les derniers ans beaucoup d’intérêt. L’avantage principal est surtout dans la possibilité d’utiliser simultanément une très grande quantité de données par des opportunes algorithmes. Les méthodes chemiometriques se basent sur l’acquisition simultanée de beaucoup de signaux (variables), en les combinant dans un modèle multivarié, qui viendra, en suite, utilisé pour surveiller des ultérieurs objets d’analyse. Le balai de ce travail consiste dans établir des modèles de classification multivariée pour le contrôle analytique d’un élevé nombre de sources d’eau situées à sud de Paris. À tel balai on a utilisées deux méthodiques de chemiometrie entre des plus diffuses: Analyse de Cluster et Classification. La construction des méthodes a été exécutée avec le software dédiés "MINITAB 14®", (Minitab Inc.) et "THE UNSCRAMBLER 9.2®", (Camo Process As). L’ensemble des objets est composé de 69 sources d’eau chacune décrite de 9 paramètres analytiques (escherichia coli, entérocoques, température, turbidité, conductivité à 25°C, titre alcalimétrique complet, chlorure, sulfate, nitrate, nitrite, titre hydrotimétrique) relatifs à des analyses effectuées en 2004. Dans une première phase on a effectué la distribution dans cluster en appliquant à la matrice de données des objets l’algorithme défini Single Linkage [ skf = max (sks, skt) ], en utilisant comme discriminatoire le calcule de la Distance Euclidienne entre les objets. Pour examen de la similarité on a définies 5 classes, chacune composée d’un nombre variable d’objets. Dans une seconde phase on a construit un modèle multivarié, en soumettant la matrice des données d’origine à l’algorithme de régression PLS1 (Partial Least Squares). Le modèle a été optimisé et validé. En dernière phase, le modèle élaboré a été appliqué à une nouvelle matrice de données, relatifs aux analyses effectuées dans 2005. Il a été possible mettre en évidence les sources qui, avec passer du temps, sont restées à l’intérieur du cluster d’origine, et celles qui ont été classifiés dans un autre cluster suite à varier de ses paramètres analytiques.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.