Method Article
Le protocole décrit une méthode de prévision de la concentration d'o-cresol pendant la production de l'éther de polyphénylène utilisant la spectroscopie proche infrarouge et la régression partielle de moins de carrés. Pour décrire le processus plus clairement et complètement, un exemple de prédiction de la concentration d'o-cresol pendant la production de polyphénylène est utilisé pour clarifier les étapes.
Contrairement aux variables de processus macroscopiques, la spectroscopie proche infrarouge fournit des informations sur les processus au niveau moléculaire et peut améliorer considérablement la prédiction des composants dans les processus industriels. La capacité d'enregistrer des spectres pour les échantillons solides et liquides sans aucun prétraitement est avantageuse et la méthode est largement utilisée. Cependant, les inconvénients de l'analyse des données spectrales à infrarouge proche de haute dimension comprennent la redondance de l'information et la multicollinedes des données spectrales. Ainsi, nous proposons d'utiliser la méthode partielle de régression des moindres carrés, qui a traditionnellement été utilisée pour réduire la dimensionnalité des données et éliminer la collinearité entre les caractéristiques d'origine. Nous mettons en œuvre la méthode pour prédire la concentration d'o-cresol pendant la production de l'éther de polyphénylène. L'approche proposée offre les avantages suivants par rapport aux méthodes de prédiction de régression des composants : 1) la régression partielle des moindres carrés résout le problème de multicollinerité des variables indépendantes et évite efficacement le surajustement, qui se produit dans un l'analyse de régression due à la forte corrélation entre les variables indépendantes; 2) l'utilisation des spectres proche infrarouge entraîne une grande précision parce qu'il s'agit d'une méthode non destructive et non polluante pour obtenir de l'information à des échelles microscopiques et moléculaires.
La spectroscopie infrarouge proche (NIR) a été largement acceptée en tant que technologie d'analyse moderne rapide, efficace, non destructive et non polluante; la méthode a été utilisée au cours des dernières années pour la détection et l'analyse de la qualité des produits et la mesure des composants chimiques dans les procédés industriels. La spécialité la plus essentielle de la méthode est sa capacité à enregistrer des spectres pour les échantillons solides et liquides sans aucun pré-traitement, ce qui rend NIRS particulièrement adapté à la détection directe et rapide et l'analyse des produits naturels et synthétiques1,2. Contrairement aux capteurs traditionnels qui mesurent les variables du processus (p. ex. température, pression, niveau de liquide, etc.) à une échelle macroscopique et subissent inévitablement le bruit extérieur et l'interférence de fond, le NIRS détecte les informations structurelles de la composition chimique à des échelles microscopiques et moléculaires. Ainsi, l'information essentielle peut être mesurée avec plus de précision et de efficacité qu'avec d'autres méthodes3,4.
L'éther de polyphényle, comme l'un des plastiques d'ingénierie, sont largement employés en raison de sa résistance à la chaleur, retardant la flamme, isolation, propriétés électriques, stabilité dimensionnelle, résistance d'impact, résistance de fluage, force mécanique et d'autres propriétés5. Plus important encore, il est non toxique et inoffensif par rapport à d'autres plastiques d'ingénierie. À l'heure actuelle, 2,6-xylenol est l'une des matières premières de base pour la synthèse de l'éther de polyphénylène, et il est généralement préparé par alkylation catalysée du phénol avec la méthode de méthanol6. Il existe deux produits principaux de cette méthode de préparation, o-cresol et 2,6-xylenol. Après une série d'étapes de séparation et d'extraction, 2,6 xylenol est utilisé pour produire de l'éther de polyphénylène. Cependant, des quantités infimes d'o-cresol demeurent dans 2,6-xylenol. O-cresol ne participe pas à la synthèse de l'éther de polyphénylène et restera dans le produit d'éther de polyphénylène, ayant pour résultat une diminution de la qualité du produit ou même de la qualité inférieure. À l'heure actuelle, la plupart des entreprises analysent encore les compositions de mélanges organiques complexes tels que les produits d'éther de polyphényle de phase liquide contenant des impuretés (p. ex., o-cresol) par analyse de séparation physique ou chimique comme la chromatographie7,8. Le principe de séparation de la chromatographie est l'utilisation du mélange des compositions dans la phase fixe et la phase de flux dans la dissolution, l'analyse, l'adsorption, la desorption ou toute autre affinité des différences mineures dans la performance. Lorsque les deux phases se déplacent l'une par rapport à l'autre, les compositions sont séparées par les actions ci-dessus à plusieurs reprises dans les deux phases. Selon l'objet, il faut généralement quelques minutes à quelques dizaines de minutes pour effectuer une opération complexe de séparation des matériaux. On peut voir que l'efficacité de mesure est faible.
Aujourd'hui, la mesure de la qualité du produit et la technologie de contrôle avancée basée sur cette analyse pour l'industrie moderne des matériaux chimiques de procédé fin est la direction clé pour améliorer davantage la qualité du produit. Dans l'industrie des procédés de production d'éther de polyphényle, la mesure en temps réel de la teneur en o-crésol dans le produit d'éther de polyphénylène est d'une grande importance de développement. L'analyse chromatographique ne peut manifestement pas répondre aux exigences de la technologie de contrôle avancée pour la mesure en temps réel des substances et la rétroaction du signal. Par conséquent, nous proposons la méthode partielle de régression des moindres carrés (PLSR) pour établir un modèle linéaire entre les données NIRS et la concentration o-cresol, qui réalisent la mesure en ligne de la teneur en o-cresol dans le produit d'éther de polyphénylène liquide de sortie .
Le prétraitement du NIRS joue le rôle le plus important avant la modélisation statistique multivariée. Le nombre d'ondes NIRS dans le spectre NIR et la taille des particules des échantillons biologiques sont comparables, de sorte qu'il est connu pour les effets de dispersion inattendus qui ont une influence sur les spectres de l'échantillon enregistré. En exécutant des méthodes de prétraitement appropriées, ces effets sont faciles à éliminer en grande partie9. Les techniques de prétraitement les plus couramment utilisées dans le NIRS sont classées comme la correction de la diffusion et les méthodes dérivées spectrales. Le premier groupe de méthodes comprend la correction de dispersion multiplicative, la tendance, les transformations variates normales standard et la normalisation. Les méthodes de dérivation spectrale comprennent l'utilisation des premier et deuxième dérivés.
Avant d'élaborer un modèle de régression quantitative, il est important de supprimer les variations de dispersion non systématiques des données du NIRS parce qu'elles ont une influence significative sur l'exactitude du modèle prédictif, sa complexité et sa parcimonie. Le choix d'une méthode de prétraitement appropriée doit toujours dépendre de l'étape de modélisation ultérieure. Ici, si l'ensemble de données spectrales NIR ne suit pas la loi Lambert-Beer, alors d'autres facteurs tendent à compenser le comportement non idéal de la prédiction des composants prédits. L'inconvénient de l'existence de tels facteurs inutiles conduit à l'augmentation de la complexité du modèle, même très probablement, une réduction de la robustesse. Ainsi, l'application de dérivés spectrals et une normalisation conventionnelle des données spectrales est une partie essentielle de la méthode.
Après le prétraitement spectral, les données NIRS avec un rapport signal-bruit élevé et une faible interférence de fond sont obtenues. L'analyse Moderne de NIRS fournit l'acquisition rapide de grandes quantités d'absorption sur une gamme spectrale appropriée. La composition chimique de l'échantillon est ensuite prédite en extrayant les variables pertinentes à l'aide de l'information contenue dans la courbe spectrale. En général, NIRS est combiné avec des techniques d'analyse multivariées pour les analyses qualitatives ou quantitatives10. Une analyse multivariée de régression linéaire (MLR) est couramment utilisée pour développer et extraire la relation mathématique entre les données et les composants dans les processus industriels et a été largement utilisée dans l'analyse Du NIRS.
Cependant, il y a deux problèmes fondamentaux lors de la mise en œuvre d'un MLR pour les données NIRS prétraitées. Un problème est la redondance variable. La dimensionnalité élevée des données NIRS rend souvent la prédiction d'une variable dépendante peu fiable parce que les variables sont incluses qui n'ont aucune corrélation avec les composants. Ces variables redondantes réduisent l'efficacité de l'information des données spectrales et affectent l'exactitude du modèle. Afin d'éliminer la redondance variable, il est essentiel de développer et de maximiser la corrélation entre les données Du NIRS et les composants prévus.
Un autre problème est la question de la multicollinearité dans les données Du NIRS. L'une des hypothèses importantes des modèles de régression linéaire multiple est qu'il n'y a pas de relation linéaire entre l'une des variables explicatives du modèle de régression. Si cette relation linéaire existe, il est prouvé qu'il y a multicollinearity dans le modèle de régression linéaire et l'hypothèse est violée. Dans les régressions linéaires multiples, telles qu'une régression ordinaire des moindres carrés (OLSR), les corrélations multiples entre les variables affectent l'estimation du paramètre, augmentent l'erreur du modèle et affectent la stabilité du modèle. Pour éliminer la corrélation multilinéaire entre les données spectrales NIR, nous utilisons des méthodes de sélection variables qui maximisent la variabilité inhérente des échantillons.
Ici, nous proposons d'utiliser le PLSR, qui est une généralisation de la régression linéaire multiple qui a été largement utilisé dans le domaine de NIRS11,12. Le PLSR intègre les fonctions de base du MLR, de l'analyse canonique de corrélation (CCA) et de l'analyse des composants principaux (PCA) et combine l'analyse de prévision avec une analyse de connotation de données non-modèle. Le PLSR peut être divisé en deux parties. La première partie sélectionne les composants des variables caractéristiques et les composants prévus par analyse partielle des moindres carrés (PLS). PLS maximise la variabilité inhérente des composants principaux en rendant la covariance des principaux composants et des composants prévus aussi grand que possible lors de l'extraction des principaux composants. Ensuite, le modèle OLSR de concentration d'o-cresol est établi pour les principaux composants sélectionnés. PLSR convient à l'analyse de données bruyantes avec de nombreuses variables indépendantes qui sont fortement collinear et fortement corrélées et pour la modélisation simultanée de plusieurs variables de réponse. En outre, PLSR extrait l'information efficace des spectres d'échantillon, surmonte le problème de la multicollinearité, et a les avantages d'une forte stabilité et d'une haute précision de prédiction13,14.
Le protocole suivant décrit le processus d'utilisation du modèle PLSR pour mesurer la concentration d'o-cresol à l'aide de données spectrales NIR. La fiabilité et l'exactitude du modèle sont évaluées quantitativement en utilisant le coefficient de détermination (), le coefficient de corrélation de prédiction (
) et l'erreur de prédiction carrée moyenne de la validation croisée (MSPECV). De plus, pour montrer intuitivement les avantages du PLSR, les indicateurs d'évaluation sont visualisés en plusieurs parcelles pour une analyse qualitative. Enfin, les indicateurs d'évaluation d'une expérience sont présentés sous forme de tableau pour illustrer quantitativement la fiabilité et la précision du modèle PLSR.
1. Acquisition de données de spectre NIR avec spectromètre de processus de transformation Fourier (FT)-NIR
2. Pré-traitement des données de spectroscopie NIR
3. Établissement du modèle PLSR
La valeur prévue de l'impureté o-cresol dans les produits d'éther de polyphényle est obtenue par la spectroscopie proche infrarouge basée sur PLSR. La figure 2 et la figure 3 montrent respectivement la fiabilité de la méthode à l'étape de sélection des entités à partir de la courbe du coefficient de décision et du pourcentage d'interprétation des erreurs qui augmente avec le nombre de composants principaux.
Plus précisément, veuillez noter que dans la sélection des principaux composants, afin de minimiser la complexité du modèle, en général, lorsque les deux indicateurs n'augmentent pas de façon significative avec le nombre d'éléments principaux, les principaux éléments suivants avec moins d'information peuvent être écartés. Dans ce document, selon les deux courbes, quand est 0,9917, c'est le seuil pour jeter les composants principaux suivants.
Testez visuellement la précision et la stabilité de la méthode de prévision de la pureté des produits o-cresol au moyen de la figure 4 et de la figure 5. Sur la base de l'ensemble de formation et de l'ensemble d'essai générés par les échantillons d'o-cresol obtenus à partir du champ industriel et de leurs données de spectroscopie proche infrarouge correspondantes, nous avons comparé l'erreur carrée résiduelle et moyenne des valeurs prédites et de référence de la pureté des produits d'éther polyphényle.
Le résidu ici se réfère à la différence entre la valeur de référence de la teneur en o-cresol et l'estimation du modèle PLSR (valeur ajustée). L'utilisation de l'information fournie par les résidus peut nous aider à examiner la rationalité des hypothèses établies du modèle PLSR et la fiabilité de la collecte de données spectrales proche infrarouge. Il est démontré que la méthode PLSR réduit efficacement les résidus à une plage acceptable. En outre, le PLSR a une petite gamme de fluctuation de -0,2 à 0,2, tandis que la plage d'étalonnage est de 42,1063 mg/1 g produit d'éther polyphényle à 51,6763 mg/1 g produit d'éther polyphényle. Les données résiduelles de parcelle nous admettons qualitativement que le PLSR pour la mesure de la teneur en o-cresol basée sur les données spectrales NIR a une grande précision.
L'erreur carrée moyenne de validation croisée est une mesure du degré de différence entre la référence et le contenu o-cresol prévu. Cela peut nous aider à évaluer le degré de changement dans les données prédictives. Plus la valeur de l'ESM est faible, meilleure est la précision du modèle prédictif décrivant la teneur en o-cresol. La figure 5 indique que le MSPECV pour la mesure de la concentration d'o-cresol en fonction du PLSR diminue à mesure que le nombre de composants principaux augmente et atteint un minimum acceptable à 10 composantes principales. De plus, l'erreur diminue considérablement et le processus de descente est relativement stable. Cela prouve que le PLSR se traduit par une grande stabilité pour la mesure de la concentration d'o-cresol à l'aide de NIRS.
Les indicateurs d'évaluation du modèle pour une validation croisée 10 fois sont indiqués dans le tableau 1. Le 0.98332 est assez élevé pour le PLSR, ce qui indique que le modèle basé sur le PLSR reflète bien la relation linéaire entre les données spectrales NIR et la concentration o-cresol (c'est-à-dire, le modèle a une puissance explicative plus forte). Le coefficient
de corrélation Pearson est une statistique utilisée pour refléter le degré de corrélation linéaire entre deux variables. Plus la valeur
absolue de , plus la corrélation est forte. Cela peut aider à observer quantitativement une corrélation linéaire entre la valeur de la teneur en o-cresol prédite et la valeur de référence chimique pour confirmer la fiabilité du modèle. L'erreur de prédiction relative moyenne (MRPE) de 0,01106 est très faible
pour le PLSR et le coefficient de corrélation de prévision de 0,99161 est important; par conséquent, le modèle PLSR est d'une grande stabilité de prédiction et de précision.
Figure 1. Spectre NIR original pris avec spectromètre FT-NIR. La figure montre le jeu de données spectrales non prétraités recueilli sur une période de temps par le spectromètre FT-NIR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 2. Coefficient de détermination pour la concentration d'o-cresol déterminée par PLSR. La figure montre la tendance du coefficient de détermination pour la concentration o-cresol avec un nombre croissant de composants. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 3. Variation en pourcentage expliquée dans les données spectrales NIR pour le PLSR. Le chiffre montre la variance en pourcentage expliquée dans les données spectrales NIR pour les principaux composants sous le PLSR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 4. Résiduel du PLSR pour l'ensemble de test. La figure montre les résidus des 200 échantillons d'ensemble d'essai pour le PLSR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 5. MSPECV du PLSR. La précision du modèle PLSR a été évaluée avec une validation croisée 10 fois; le MSPECV du modèle est indiqué à la figure 5. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Interprétation | Précision des prévisions | ||
PLSR PLSR | R2 (en) | Rp | MRPECV (en) |
0.98332 | 0.9916 | 0.01106 |
Tableau 1. Indices d'évaluation du modèle. Le tableau 1 montre les indicateurs d'évaluation du modèle pour une validation croisée 10 fois.
Ce protocole décrit le processus d'exécution du PLSR sur la mesure de la concentration d'o-cresol restant dans le produit liquide de l'éther de polyphénylène avec NIRS.
Les deux étapes critiques de ce processus sont le prétraitement des données spectrales NIR originales et la sélection des variables des données spectrales NIR de haute dimension.
En général, l'interférence de fond non systématique conduit à l'écart de diffusion non systématique ou à la dérive de base du spectre NIR. Méthode de prétraitement spectrale NIR appropriée (dérivé, normalisation, correction de diffusion multivariée, etc.), comme première étape critique, élimine les interférences de fond et augmente le rapport signal-bruit des données.
Les corrélations linéaires multiples existantes dans les données spectrales de Haute dimension NIR introduisent le calcul inutile et réduisent l'efficacité de fonctionnement du modèle de régression. En outre, il existe des variables redondantes qui ont une corrélation faible ou même nulle avec la teneur en o-cresol dans les produits d'éther de polyphényle liquide. La sélection variable basée sur PLS, comme deuxième étape critique, résout les deux problèmes ci-dessus, ce qui réduit la complexité du modèle et améliore sa robustesse par rapport à l'utilisation directe de l'OLSR pour la modélisation.
En outre, la technologie a ses limites comme suit. Tout d'abord, il exige qu'il n'y ait pas de corrélation non linéaire significative entre les différentes variables dimensionnelles des données spectrales NIR. Comme le mécanisme d'algorithme PLS est basé sur l'attente de maximiser la variance des variables de données spectrales NIR et de maximiser la corrélation Pearson entre le composant principal sélectionné et le contenu de l'o-cresol. Par conséquent, le fonctionnement de l'algorithme sur les données est essentiellement une combinaison linéaire de variables de haute dimension, qui n'inclut pas la relation non linéaire possible entre les données15. Deuxièmement, en raison de la modélisation hors ligne, il ne peut pas être auto-mis à jour. Nos travaux n'ont pas encore couvert les effets de l'interaction entre les molécules d'o-cresol et de solvant ou d'autres molécules d'impureté sur NIRS. L'interaction entre l'o-cresol et les solvants ou d'autres molécules d'impureté peut avoir un effet inattendu sur NIRS, mais nous n'avons toujours pas trouvé une méthode appropriée pour quantifier cet effet. Troisièmement, le changement d'environnement, de conditions de travail et d'autres facteurs peut entraîner la dérive conceptuelle du modèle.
Toutefois, pour les méthodes existantes telles que l'analyse de séparation physique ou chimique pour la mesure de la teneur en substances chimiques dans l'industrie des matières chimiques, NIRS détecte la composition et l'information structurelle sur la teneur en substances chimiques à partir d'un perspective moléculaire microscopique. En général, la transition qualitative au niveau macroscopique est causée par le changement quantitatif au niveau microscopique. Par conséquent, cette technologie a une précision, une rapidité et une sensibilité plus fortes que d'autres méthodes. En outre, la combinaison avec la technologie d'analyse de données peut utiliser efficacement le Big Data industriel, qui est propice à l'automatisation industrielle et même la construction intelligente.
À l'avenir, cette technologie peut être appliquée avec souplesse à la mesure en ligne de divers produits chimiques de phase liquide ou solide contenu dans d'autres industries de processus fins où la mesure des capteurs généraux et la mesure de laboratoire est difficile ou incapable de répondre aux exigences industrielles16. En outre, cette technologie peut être largement combinée avec la technologie de contrôle avancée en raison de la rétroaction en temps réel des variables d'analyse et ainsi répondre aux exigences industrielles plus élevées17,18,19.
Les auteurs n'ont rien à révéler.
Ces travaux ont été soutenus par la National Natural Science Foundation of China (Grant Nos. 61722306 et 61473137) et le National First-class Discipline Program of Light Industry Technology and Engineering (LITE2018-025).
Name | Company | Catalog Number | Comments |
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon