Method Article
Das Protokoll beschreibt eine Methode zur Vorhersage der O-Kresol-Konzentration während der Produktion von Polyphenylenether mittels Nahinfrarotspektroskopie und partieller Regression der kleinsten Quadrate. Um den Prozess klarer und vollständiger zu beschreiben, wird ein Beispiel für die Vorhersage der O-Kresol-Konzentration während der Produktion von Polyphenylen verwendet, um die Schritte zu klären.
Im Gegensatz zu makroskopischen Prozessvariablen liefert die Nahinfrarotspektroskopie Prozessinformationen auf molekularer Ebene und kann die Vorhersage der Komponenten in industriellen Prozessen deutlich verbessern. Die Fähigkeit, Spektren für feste und flüssige Proben ohne Vorbehandlung aufzuzeichnen, ist vorteilhaft und das Verfahren ist weit verbreitet. Zu den Nachteilen der Analyse hochdimensionaler Nahinfrarot-Spektraldaten gehören jedoch Informationsredundanz und Multikollinearität der Spektraldaten. Daher schlagen wir vor, partielle Regressionsmethode für kleinste Quadrate zu verwenden, die traditionell verwendet wurde, um die Datendimensionalität zu reduzieren und die Kollinearität zwischen den ursprünglichen Features zu beseitigen. Wir implementieren die Methode zur Vorhersage der O-Kresol-Konzentration bei der Herstellung von Polyphenylenether. Der vorgeschlagene Ansatz bietet die folgenden Vorteile gegenüber Komponentenregressionsvorhersagemethoden: 1) Die partielle Regression der kleinsten Quadrate löst das Multikollinearitätsproblem der unabhängigen Variablen und vermeidet effektiv eine Überanpassung, die in einem Regressionsanalyse aufgrund der hohen Korrelation zwischen den unabhängigen Variablen; 2) Die Verwendung der Nahinfrarotspektren führt zu hoher Genauigkeit, da es sich um eine zerstörungsfreie und umweltverschmutzende Methode handelt, um Informationen in mikroskopischen und molekularen Maßstäben zu erhalten.
Die Nahinfrarotspektroskopie (NIRS) hat sich als schnelle, effiziente, zerstörungsfreie und umweltschädliche moderne Analysetechnologie durchgesetzt; Das Verfahren wurde in den letzten Jahren zur Produktqualitätserkennung und -analyse sowie zur Messung chemischer Komponenten in industriellen Prozessen eingesetzt. Die wichtigste Spezialität der Methode ist ihre Fähigkeit, Spektren für feste und flüssige Proben ohne Vorverarbeitung aufzuzeichnen, was NIRS besonders für die direkte und schnelle Detektion und Analyse natürlicher und synthetischerProdukte1,2. Im Gegensatz zu herkömmlichen Sensoren, die Prozessvariablen (z. B. Temperatur, Druck, Flüssigkeitsstand usw.) im makroskopischen Maßstab messen und unweigerlich äußere Geräusche und Hintergrundstörungen erleiden, erkennt NIRS die strukturellen Informationen der chemischen Zusammensetzung in mikroskopischen und molekularen Maßstäben. So können wesentliche Informationen genauer und effektiver gemessen werden als mit anderen Methoden3,4.
Polyphenylether, als einer der technischen Kunststoffe, sind weit verbreitet aufgrund seiner Hitzebeständigkeit, Flammschutzmittel, Isolierung, elektrische Eigenschaften, Dimensionsstabilität, Schlagfestigkeit, Kriechfestigkeit, mechanische Festigkeit und andere Eigenschaften5. Noch wichtiger ist, dass es ungiftig und harmlos im Vergleich zu anderen technischen Kunststoffen ist. Derzeit ist 2,6-Xylol einer der Grundrohstoffe für die Synthese von Polyphenylenether, und es wird in der Regel durch katalysierte Alkylielung von Phenol mit Methanol-Methode6hergestellt. Es gibt zwei Hauptprodukte dieser Zubereitungsmethode, O-Cresol und 2,6-Xylol. Nach einer Reihe von Trenn- und Extraktionsschritten wird 2,6 Xylol zur Herstellung von Polyphenylenether verwendet. Spuren von O-Kresol verbleiben jedoch in 2,6-Xylol. O-Kresol beteiligt sich nicht an der Synthese von Polyphenylenether und verbleibt im Polyphenylenetherprodukt, was zu einer Abnahme der Produktqualität oder sogar des Unterstandards führt. Derzeit analysieren die meisten Unternehmen noch die Zusammensetzungen komplexer organischer Gemische wie flüssige Phasenpolyphenyletherprodukte, die Verunreinigungen (z. B. O-Kresol) enthalten, durch physikalische oder chemische Trennanalyse wie Chromatographie7,8. Das Trennungsprinzip der Chromatographie ist die Verwendung des Mischungsders von Kompositionen in der festen Phase und der Strömungsphase in der Auflösung, Analyse, Adsorption, Desorption oder anderen Affinität der geringfügigen Leistungsunterschiede. Wenn sich die beiden Phasen relativ zueinander bewegen, werden die Kompositionen in den beiden Phasen wiederholt durch die oben genannten Aktionen getrennt. Je nach Objekt dauert es in der Regel einige Minuten bis ein paar Dutzend Minuten, um eine komplexe Materialtrennung abzuschließen. Es zeigt sich, dass die Messeffizienz gering ist.
Heute ist die Messung der Produktqualität und die fortschrittliche Steuerungstechnik auf Basis dieser Analyse für die moderne Feinprozesschemieindustrie die schlüsselfertige Richtung, um die Produktqualität weiter zu verbessern. In der Prozessindustrie der Polyphenyletherproduktion ist die Echtzeitmessung des O-Kresolgehalts in Polyphenylenether von großer Entwicklungsbedeutung. Chromatographische Analysen können eindeutig nicht den Anforderungen fortschrittlicher Steuerungstechnik für die Echtzeitmessung von Stoffen und Signalrückmeldungen gerecht werden. Daher schlagen wir die partielle Regressionsmethode (PLSR) vor, um ein lineares Modell zwischen den NIRS-Daten und der O-Kresol-Konzentration zu erstellen, die die Online-Messung des O-Kresol-Gehalts im flüssigen Polyphenylenetherprodukt des Auslaufs realisieren. .
Die Vorverarbeitung für NIRS spielt vor der multivariaten statistischen Modellierung die wichtigste Rolle. NIRS-Wellenzahlen im NIR-Spektrum und die Partikelgrößen biologischer Proben sind vergleichbar, so dass sie für unerwartete Streueffekte bekannt sind, die Einfluss auf die aufgezeichneten Probenspektren haben. Durch die Durchführung geeigneter Vorverarbeitungsmethoden lassen sich diese Effekte leicht weitgehend eliminieren9. Die am häufigsten verwendeten Vorverarbeitungstechniken in NIRS werden als Streuungskorrektur- und Spektralderivate-Methoden kategorisiert. Die erste Gruppe von Methoden umfasst multiplikative Streuungskorrektur, Detrending, normale Standard-Variattransformationen und Normalisierung. Die spektralen Ableitungsmethoden umfassen die Verwendung des ersten und zweiten Derivats.
Vor der Entwicklung eines quantitativen Regressionsmodells ist es wichtig, die unsystematischen Streuungsvariationen aus den NIRS-Daten zu entfernen, da sie einen erheblichen Einfluss auf die Genauigkeit des Vorhersagemodells, seine Komplexität und Parsimonie haben. Die Auswahl einer geeigneten Vorverarbeitungsmethode sollte immer vom nachfolgenden Modellierungsschritt abhängen. Wenn der NIR-Spektraldatensatz nicht dem Lambert-Bier-Gesetz folgt, kompensieren andere Faktoren das nicht ideale Verhalten der Vorhersage für vorhergesagte Komponenten. Der Nachteil, dass solche unnötigen Faktoren existieren, führt zu einer Zunahme der Modellkomplexität, selbst wahrscheinlich erweise zu einer Verringerung der Robustheit. Daher ist die Anwendung von Spektralderivaten und eine konventionelle Normalisierung auf die Spektraldaten ein wesentlicher Bestandteil der Methode.
Nach der spektralen Vorverarbeitung werden die NIRS-Daten mit einem hohen Signal-Rausch-Verhältnis und geringen Hintergrundstörungen ermittelt. Die moderne NIRS-Analyse ermöglicht die schnelle Erfassung großer Absorptionsmengen über einen geeigneten Spektralbereich. Die chemische Zusammensetzung der Probe wird dann durch Extraktion der relevanten Variablen unter Verwendung der in der Spektralkurve enthaltenen Informationen vorhergesagt. Im Allgemeinen wird NIRS mit multivariaten Analysetechniken für qualitative oder quantitative Analysen10kombiniert. Eine multivariate lineare Regressionsanalyse (MLR) wird häufig für die Entwicklung und Mining der mathematischen Beziehung zwischen den Daten und den Komponenten in industriellen Prozessen verwendet und wurde in der NIRS-Analyse weit verbreitet.
Bei der Implementierung eines MLR für vorverarbeitete NIRS-Daten gibt es jedoch zwei grundlegende Probleme. Ein Problem ist die variable Redundanz. Die hohe Dimensionalität der NIRS-Daten macht die Vorhersage einer abhängigen Variablen oft unzuverlässig, da Variablen enthalten sind, die keine Korrelation mit den Komponenten aufweisen. Diese redundanten Variablen reduzieren die Informationseffizienz der Spektraldaten und beeinflussen die Genauigkeit des Modells. Um die variable Redundanz zu eliminieren, ist es wichtig, die Korrelation zwischen den NIRS-Daten und den vorhergesagten Komponenten zu entwickeln und zu maximieren.
Ein weiteres Problem ist die Frage der Multikollinearität in den NIRS-Daten. Eine der wichtigen Annahmen mehrerer linearer Regressionsmodelle ist, dass es keine lineare Beziehung zwischen einer der erklärenden Variablen des Regressionsmodells gibt. Wenn diese lineare Beziehung besteht, wird nachgewiesen, dass das lineare Regressionsmodell multikollinear ist und die Annahme verletzt wird. Bei mehreren linearen Regressionen, z. B. einer gewöhnlichen Regression der kleinsten Quadrate (OLSR), wirken sich mehrere Korrelationen zwischen den Variablen auf die Parameterschätzung aus, erhöhen den Modellfehler und beeinflussen die Stabilität des Modells. Um die multilineare Korrelation zwischen den NIR-Spektraldaten zu eliminieren, verwenden wir variable Selektionsmethoden, die die inhärente Variabilität der Samples maximieren.
Hier schlagen wir vor, die PLSR zu verwenden, die eine Verallgemeinerung der multiplen linearen Regression ist, die im Bereich von NIRS11,12weit verbreitet ist. Die PLSR integriert die Grundfunktionen der MLR, der kanonischen Korrelationsanalyse (CCA) und der Hauptkomponentenanalyse (PCA) und kombiniert die Prognoseanalyse mit einer nicht modellalen Datenkonnotationsanalyse. Die PLSR kann in zwei Teile unterteilt werden. Der erste Teil wählt die Komponenten der Merkmalsvariablen und die vorhergesagten Komponenten durch partielle Analyse der kleinsten Quadrate (PLS) aus. PLS maximiert die inhärente Variabilität der Hauptkomponenten, indem die Kovarianz der Hauptkomponenten und vorhergesagten Komponenten beim Extrahieren der Hauptkomponenten so groß wie möglich wird. Als nächstes wird das OLSR-Modell der O-Kresolkonzentration für die ausgewählten Hauptkomponenten festgelegt. PLSR eignet sich zur Analyse von lauten Daten mit zahlreichen unabhängigen Variablen, die stark kollinear und stark korreliert sind, sowie zur gleichzeitigen Modellierung mehrerer Antwortvariablen. Außerdem extrahiert PLSR die effektiven Informationen der Probenspektren, überwindet das Problem der Multikollinearität und hat die Vorteile einer starken Stabilität und hohen Vorhersagegenauigkeit13,14.
Das folgende Protokoll beschreibt den Prozess der Verwendung des PLSR-Modells zur Messung der O-Kresol-Konzentration mit NIR-Spektraldaten. Die Zuverlässigkeit und Genauigkeit des Modells werden quantitativanhand des Bestimmungskoeffizienten ( ), des Vorhersagekorrelationskoeffizienten (
) und des mittleren quadratischen Vorhersagefehlers der Kreuzvalidierung (MSPECV) bewertet. Um die Vorteile der PLSR intuitiv aufzuzeigen, werden die Auswertungsindikatoren in mehreren Diagrammen für eine qualitative Analyse visualisiert. Schließlich werden Die Auswertungsindikatoren eines Experiments im Tabellenformat dargestellt, um die Zuverlässigkeit und Genauigkeit des PLSR-Modells quantitativ zu veranschaulichen.
1. NIR-Spektrum-Datenerfassung mit Fourier transform (FT)-NIR Prozessspektrometer
2. NIR-Spektroskopiedaten vorverarbeitung
3. Erstellung des PLSR-Modells
Der vorhergesagte Wert der O-Kresol-Impurität in Polyphenylether-Produkten wird durch PLSR-basierte Nahinfrarotspektroskopie ermittelt. Abbildung 2 und Abbildung 3 zeigen die Zuverlässigkeit des Verfahrens in der Merkmalsauswahlphase aus der Kurve des Entscheidungskoeffizienten und den Prozentsatz der Fehlerinterpretation, der mit der Anzahl der Hauptkomponenten zunimmt.
Bitte beachten Sie insbesondere, dass bei der Auswahl der Hauptkomponenten, um die Komplexität des Modells zu minimieren, im Allgemeinen, wenn die beiden Indikatoren mit der Anzahl der Hauptelemente nicht signifikant zunehmen, die nachfolgenden Hauptelemente mit weniger Informationen verworfen werden können. In diesem Papier ist es gemäß den beiden Kurven, wenn es 0,9917 ist, der Schwellenwert, um nachfolgende Hauptkomponenten zu verwerfen.
Testen Sie die Genauigkeit und Stabilität des Verfahrens zur Vorhersage der Reinheit von O-Kresol-Produkten mit Hilfe von Abbildung 4 und Abbildung 5. Basierend auf dem Trainingssatz und dem Testsatz, der durch die aus dem Industriebereich gewonnenen O-Cresol-Proben und den entsprechenden Nahinfrarot-Spektroskopiedaten erzeugt wird, verglichen wir den Rest- und Mittelquadratfehler der vorhergesagten und Referenzwerte der Reinheit von Polyphenyletherprodukten.
Der Rest bezieht sich hier auf die Differenz zwischen dem Referenzwert des O-Kresol-Inhalts und der PLSR-Modellschätzung (angepasster Wert). Die Verwendung der von den Residuen bereitgestellten Informationen kann uns helfen, die Rationalität der etablierten PLSR-Modellannahmen und die Zuverlässigkeit der Erfassung von Nahinfrarot-Spektraldaten zu untersuchen. Es wird gezeigt, dass die PLSR-Methode die Residuen effektiv auf einen akzeptablen Bereich reduziert. Darüber hinaus weist die PLSR einen kleinen Schwankungsbereich von -0,2 bis 0,2 auf, während der Kalibrierbereich von 42,1063 mg/1 g Polyphenylether-Produkt bis 51,6763 mg/1 g Polyphenylether-Produkt reicht. Die Restdiagrammdaten lassen uns qualitativ schlussfolgern, dass die PLSR zur Messung des o-kresolen Gehalts auf Basis der NIR-Spektraldaten eine hohe Genauigkeit aufweist.
Der kreuzvalidierungsmittelförmige quadratische Fehler ist ein Maß für den Grad der Differenz zwischen der Referenz und dem vorhergesagten O-Cresol-Gehalt. Dies kann uns helfen, den Grad der Veränderung in den Vorhersagedaten zu bewerten. Je kleiner der Wert von, desto besser ist die Genauigkeit des Vorhersagemodells, das den O-Cresol-Gehalt beschreibt. Abbildung 5 zeigt, dass die MSPECV für die O-Kresol-Konzentrationsmessung auf der Grundlage der PLSR abnehmen, wenn die Anzahl der Hauptkomponenten zunimmt und ein akzeptables Minimum bei 10 Hauptkomponenten erreicht. Darüber hinaus nimmt der Fehler deutlich ab und der Abstiegsprozess ist relativ stabil. Dies beweist, dass die PLSR zu einer hohen Stabilität bei der Messung der O-Kresol-Konzentration mit NIRS führt.
Die Modellauswertungsindikatoren für eine 10-fache Kreuzvalidierung sind in Tabelle 1dargestellt. Der von 0.98332 ist ziemlich hoch für die PLSR, was darauf hindeutet, dass das Modell, das auf dem PLSR-Brunnen basiert, die lineare Beziehung zwischen den NIR-Spektraldaten und der O-Kresol-Konzentration widerspiegelt (d. h., das Modell hat eine stärkere Erklärungskraft). Der Pearson-Korrelationskoeffizient
ist eine Statistik, die verwendet wird, um den Grad der linearen Korrelation zwischen zwei Variablen widerzuspiegeln. Je größer der
absolute Wert von , desto stärker die Korrelation. Dies kann helfen, eine lineare Korrelation zwischen dem vorhergesagten O-Kresol-Gehalt und dem chemischen Referenzwert quantitativ zu beobachten, um die Zuverlässigkeit des Modells zu bestätigen. Der mittlere relative Vorhersagefehler (MRPE) von 0,01106 ist für die PLSR sehr niedrig und der Vorhersagekorrelationskoeffizient
von 0,99161 ist groß; daher ist das PLSR-Modell von großer Vorhersagestabilität und Genauigkeit.
Abbildung 1. Original NIR-Spektrum mit FT-NIR-Spektrometer. Die Abbildung zeigt den nicht vorverarbeiteten Spektraldatensatz, der über einen bestimmten Zeitraum vom FT-NIR-Spektrometer erfasst wurde. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 2. Bestimmungskoeffizient für die durch PLSR ermittelte O-Kresol-Konzentration. Die Abbildung zeigt den Trend des Bestimmungskoeffizienten für die O-Kresolkonzentration mit steigender Anzahl von Komponenten. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 3. Prozentuale Abweichung, die in den NIR-Spektraldaten für die PLSR erläutert wird. Die Abbildung zeigt die prozentuale Varianz, die in den NIR-Spektraldaten für die Hauptkomponenten unter der PLSR erläutert wird. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 4. Rest der PLSR für den Testsatz. Die Abbildung zeigt die Residuen der 200 Testsatzproben für die PLSR. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 5. MSPECV der PLSR. Die Genauigkeit des PLSR-Modells wurde mit einer 10-fachen Kreuzvalidierung bewertet; das MSPECV des Modells ist in Abbildung 5 dargestellt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Interpretierbarkeit | Vorhersagegenauigkeit | ||
PLSR | R2 | Rp | MRPECV |
0.98332 | 0.9916 | 0.01106 |
Tabelle 1. Bewertungsindizes des Modells. Tabelle 1 zeigt die Modellauswertungsindikatoren für eine 10-fache Kreuzvalidierung.
Dieses Protokoll beschreibt den Prozess der Messung der PLSR bei der Messung der O-Kresol-Konzentration, die im flüssigen Produkt von Polyphenylenether mit NIRS verbleibt.
Die beiden entscheidenden Schritte in diesem Prozess sind die Vorverarbeitung der ursprünglichen NIR-Spektraldaten und die Variablenauswahl der hochdimensionalen NIR-Spektraldaten.
Im Allgemeinen führt die nicht-systematische Hintergrundinterferenz zur nicht-systematischen Streuabweichung oder Basisdrift des NIR-Spektrums. Die richtige NIR-Spektral-Vorverarbeitungsmethode (Derivat, Normalisierung, multivariate Streukorrektur usw.) als erster kritischer Schritt eliminiert Hintergrundinterferenzen und erhöht das Signal-Rausch-Verhältnis der Daten.
Mehrere lineare Korrelationen, die in den hochdimensionalen NIR-Spektraldaten vorhanden sind, führen zu unnötiger Berechnung und reduzieren die Betriebseffizienz des Regressionsmodells. Darüber hinaus gibt es redundante Variablen, die schwach oder gar keine Korrelation zum O-Kresol-Gehalt in flüssigen Polyphenyletherprodukten aufweisen. Die variable Auswahl basierend auf PLS als zweitem kritischen Schritt löst die beiden oben genannten Probleme, wodurch die Komplexität des Modells reduziert und seine Robustheit im Vergleich zur direkten Verwendung von OLSR für die Modellierung verbessert wird.
Darüber hinaus hat die Technologie ihre Grenzen als folgt. Erstens erfordert es, dass es keine signifikante nichtlineare Korrelation zwischen den verschiedenen Dimensionsvariablen der NIR-Spektraldaten gibt. Da der PLS-Algorithmus-Mechanismus auf der Erwartung basiert, die Varianz von NIR-Spektraldatenvariablen zu maximieren und die Pearson-Korrelation zwischen der ausgewählten Hauptkomponente und dem Gehalt an O-Kresol zu maximieren. Daher ist die Funktionsweise des Datenalgorithmus im Wesentlichen eine lineare Kombination hochdimensionaler Variablen, die die mögliche nichtlineare Beziehung zwischen Daten15nicht einschließt. Zweitens kann sie aufgrund der Offlinemodellierung nicht selbst aktualisiert werden. Unsere Arbeit hat noch nicht die Auswirkungen der Wechselwirkung zwischen O-Kresol und Lösungsmittelmolekülen oder anderen Verunreinigungsmolekülen auf NIRS behandelt. Die Wechselwirkung zwischen O-Kresol und Lösungsmitteln oder anderen Verunreinigungsmolekülen kann eine unerwartete Wirkung auf NIRS haben, aber wir haben immer noch keine geeignete Methode gefunden, um diesen Effekt zu quantifizieren. Drittens können die Veränderung der Umwelt, des Arbeitszustands und anderer Faktoren zur Konzeptdrift des Modells führen.
Für die bestehenden Methoden wie die physikalische oder chemische Trennanalyse zur Messung des Gehalts chemischer Stoffe in der chemischen Stoffindustrie detektiert NIRS jedoch Zusammensetzungs- und Strukturinformationen über den Gehalt chemischer Stoffe aus einem mikroskopische molekulare Perspektive. Im Allgemeinen wird der qualitative Übergang auf makroskopischer Ebene durch die quantitative Veränderung auf mikroskopischer Ebene verursacht. Daher hat diese Technologie eine höhere Genauigkeit, Pünktlichkeit und Empfindlichkeit als andere Methoden. Darüber hinaus kann die Kombination mit Datenanalysetechnologie industrielle Big Data effektiv nutzen, was der industriellen Automatisierung und sogar dem intelligenten Bauen förderlich ist.
In Zukunft kann diese Technologie flexibel auf die Online-Messung verschiedener Flüssigkeits- oder Festphasenchemikalieningehalte in anderen Feinprozessindustrien angewendet werden, in denen die Messung allgemeiner Sensoren und Labormessungen schwierig oder nicht in der Lage ist, die industriellen Anforderungen zu erfüllen16. Darüber hinaus kann diese Technologie aufgrund des Echtzeit-Feedbacks von Analysevariablen weitgehend mit fortschrittlicher Steuerungstechnik kombiniert werden und erfüllt somit höhere industrielle Anforderungen17,18,19.
Die Autoren haben nichts zu verraten.
Diese Arbeit wurde von der National Natural Science Foundation of China (Grant Nos. 61722306 und 61473137) und dem National First-Class Discipline Program of Light Industry Technology and Engineering (LITE2018-025) unterstützt.
Name | Company | Catalog Number | Comments |
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten