Method Article
O protocolo descreve um método de previsão da concentração de o-cresol durante a produção do éter do polifenino usando espectroscopia infravermelha próxima e regressão parcial de menos quadrados. Para descrever o processo de forma mais clara e completa, um exemplo de prever a concentração o-cresol durante a produção de polifenilene é usado para esclarecer as etapas.
Ao contrário das variáveis de processo macroscópico, a espectroscopia infravermelha próxima fornece informações de processo a nível molecular e pode melhorar significativamente a previsão dos componentes nos processos industriais. A capacidade de registrar espectros para amostras sólidas e líquidas sem qualquer pré-tratamento é vantajosa e o método é amplamente utilizado. No entanto, as desvantagens da análise de dados espectrais de infravermelho próximo de alta dimensão incluem redundância de informações e multicollinearidade dos dados espectrais. Assim, propomos o uso do método parcial de regressão de mínimos quadrados, que tradicionalmente tem sido usado para reduzir a dimensionalidade de dados e eliminar a colegialidade entre as características originais. Implementamos o método para prever a concentração de o-cresol durante a produção do éter do polifenino. A abordagem proposta oferece as seguintes vantagens sobre os métodos de previsão de regressão de componentes: 1) regressão parcial menos quadrados resolve o problema de multicollinearidade das variáveis independentes e efetivamente evita supermontagem, o que ocorre em um análise de regressão devido à alta correlação entre as variáveis independentes; 2) o uso dos espectros infravermelhos próximos resulta em alta precisão, pois é um método não destrutivo e não poluente para obter informações em escalas microscópicas e moleculares.
A espectroscopia infravermelha próxima (NIR) ganhou ampla aceitação como uma tecnologia analítica moderna rápida, eficiente, não destrutiva e não poluente; o método tem sido utilizado nos últimos anos para a detecção e análise da qualidade do produto e a medição de componentes químicos em processos industriais. A especialidade mais essencial do método é a sua capacidade de gravar espectros para amostras sólidas e líquidas sem qualquer pré-processamento, tornando nirs especialmente adequado para a detecção direta e rápida e análise de produtos naturais e sintéticos1,2. Ao contrário dos sensores tradicionais que medem variáveis de processo (por exemplo, temperatura, pressão, nível líquido, etc.) em escala macroscópica e inevitavelmente sofrem o ruído externo e interferência de fundo, o NIRS detecta as informações estruturais da composição química em escalas microscópicas e moleculares. Assim, as informações essenciais podem ser medidas de forma mais precisa e eficaz do que com outros métodos3,4.
Éter do polifeníbio, como um dos plásticos de engenharia, são amplamente utilizados devido à sua resistência ao calor, retardador de chama, isolamento, propriedades elétricas, estabilidade dimensional, resistência ao impacto, resistência a fluência, resistência mecânica e outras propriedades5. Mais importante, não é tóxico e inofensivo em comparação com outros plásticos de engenharia. Atualmente, 2,6-xilenol é uma das matérias-primas básicas para a síntese do éter do polifenino, e geralmente é preparado por alquilação catalisada de fenol com método de metanol6. Existem dois produtos principais deste método de preparação, o-cresol e 2,6-xilenol. Após uma série de etapas de separação e extração, 2,6 xilenol é usado para produzir éter de polifenino. No entanto, vestígios de o-cresol permanecem em 2,6-xilenol. O-cresol não participa da síntese do éter do polifenilene e permanecerá no produto do éter do polifenino, resultando em uma diminuição na qualidade do produto ou mesmo no substandard. Atualmente, a maioria das empresas ainda analisa as composições de misturas orgânicas complexas, como produtos de éter polifenico de fase líquida contendo impurezas (por exemplo, o-cresol) por análise de separação física ou química, como cromatografia7,8. O princípio de separação da cromatografia é o uso da mistura de composições na fase fixa e a fase de fluxo na dissolução, análise, adsorção, desorção ou outra afinidade das pequenas diferenças no desempenho. Quando as duas fases se movem em relação uma à outra, as composições são separadas pelas ações acima repetidamente nas duas fases. Dependendo do objeto, geralmente leva alguns minutos a algumas dezenas de minutos para concluir uma operação complexa de separação de materiais. Pode-se ver que a eficiência da medida é baixa.
Hoje em dia, a medição da qualidade do produto e a tecnologia de controle avançada baseada nesta análise para a moderna indústria de materiais químicos de processo fino são a direção chave para melhorar ainda mais a qualidade do produto. Na indústria de processos de produção de éter polifeníbio, a medição em tempo real do conteúdo o-cresol no produto eterionilo-polifenino é de grande importância para o desenvolvimento. A análise cromatográfica claramente não pode atender aos requisitos da tecnologia de controle avançada para medição em tempo real de substâncias e feedback de sinal. Portanto, propomos o método parcial de regressão de menos quadrados (PLSR) para estabelecer um modelo linear entre os dados do NIRS e a concentração de o-cresol, que realizam a medição on-line do conteúdo o-cresol no produto de eter do polifenilene líquido de saída .
O pré-processamento do NIRS desempenha o papel mais importante antes da modelagem estatística multivariada. Os números de onda nirs no espectro nir e os tamanhos de partículas de amostras biológicas são comparáveis, por isso é conhecido por efeitos inesperados de dispersão que tem influência sobre os espectros de amostra registrados. Ao executar métodos de pré-processamento adequados, esses efeitos são fáceis de serem eliminados em grande parte9. As técnicas de pré-processamento mais comumente usadas no NIRS são categorizadas como correção de dispersão e métodos derivados espectrais. O primeiro grupo de métodos inclui correção multiplicativa de dispersão, destendências, transformações variáveis normais padrão e normalização. Os métodos de derivação espectral incluem o uso do primeiro e segundo derivados.
Antes de desenvolver um modelo de regressão quantitativa, é importante remover as variações de dispersão sistemática dos dados do NIRS porque eles têm uma influência significativa na precisão do modelo preditivo, sua complexidade e parcimônia. A seleção de um método adequado de pré-processamento deve depender sempre da etapa de modelagem subsequente. Aqui, se o conjunto de dados espectrais nir não segue a lei Lambert-Beer, então outros fatores tendem a compensar o comportamento não-ideal da previsão de componentes previstos. A desvantagem da existência de tais fatores desnecessários leva ao aumento da complexidade do modelo, ainda mais provável, uma redução na robustez. Assim, a aplicação de derivados espectrais e uma normalização convencional aos dados espectrais é uma parte essencial do método.
Após o pré-processamento espectral, os dados do NIRS com uma alta relação sinal/ruído e baixa interferência de fundo são obtidos. A análise moderna do NIRS fornece a rápida aquisição de grandes quantidades de absorção em uma faixa espectral apropriada. A composição química da amostra é então prevista através da extração das variáveis relevantes usando as informações contidas na curva espectral. Geralmente, o NIRS é combinado com técnicas de análise multivariadas para análises qualitativas ou quantitativas10. Uma análise de regressão linear multivariada (MLR) é comumente usada para desenvolver e minerar a relação matemática entre os dados e os componentes nos processos industriais e tem sido amplamente utilizada na análise do NIRS.
No entanto, existem dois problemas fundamentais na implementação de um MLR para dados NIRS pré-processados. Um problema é a redundância variável. A alta dimensionalidade dos dados do NIRS muitas vezes torna a previsão de uma variável dependente não confiável porque são incluídas variáveis que não têm correlação com os componentes. Essas variáveis redundantes reduzem a eficiência da informação dos dados espectrais e afetam a precisão do modelo. Para eliminar a redundância variável, é essencial desenvolver e maximizar a correlação entre os dados do NIRS e os componentes previstos.
Outro problema é a questão da multicollinearidade nos dados do NIRS. Uma das pressupostos importantes de múltiplos modelos lineares de regressão é que não há relação linear entre nenhuma das variáveis explicativas do modelo de regressão. Se essa relação linear existe, está provado que há multicollinearidade no modelo de regressão linear e a suposição é violada. Em múltiplas regressões lineares, como regressão de menos quadrados comuns (OLSR), múltiplas correlações entre as variáveis afetam a estimativa do parâmetro, aumentam o erro do modelo e afetam a estabilidade do modelo. Para eliminar a correlação multilinear entre os dados espectrais do NIR, usamos métodos de seleção variáveis que maximizam a variabilidade inerente das amostras.
Aqui, propomos usar o PLSR, que é uma generalização de regressão linear múltipla que tem sido amplamente utilizada no campo do NIRS11,12. O PLSR integra as funções básicas do MLR, análise de correlação canônica (CCA) e análise de componentes principais (PCA) e combina a análise de previsão com uma análise de conotação de dados não modelo. O PLSR pode ser dividido em duas partes. A primeira parte seleciona os componentes das variáveis características e os componentes previstos por análise parcial de menores quadrados (PLS). Pls maximiza a variabilidade inerente dos componentes principais, tornando a cvárioce dos componentes principais e componentes previstos tão grande quanto possível ao extrair os componentes principais. Em seguida, o modelo OLSR de concentração o-cresol é estabelecido para os principais componentes selecionados. Plsr é adequado para a análise de dados ruidosos com inúmeras variáveis independentes que são fortemente colline e altamente correlacionados e para a modelagem simultânea de várias variáveis de resposta. Além disso, plsr extrai as informações eficazes dos espectros de amostra, supera o problema da multicollinearidade, e tem as vantagens de forte estabilidade e alta precisão de previsão13,14.
O seguinte protocolo descreve o processo de utilização do modelo PLSR para medir a concentração o-cresol usando dados espectrais nir. A confiabilidade e a precisão do modelo são avaliadas quantitativamente por meio do coeficiente de determinação (),o coeficiente de correlação de previsão (
) e o erro médio de previsão quadrada de validação cruzada (MSPECV). Além disso, para mostrar intuitivamente as vantagens do PLSR, os indicadores de avaliação são visualizados em várias parcelas para uma análise qualitativa. Por fim, os indicadores de avaliação de um experimento são apresentados em formato de tabela para ilustrar quantitativamente a confiabilidade e precisão do modelo PLSR.
1. Aquisição de dados de espectro NIR com espectrômetro de processo de transformação Fourier (FT)-NIR
2. NIR espectroscopia dados pré-processamento
3. Estabelecimento do modelo PLSR
O valor previsto da impureza o-cresol em produtos de éter polifenil é obtido pela espectroscopia infravermelha próxima baseada em PLSR. A Figura 2 e a Figura 3, respectivamente, mostram a confiabilidade do método na fase de seleção de recursos a partir da curva do coeficiente de decisão e do percentual de interpretação de erros aumentando com o número de componentes principais.
Especificamente, observe que na seleção dos principais componentes, a fim de minimizar a complexidade do modelo, geralmente, quando os dois indicadores não aumentam significativamente com o número de elementos principais, os elementos principais subsequentes com menos informações podem ser descartados. Neste artigo, de acordo com as duas curvas, quando é 0,9917, é o limiar para descartar componentes principais subsequentes.
Teste visualmente a precisão e a estabilidade do método para prever a pureza dos produtos o-cresol por meio da Figura 4 e da Figura 5. Com base no conjunto de treinamento e conjunto de testes gerados pelas amostras de o-cresol obtidas do campo industrial e seus dados correspondentes de espectroscopia infravermelha próxima, comparamos o erro quadrado residual e médio dos valores previstos e de referência da pureza dos produtos de éter polifenóis.
O residual aqui refere-se à diferença entre o valor de referência do conteúdo o-cresol e a estimativa do modelo PLSR (valor cabido). O uso das informações fornecidas pelos resíduos pode nos ajudar a examinar a racionalidade dos pressupostos estabelecidos do modelo PLSR e a confiabilidade da coleta de dados espectrais infravermelhos próximos. Mostra-se que o método PLSR efetivamente reduz os resíduos para um intervalo aceitável. Além disso, o PLSR tem uma pequena flutuação variade -0,2 a 0,2, enquanto a faixa de calibração é de 42.1063 mg/1 g de produto de éter de polifeníolo a 51.6763 mg/1 g de produto de éter de polifeníleo. Os dados residuais do lote nos permitem concluir qualitativamente que o PLSR para a medição do conteúdo o-cresol com base nos dados espectrais nir tem alta precisão.
O erro quadrado médio de validação cruzada é uma medida do grau de diferença entre a referência e o conteúdo o-cresol previsto. Isso pode nos ajudar a avaliar o grau de mudança nos dados preditivos. Quanto menor o valor do MSE, melhor será a precisão do modelo preditivo que descreve o conteúdo do o-cresol. A figura 5 indica que o MSPECV para a medição de concentração de o-cresol com base na redução do PLSR à medida que o número de componentes principais aumenta e atinge um mínimo aceitável em 10 componentes principais. Além disso, o erro diminui significativamente e o processo de descida é relativamente estável. Isso prova que o PLSR resulta em alta estabilidade para a medição da concentração o-cresol usando NIRS.
Os indicadores de avaliação do modelo para uma validação cruzada de 10 vezes são mostrados na Tabela 1. O de 0,98332 é bastante alto para o PLSR, indicando que o modelo baseado no poço PLSR reflete a relação linear entre os dados espectrais do NIR e a concentração o-cresol (ou seja, o modelo tem maior poder explicativo). O coeficiente
de correlação pearson é uma estatística usada para refletir o grau de correlação linear entre duas variáveis. Quanto maior o
valor absoluto de , mais forte a correlação. Isso pode ajudar a observar quantitativamente uma correlação linear entre o valor previsto do conteúdo o-cresol e o valor de referência químico para confirmar a confiabilidade do modelo. O erro de previsão relativa média (MRPE) de 0,01106 é muito
baixo para o PLSR e o coeficiente de correlação de previsão de 0,99161 é grande; Portanto, o modelo PLSR é de grande estabilidade e precisão de previsão.
Figura 1. Espectro NIR original tomado com espectrômetro FT-NIR. A figura mostra o conjunto de dados espectrais não pré-processadocoletado coletado ao longo de um período de tempo pelo espectrômetro FT-NIR. Clique aqui para ver uma versão maior deste número.
Figura 2. Coeficiente de determinação para a concentração o-cresol determinada pelo PLSR. A figura mostra a tendência do coeficiente de determinação para a concentração o-cresol com o aumento do número de componentes. Clique aqui para ver uma versão maior deste número.
Figura 3. Variação percentual explicada nos dados espectrais do NIR para o PLSR. O número mostra a variação percentual explicada nos dados espectrais nir para os principais componentes o PLSR. Clique aqui para ver uma versão maior deste número.
Figura 4. Residual do PLSR para o conjunto de testes. A figura mostra os resíduos das 200 amostras do jogo do teste para o PLSR. Clique aqui para ver uma versão maior deste número.
Figura 5. MSPECV do PLSR. A precisão do modelo PLSR foi avaliada com 10 vezes de validação cruzada; o MSPECV do modelo é mostrado na Figura 5. Clique aqui para ver uma versão maior deste número.
Interpretação | Precisão da previsão | ||
PLSR PLSR | R² R² | R p Rp | MRPECV MRPECV |
0.98332 | 0.9916 | 0.01106 |
Tabela 1. Índices de avaliação do modelo. A Tabela 1 mostra os indicadores de avaliação do modelo para uma validação cruzada de 10 vezes.
Este protocolo descreve o processo de execução do PLSR na medida da concentração do o-cresol que permanece no produto líquido do éter do polifenilene com NIRS.
As duas etapas críticas nesse processo são o pré-processamento dos dados espectrais nir originais e a seleção variáveis dos dados espectrais nir de alta dimensão.
Geralmente, a interferência de antecedentes não sistemática leva ao desvio de dispersão não sistemático ou à deriva de base do espectro de NIR. Método espectral adequado de pré-processamento nir (derivado, normalização, correção de dispersão multivariada, etc.), como o primeiro passo crítico, elimina a interferência de fundo e aumenta a proporção de dados de sinal/ruído.
Múltiplas correlações lineares existentes nos dados espectrais nir de alta dimensão introduzem computação desnecessária e reduzem a eficiência operacional do modelo de regressão. Além disso, existem variáveis redundantes que têm fraca ou mesmo nenhuma correlação com o teor o-cresol em produtos de éter de polifeníleo líquido. A seleção variável baseada no PLS, como segundo passo crítico, resolve os dois problemas acima, o que reduz a complexidade do modelo e aumenta sua robustez em comparação com o uso direto da OLSR para modelagem.
Além disso, a tecnologia tem suas limitações como seguintes. Em primeiro lugar, exige que não haja correlação não linear significativa entre as várias variáveis dimensionais dos dados espectrais nir. Como o mecanismo do algoritmo PLS é baseado na expectativa de maximizar a variação das variáveis de dados espectrais nir e maximizar a correlação pearson entre o componente principal selecionado e o conteúdo do o-cresol. Portanto, o funcionamento do algoritmo em dados é essencialmente uma combinação linear de variáveis de alta dimensão, que não inclui a possível relação não linear entre os dados15. Em segundo lugar, devido à modelagem off-line, não pode ser auto-atualizado. Nosso trabalho ainda não cobriu os efeitos da interação entre moléculas o-cresol e solventes ou outras moléculas de impureza no NIRS. A interação entre o-cresol e solventes ou outras moléculas de impureza pode ter um efeito inesperado sobre nirs, mas ainda não encontramos um método adequado para quantificar este efeito. Em terceiro lugar, a mudança de ambiente, condição de trabalho e outros fatores podem levar à deriva conceito do modelo.
No entanto, para os métodos existentes, como a análise de separação física ou química para a medição do conteúdo de substâncias químicas na indústria de materiais químicos, o NIRS detecta informações estruturais de composição e sobre o conteúdo de substâncias químicas perspectiva molecular microscópica. Em geral, a transição qualitativa no nível macroscópico é causada pela mudança quantitativa no nível microscópico. Portanto, essa tecnologia tem maior precisão, oportunidade e sensibilidade do que outros métodos. Além disso, a combinação com a tecnologia de análise de dados pode efetivamente utilizar big data industrial, o que é propício à automação industrial e até mesmo à construção inteligente.
No futuro, esta tecnologia pode ser aplicada de forma flexível à medição on-line de vários conteúdos químicos de fase líquida ou sólida em outras indústrias de processos finos, onde a medição de sensores gerais e medição laboratorial é difícil ou incapaz de atender aos requisitos industriais16. Além disso, esta tecnologia pode ser amplamente combinada com tecnologia de controle avançada devido ao feedback em tempo real das variáveis de análise e, assim, atender aos requisitos industriais mais elevados17,18,19.
Os autores não têm nada a divulgar.
Este trabalho foi apoiado pela National Natural Science Foundation of China (Grant No. 61722306 e 61473137) e pelo Programa Nacional de Disciplina de Primeira Classe de Tecnologia e Engenharia da Indústria Leve (LITE2018-025).
Name | Company | Catalog Number | Comments |
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados