Usando Machine Learning para Melhorar a Avaliação de Toxicidade de Produtos Químicos

Notícias

LarLar / Notícias / Usando Machine Learning para Melhorar a Avaliação de Toxicidade de Produtos Químicos

Jan 28, 2024

Usando Machine Learning para Melhorar a Avaliação de Toxicidade de Produtos Químicos

Pesquisadores da Universidade de Amsterdã, juntamente com colegas do

Pesquisadores da Universidade de Amsterdã, juntamente com colegas da Universidade de Queensland e do Instituto Norueguês de Pesquisa sobre Água, desenvolveram uma estratégia para avaliar a toxicidade de produtos químicos usando aprendizado de máquina.Eles apresentam sua abordagem em um artigo em Ciência e Tecnologia Ambiental para a edição especial "Ciência de Dados para o Avanço da Ciência Ambiental, Engenharia e Tecnologia". Os modelos desenvolvidos neste estudo podem levar a melhorias substanciais quando comparados às avaliações in silico convencionais baseadas na modelagem Quantitativa Estrutura-Atividade (QSAR).

De acordo com os pesquisadores, o uso de aprendizado de máquina pode melhorar muito a avaliação de perigo de moléculas, tanto no desenvolvimento seguro de novos produtos químicos quanto na avaliação de produtos químicos existentes. A importância deste último é ilustrada pelo fato de que as agências químicas européias e americanas listaram aproximadamente 800.000 produtos químicos que foram desenvolvidos ao longo dos anos, mas para os quais há pouco ou nenhum conhecimento sobre o destino ou toxicidade ambiental.

Uma vez que uma avaliação experimental do destino químico e toxicidade requer muito tempo, esforço e recursos, abordagens de modelagem já são usadas para prever indicadores de perigo. Em particular, a modelagem Quantitative Structure-Activity Relationship (QSAR) é frequentemente aplicada, relacionando características moleculares como arranjo atômico e estrutura 3D com propriedades físico-químicas e atividade biológica. Com base nos resultados da modelagem (ou dados medidos, quando disponíveis), os especialistas classificam uma molécula em categorias definidas, por exemplo, no Sistema Globalmente Harmonizado de Classificação e Rotulagem de Produtos Químicos (GHS). Para categorias específicas, as moléculas são submetidas a mais pesquisas, monitoramento mais ativo e, eventualmente, legislação.

No entanto, este processo tem desvantagens inerentes, muitas das quais podem ser rastreadas até as limitações dos modelos QSAR. Eles geralmente são baseados em conjuntos de treinamento muito homogêneos e assumem uma relação estrutura-atividade linear para fazer extrapolações. Como resultado, muitos produtos químicos não são bem representados pelos modelos QSAR existentes e seus usos podem levar a erros substanciais de previsão e classificação incorreta de produtos químicos.

No artigo publicado na Environmental Science & Technology, o Dr. Saer Samanipour e os co-autores propõem uma estratégia de avaliação alternativa que ignora totalmente a etapa de previsão do QSAR. Samanipour, um cientista analítico ambiental do Instituto Van 't Hoff de Ciências Moleculares da Universidade de Amsterdã, juntou-se à Dra. Antonia Praetorius, uma química ambiental do Instituto de Biodiversidade e Dinâmica de Ecossistemas da mesma universidade. Juntamente com colegas da University of Queensland e do Norwegian Institute for Water Research, eles desenvolveram uma estratégia baseada em aprendizado de máquina para a classificação direta da toxicidade aquática aguda de produtos químicos com base em descritores moleculares.

O modelo foi desenvolvido e testado através de 907 dados obtidos experimentalmente para toxicidade aguda em peixes (valores 96h LC50). O novo modelo ignora a previsão explícita de um valor de toxicidade (96h LC50) para cada produto químico, mas classifica diretamente cada produto químico em várias categorias de toxicidade pré-definidas. Essas categorias podem, por exemplo, ser definidas por regulamentos específicos ou sistemas de padronização, conforme demonstrado no artigo com as categorias GHS para perigo aquático agudo. O modelo explicou cerca de 90% da variância nos dados usados ​​no conjunto de treinamento e cerca de 80% para os dados do conjunto de teste.

Essa estratégia de classificação direta resultou em uma redução de cinco vezes na categorização incorreta em comparação com uma estratégia baseada em um modelo de regressão QSAR. Posteriormente, os pesquisadores expandiram sua estratégia para prever as categorias de toxicidade de um grande conjunto de 32.000 produtos químicos.

Eles demonstram que sua abordagem de classificação direta resulta em previsões de maior precisão porque conjuntos de dados experimentais de diferentes fontes e para diferentes famílias químicas podem ser agrupados para gerar conjuntos de treinamento maiores. Pode ser adaptado a diferentes categorias predefinidas conforme prescrito por vários regulamentos internacionais e sistemas de classificação ou rotulagem. No futuro, a abordagem de classificação direta também pode ser expandida para outras categorias de perigo (por exemplo, toxicidade crônica), bem como para o destino ambiental (por exemplo, mobilidade ou persistência) e mostra grande potencial para melhorar as ferramentas in silico para perigos e riscos químicos avaliação.