Um novo estudo propõe identificação taxonômica automática com base no conjunto de dados de imagens de fósseis (> 415.000 imagens) e redes neurais convolucionais profundas

Notícias

LarLar / Notícias / Um novo estudo propõe identificação taxonômica automática com base no conjunto de dados de imagens de fósseis (> 415.000 imagens) e redes neurais convolucionais profundas

Nov 21, 2023

Um novo estudo propõe identificação taxonômica automática com base no conjunto de dados de imagens de fósseis (> 415.000 imagens) e redes neurais convolucionais profundas

A paleontologia é um campo fascinante que nos ajuda a entender a história da vida

A paleontologia é um campo fascinante que nos ajuda a entender a história da vida na Terra, estudando formas de vida antigas e sua evolução. No entanto, um dos maiores desafios na pesquisa paleontológica é o processo de identificação taxonômica trabalhoso e demorado, que requer amplo conhecimento e experiência em um determinado grupo taxonômico. Além disso, os resultados de identificação geralmente devem ser mais consistentes entre pesquisadores e comunidades.

Técnicas de aprendizado profundo surgiram como uma solução promissora para apoiar a identificação taxonômica de fósseis. Nesse contexto, uma equipe de pesquisa chinesa publicou recentemente um artigo explorando o potencial do aprendizado profundo para melhorar a precisão da identificação taxonômica.

A principal contribuição deste artigo é a criação e validação de um grande e abrangente conjunto de dados de imagens de fósseis (FID) usando rastreadores da web e curadoria manual. O conjunto de dados inclui 415.339 imagens de 50 clados diferentes de fósseis, incluindo invertebrados, vertebrados, plantas, microfósseis e vestígios de fósseis. Uma rede neural convolucional (CNN) foi usada para classificar as imagens de fósseis e obteve alta precisão de classificação, demonstrando o potencial do FID para identificação e classificação automática de fósseis. Os autores também disponibilizaram o FID publicamente para uso e desenvolvimento futuros.

Este estudo investiga experimentalmente o uso de aprendizado de transferência com modelos treinados no ImageNet para identificar e classificar fósseis no Fossil Image Database (FID). Os autores descobriram que congelar metade das camadas de rede como extratores de recursos e treinar as camadas restantes produzia o melhor desempenho. O aumento e abandono de dados foram métodos eficazes para evitar o overfitting, enquanto a queda frequente da taxa de aprendizado e grandes tamanhos de lote de treinamento contribuíram para uma convergência mais rápida e alta precisão. O estudo também examinou o impacto de dados desequilibrados no algoritmo e empregou métodos de amostragem para aprendizado desequilibrado. A qualidade do conjunto de dados foi importante para uma identificação precisa, com microfósseis tendo bom desempenho devido à disponibilidade de imagens de alta qualidade, enquanto alguns fósseis com preservação ruim e poucas amostras tiveram desempenho ruim. Os autores também descobriram que a grande diversidade morfológica intraclasse de certos clados dificultava a precisão da identificação devido à dificuldade da arquitetura DCNN em extrair características discriminativas.

A arquitetura Inception-ResNet-v2 alcançou uma precisão média de 0,90 no conjunto de dados de teste ao usar o aprendizado de transferência. Microfósseis e fósseis de vertebrados tiveram as maiores precisões de identificação de 0,95 e 0,90, respectivamente. No entanto, clados como esponjas, briozoários e vestígios de fósseis, que tinham várias morfologias ou poucas amostras no conjunto de dados, tiveram precisão de identificação abaixo de 0,80.

Em conclusão, as técnicas de aprendizado profundo, particularmente o aprendizado de transferência, mostraram resultados promissores na melhoria da precisão e eficiência da identificação taxonômica de fósseis. A criação e validação de um grande e abrangente conjunto de dados de imagens de fósseis, como o Fossil Image Database (FID), é crucial para alcançar alta precisão de identificação. Sua disponibilidade para uso público e desenvolvimento é benéfica para o avanço do campo da paleontologia. No entanto, a precisão dos modelos de aprendizado profundo depende da qualidade e diversidade do conjunto de dados, com certos clados apresentando desafios devido à sua diversidade morfológica intraclasse ou má preservação. Mais pesquisas e desenvolvimento em técnicas de aprendizado profundo e conjuntos de dados de imagens de fósseis em larga escala são necessários para superar esses desafios e melhorar a precisão e a eficiência da pesquisa paleontológica.

Além disso, técnicas de aprendizado profundo em paleontologia podem potencialmente transformar o campo além da identificação taxonômica. Essas técnicas podem extrair mais informações de dados fósseis, como segmentação e reconstrução de fósseis, integração de dados fósseis com outros tipos de dados e detecção de padrões e anomalias em conjuntos de dados fósseis de grande escala. Isso expande nossa compreensão da história da vida na Terra, abrindo caminho para descobertas e avanços empolgantes.