Aprendizado de máquina revela contribuição limitada de trans

blog

LarLar / blog / Aprendizado de máquina revela contribuição limitada de trans

Sep 19, 2023

Aprendizado de máquina revela contribuição limitada de trans

Volume de Biologia da Comunicação

Biologia das Comunicações volume 6, Número do artigo: 442 (2023) Cite este artigo

1475 Acessos

5 Altmétrica

Detalhes das métricas

A apresentação do antígeno leucocitário humano (HLA) classe II é a chave para controlar e desencadear respostas imunes de células T. As moléculas HLA-DQ, que se acredita desempenharem um papel importante nas doenças autoimunes, são heterodímeros que podem ser formados como variantes cis e trans, dependendo se as cadeias α e β são codificadas na mesma (cis) ou oposta ( trans) cromossomos. Até agora, progressos limitados foram feitos para prever a apresentação do antígeno HLA-DQ. Além disso, a contribuição de variantes somente trans (ou seja, variantes não observadas na população como cis) na formação do imunopeptidoma HLA-DQ permanece amplamente não resolvida. Aqui, procuramos abordar essas questões integrando modelos de mineração de dados de imunoinformática de última geração com grandes volumes de dados de imunopeptidomics de espectrometria de massa específicos de HLA-DQ de alta qualidade. A análise demonstra poder preditivo altamente aprimorado e cobertura molecular para modelos treinados, incluindo esses novos dados HLA-DQ. Mais importante ainda, investigar o papel das variantes HLA-DQ apenas trans revela uma contribuição limitada ou nula para o imunopeptidoma HLA-DQ geral. Em conclusão, este estudo aumenta nossa compreensão das especificidades do HLA-DQ e lança luz sobre o papel relativo das variantes HLA-DQ cis versus trans-somente no espaço de apresentação do antígeno HLA classe II. O método desenvolvido, NetMHCIIpan-4.2, está disponível em https://services.healthtech.dtu.dk/services/NetMHCIIpan-4.2.

As principais moléculas de classe II do complexo de histocompatibilidade (MHC classe II) são expressas na superfície de células apresentadoras de antígenos profissionais, como células B, células dendríticas (DCs) e monócitos/macrófagos1. Essas moléculas, que são projetadas para ligar e apresentar fragmentos das proteínas exógenas às células T-helper, são heterodímeros constituídos por cadeias α e β que juntas formam a fenda de ligação do peptídeo.

Em humanos, o HLA (antígeno leucocitário humano) classe II é codificado por três loci diferentes (HLA-DR, -DQ e -DP). Esses genes HLA têm inúmeras variantes alélicas com polimorfismos que são agrupados principalmente em torno do sulco de ligação do peptídeo, resultando em uma ampla gama de especificidades distintas de ligação ao peptídeo2. Em muitas doenças autoimunes, os genes HLA classe II são os principais fatores de suscetibilidade genética1,3 que desempenham um papel central na patogênese dessas condições por apresentarem peptídeos antigênicos às células T CD4+.

Vários estudos exploraram a importância de HLA-DR e DQ nos níveis de haplótipos e genótipos entre pacientes com diabetes tipo 1 (DM1)3. Esses estudos genéticos e funcionais indicaram que os alelos HLA-DR e DQ estão associados ao risco de DM13,4. Além disso, os haplótipos DR-DQ associados demonstram uma hierarquia de risco, variando de altamente predisponente a altamente protetor4. Curiosamente, mais recentemente foi demonstrado que o HLA-DR, que geralmente desempenha o papel principal nas doenças autoimunes, tem um papel importante, mas secundário ao locus HLA-DQ em T1D5.

Distúrbios autoimunes como DM1, além de outras condições, como doença celíaca, onde uma associação direta e excepcionalmente forte para HLA-DQ foi estabelecida6, portanto, necessitam de uma caracterização mais completa e sistemática da apresentação do antígeno por moléculas HLA-DQ para permitir o estudo de suas função. Embora o campo esteja avançando rapidamente7, até agora os motivos de ligação de peptídeos de apenas um número limitado de moléculas HLA-DQ foram exaustivamente estudados8,9,10. Uma razão para isso é que as moléculas HLA-DQ são mais complexas para estudar experimentalmente. Por exemplo, devido à natureza monomórfica da cadeia α no HLA-DR, as variações polimórficas são fornecidas apenas pela cadeia β11. No HLA-DQ, as cadeias α e β contribuem para variações polimórficas. No entanto, evidências sugerem que nem todo emparelhamento de cadeias α e β resultará em um heterodímero estável devido a requisitos estruturais importantes na interface de dimerização α e β11,12. Por exemplo, DQA1*01 só foi detectado para formar heterodímeros estáveis ​​com alelos DQB1*05 e 06. Da mesma forma, os alelos DQA1*02, 03, 04, 05 e 06 formam heterodímeros estáveis ​​apenas com os alelos DQB1*02, 03 e 0412,13,14.

0.025 to an orange molecule). Logos in black frames correspond to orange molecules. Logos in red frames correspond to molecules from branches with clusters of non-covered (black) molecules. The specificity tree was calculated from the pairwise similarities between the predictions scores for the DQ molecules for a set of 100,000 random natural 13-17mer peptides. Logos were constructed for the top 1% highest scoring binding cores for these 100,000 peptides./p>20 in the data (~21% and ~32% for NetMHCIIpan-4.2 and MixMHC2pred, respectively). This suggests a poor data quality in general, yielding substantially lower performance than observed in our cross-validation. The performance on this data is therefore not a true indicator of each method's predictive power. However, the overall performance gain of our method compared to MixMHC2pred-2.0 suggests that NetMHCIIpan-4.2 is more powerful in the motif deconvolution and identification of DQ ligands./p>