sasava

Metaproteómica microbiana: desde o procesamento da mostra, a recollida de datos ata a análise de datos

Wu Enhui, Qiao Liang*

Departamento de Química, Universidade de Fudan, Shanghai 200433, China

 

 

 

Os microorganismos están estreitamente relacionados coas enfermidades e a saúde humana. Como comprender a composición das comunidades microbianas e as súas funcións é unha cuestión importante que hai que estudar con urxencia. Nos últimos anos, a metaproteómica converteuse nun importante medio técnico para estudar a composición e a función dos microorganismos. Non obstante, debido á complexidade e á alta heteroxeneidade das mostras da comunidade microbiana, o procesamento de mostras, a adquisición de datos de espectrometría de masas e a análise de datos convertéronse nos tres grandes desafíos aos que se enfronta actualmente a metaproteómica. Na análise de metaproteómica, adoita ser necesario optimizar o pretratamento de diferentes tipos de mostras e adoptar diferentes esquemas de separación, enriquecemento, extracción e lise microbiana. Similar ao proteoma dunha soa especie, os modos de adquisición de datos de espectrometría de masas en metaproteómica inclúen o modo de adquisición dependente de datos (DDA) e o modo de adquisición independente de datos (DIA). O modo de adquisición de datos DIA pode recoller completamente a información peptídica da mostra e ten un gran potencial de desenvolvemento. Non obstante, debido á complexidade das mostras de metaproteoma, a súa análise de datos DIA converteuse nun problema importante que dificulta a cobertura profunda da metaproteómica. En canto á análise de datos, o paso máis importante é a construción dunha base de datos de secuencias de proteínas. O tamaño e a integridade da base de datos non só teñen un gran impacto no número de identificacións, senón que tamén afectan á análise a nivel de especies e funcionais. Na actualidade, o patrón de ouro para a construción dunha base de datos de metaproteomas é unha base de datos de secuencias de proteínas baseada no metaxenoma. Ao mesmo tempo, tamén se demostrou que o método de filtrado de bases de datos públicas baseado na busca iterativa ten un gran valor práctico. Desde a perspectiva de estratexias específicas de análise de datos, os métodos de análise de datos DIA centrados en péptidos ocuparon unha corrente principal absoluta. Co desenvolvemento da aprendizaxe profunda e da intelixencia artificial, promoverá en gran medida a precisión, a cobertura e a velocidade de análise da análise de datos macroproteómicos. En canto á análise bioinformática descendente, nos últimos anos desenvolvéronse unha serie de ferramentas de anotación que permiten realizar anotacións de especies a nivel de proteínas, péptidos e xenes para obter a composición das comunidades microbianas. En comparación con outros métodos ómicos, a análise funcional das comunidades microbianas é unha característica única da macroproteómica. A macroproteómica converteuse nunha parte importante da análise multiómica de comunidades microbianas e aínda ten un gran potencial de desenvolvemento en termos de profundidade de cobertura, sensibilidade de detección e exhaustividade da análise de datos.

 

01Pretratamento da mostra

Na actualidade, a tecnoloxía metaproteómica utilizouse amplamente na investigación do microbioma humano, solo, alimentos, océanos, lodos activos e outros campos. En comparación coa análise de proteomas dunha soa especie, o pretratamento da mostra de metaproteoma de mostras complexas enfróntase a máis retos. A composición microbiana das mostras reais é complexa, o rango dinámico de abundancia é grande, a estrutura da parede celular de diferentes tipos de microorganismos é moi diferente e as mostras adoitan conteñen unha gran cantidade de proteínas do hóspede e outras impurezas. Polo tanto, na análise do metaproteoma adoita ser necesario optimizar diferentes tipos de mostras e adoptar diferentes esquemas de separación, enriquecemento, extracción e lise microbiana.

A extracción de metaproteomas microbianos a partir de diferentes mostras ten certas semellanzas así como algunhas diferenzas, pero actualmente falta un proceso de preprocesamento unificado para diferentes tipos de mostras de metaproteomas.

 

02 Adquisición de datos de espectrometría de masas

Na análise do proteoma de escopeta, a mestura peptídica despois do pretratamento sepárase primeiro na columna cromatográfica e, a continuación, entra no espectrómetro de masas para a adquisición de datos despois da ionización. Do mesmo xeito que a análise de proteomas dunha soa especie, os modos de adquisición de datos de espectrometría de masas na análise de macroproteomas inclúen o modo DDA e o modo DIA.

 

Coa iteración e actualización continuas dos instrumentos de espectrometría de masas, aplícanse ao metaproteoma instrumentos de espectrometría de masas con maior sensibilidade e resolución, e tamén se mellora continuamente a profundidade de cobertura da análise do metaproteoma. Durante moito tempo, unha serie de instrumentos de espectrometría de masas de alta resolución encabezados por Orbitrap utilizáronse amplamente no metaproteoma.

 

A táboa 1 do texto orixinal mostra algúns estudos representativos sobre metaproteómica desde 2011 ata a actualidade en canto ao tipo de mostra, estratexia de análise, instrumento de espectrometría de masas, método de adquisición, software de análise e número de identificacións.

 

03 Análise de datos de espectrometría de masas

3.1 Estratexia de análise de datos DDA

3.1.1 Busca en bases de datos

3.1.2de novoestratexia de secuenciación

3.2 Estratexia de análise de datos DIA

 

04Clasificación de especies e anotación funcional

A composición das comunidades microbianas a diferentes niveis taxonómicos é unha das áreas clave de investigación na investigación do microbioma. Nos últimos anos desenvolvéronse unha serie de ferramentas de anotación para anotar especies a nivel de proteínas, péptidos e xenes para obter a composición das comunidades microbianas.

 

A esencia da anotación funcional é comparar a secuencia de proteínas diana coa base de datos de secuencias de proteínas funcionais. Usando bases de datos de funcións xenéticas como GO, COG, KEGG, eggNOG, etc., pódense realizar diferentes análises de anotacións funcionais en proteínas identificadas por macroproteomas. As ferramentas de anotación inclúen Blast2GO, DAVID, KOBAS, etc.

 

05 Resumo e perspectivas

Os microorganismos xogan un papel importante na saúde humana e na enfermidade. Nos últimos anos, a metaproteómica converteuse nun importante medio técnico para estudar a función das comunidades microbianas. O proceso analítico da metaproteómica é similar ao da proteómica dunha soa especie, pero debido á complexidade do obxecto de investigación da metaproteómica, é necesario adoptar estratexias específicas de investigación en cada paso da análise, desde o pretratamento da mostra, a adquisición de datos ata a análise de datos. Na actualidade, grazas á mellora dos métodos de pretratamento, á continua innovación da tecnoloxía de espectrometría de masas e ao rápido desenvolvemento da bioinformática, a metaproteómica avanzou moito na profundidade da identificación e no ámbito de aplicación.

 

No proceso de pretratamento das mostras de macroproteomas, primeiro debe considerarse a natureza da mostra. Como separar os microorganismos das células e proteínas ambientais é un dos retos fundamentais aos que se enfrontan os macroproteomas, e o equilibrio entre a eficiencia da separación e a perda microbiana é un problema urxente a resolver. En segundo lugar, a extracción de proteínas dos microorganismos debe ter en conta as diferenzas provocadas pola heteroxeneidade estrutural das diferentes bacterias. As mostras de macroproteomas no rango de trazas tamén requiren métodos específicos de pretratamento.

 

En canto aos instrumentos de espectrometría de masas, os principais instrumentos de espectrometría de masas sufriron unha transición de espectrómetros de masas baseados en analizadores de masas Orbitrap como LTQ-Orbitrap e Q Exactive a espectrómetros de masas baseados en analizadores de masas de tempo de voo acoplados con mobilidade iónica como timsTOF Pro. . A serie timsTOF de instrumentos con información sobre a dimensión de mobilidade iónica ten unha alta precisión de detección, un baixo límite de detección e unha boa repetibilidade. Progresivamente convertéronse en instrumentos importantes nunha variedade de campos de investigación que requiren detección por espectrometría de masas, como o proteoma, o metaproteoma e o metaboloma dunha única especie. Paga a pena notar que durante moito tempo, o rango dinámico dos instrumentos de espectrometría de masas limitou a profundidade de cobertura proteica da investigación sobre metaproteomas. No futuro, os instrumentos de espectrometría de masas cun rango dinámico maior poden mellorar a sensibilidade e a precisión da identificación de proteínas nos metaproteomas.

 

Para a adquisición de datos de espectrometría de masas, aínda que o modo de adquisición de datos DIA foi amplamente adoptado no proteoma dunha única especie, a maioría das análises de macroproteomas actuais aínda usan o modo de adquisición de datos DDA. O modo de adquisición de datos DIA pode obter completamente a información do fragmento de ións da mostra e, en comparación co modo de adquisición de datos DDA, ten o potencial de obter completamente a información peptídica da mostra de macroproteoma. Non obstante, debido á alta complexidade dos datos DIA, a análise dos datos do macroproteoma DIA aínda está a enfrontarse a grandes dificultades. Espérase que o desenvolvemento da intelixencia artificial e da aprendizaxe profunda mellore a precisión e integridade da análise de datos DIA.

 

Na análise de datos da metaproteómica, un dos pasos clave é a construción da base de datos de secuencias de proteínas. Para áreas de investigación populares, como a flora intestinal, pódense utilizar bases de datos de microbios intestinais como IGC e HMP, e conseguíronse bos resultados de identificación. Para a maioría das outras análises de metaproteómica, a estratexia de construción de bases de datos máis eficaz segue sendo establecer unha base de datos de secuencias de proteínas específicas para a mostra baseada nos datos de secuenciación metaxenómica. Para mostras de comunidades microbianas con alta complexidade e gran rango dinámico, é necesario aumentar a profundidade de secuenciación para aumentar a identificación de especies de baixa abundancia, mellorando así a cobertura da base de datos de secuencias de proteínas. Cando faltan datos de secuenciación, pódese utilizar un método de busca iterativo para optimizar a base de datos pública. Non obstante, a busca iterativa pode afectar ao control de calidade do FDR, polo que os resultados da busca deben ser revisados ​​coidadosamente. Ademais, aínda merece a pena explorar a aplicabilidade dos modelos tradicionais de control de calidade FDR na análise de metaproteómica. En termos de estratexia de busca, a estratexia de biblioteca espectral híbrida pode mellorar a profundidade de cobertura da metaproteómica DIA. Nos últimos anos, a biblioteca espectral predita xerada en base á aprendizaxe profunda mostrou un rendemento superior na proteómica DIA. Non obstante, as bases de datos de metaproteomas conteñen a miúdo millóns de entradas de proteínas, o que dá lugar a unha gran escala de bibliotecas espectrais previstas, consome moitos recursos informáticos e resulta nun gran espazo de busca. Ademais, a semellanza entre as secuencias de proteínas nos metaproteomas varía moito, o que dificulta asegurar a precisión do modelo de predición da biblioteca espectral, polo que as bibliotecas espectrales previstas non foron moi utilizadas na metaproteómica. Ademais, cómpre desenvolver novas estratexias de inferencia de proteínas e anotación de clasificación para aplicar á análise metaproteómica de proteínas moi similares a secuencias.

 

En resumo, como tecnoloxía emerxente de investigación do microbioma, a tecnoloxía metaproteómica conseguiu resultados de investigación significativos e tamén ten un enorme potencial de desenvolvemento.


Hora de publicación: 30-Ago-2024