Nature Communications, том 14, номер статьи: 2676 (2023) Цитировать эту статью
1390 Доступов
4 Альтметрика
Подробности о метриках
Вирусы в искусственной среде вызывают проблемы общественного здравоохранения, однако они, как правило, менее изучены, чем бактерии. Чтобы лучше понять вирусную динамику в БЭ, в этом исследовании оцениваются виромы из 11 сред обитания в четырех типах БЭ с низкой и высокой заселенностью. Установлено, что разнообразие, состав, метаболические функции и образ жизни виромов зависят от среды обитания. Виды Caudoviricetes повсеместно распространены в поверхностных местообитаниях БЭ, и некоторые из них отличаются от видов, присутствующих в других средах. Гены устойчивости к противомикробным препаратам идентифицированы у вирусов, населяющих поверхности, к которым часто прикасаются жильцы, и вирусы, населяющие кожу жильцов. Разнообразные системы иммунитета CRISPR/Cas и белки анти-CRISPR обнаруживаются у бактериальных хозяев и вирусов соответственно, что согласуется с сильно связанными связями вирус-хозяин. Доказательства того, что вирусы потенциально способствуют адаптации хозяина к конкретной среде обитания, идентифицируются посредством уникальной вставки гена. Эта работа показывает, что взаимодействия вирус-хозяин часто происходят в BE и что вирусы являются неотъемлемыми членами микробиомов BE.
Вирусы заслуживают нашего внимания, поскольку они оказывают потенциально пагубное воздействие на здоровье человека1, но также играют решающую роль во многих экосистемах2,3,4. Искусственная среда (БС), в которой люди обычно проводят большую часть своей жизни, содержит богатое разнообразие микроорганизмов5, но большинство исследований БЭ в основном сосредоточены на бактериях и грибах, игнорируя при этом вирусы6,7. Общая концентрация вирусов в БЭ оценивается примерно в 105 частиц/куб.м8. Хотя условия окружающей среды большинства БЭ являются олиготрофными и считаются плохо подходящими для микробной жизни9, в микробных сообществах в воздухе обнаружено заметное разнообразие вирусов, включая вирусы, связанные с эпидемиями (например, SARS-CoV-210 и вирус желтой лихорадки11). и на поверхностях в БЭ. Несколько исследований виромов в общественных зданиях (например, в детских садах и туалетах) в основном были сосредоточены на небольших пространственных масштабах и ограниченных типах образцов и не исследовали бактериальных хозяев вирусов12,13,14. Недавнее исследование глобального масштаба, в котором применялось массовое метагеномное секвенирование без обогащения вирусами, предоставило доказательства того, что вирусы повсеместно распространены на общественных поверхностях в BE15.
Взаимодействия вирус-хозяин играют центральную роль в экологии и эволюции микробиомов в различных экосистемах4,16,17. Недавние достижения в области биоинформатических инструментов позволили точно предсказать связь между вирусами, полученными из метагенома, и их потенциальными бактериальными хозяевами, включая точные совпадения молекулярных сигналов (а именно, кластеризованных коротких палиндромных повторов с регулярными промежутками, спейсера [CRISPR], интегрированного генома и тРНК) и согласованных результатов. k-мерная частота18. Фаги развили разнообразный образ жизни и стратегии передачи, такие как умеренно-литическое переключение жизненного цикла, трансдукция и разрушение генов хозяина, чтобы использовать клеточный механизм хозяев для размножения19. В большинстве морских и почвенных сред фаги часто очень разнообразны и многочисленны, тем самым регулярно заражая значительную часть своих микробных хозяев, что вместе с экспрессией кодируемых вирусом вспомогательных метаболических генов (AMG) в геномах хозяина играет ключевую роль. в глобальном круговороте питательных веществ4,20,21. С экологической точки зрения, фаги в микробном сообществе могут опосредовать конкуренцию между видами бактерий, вызывая литические инфекции с помощью нескольких хорошо зарекомендовавших себя экологических моделей, включая модели «убей победителя» и «найди победителя»22.
Хотя фаги могут вызывать быстрые генетические и фенотипические изменения в бактериях, бактерии-хозяева также могут легко развивать защитные механизмы для противодействия атакам фагов посредством мутации de novo и других молекулярных механизмов23. Недавно в ходе метагеномного исследования всего организма человека были идентифицированы различные функциональные CRISPR/CRISPR-ассоциированные (Cas) системы у бактерий24. Однако, чтобы противодействовать иммунной системе хозяина, фаги выработали белки анти-CRISPR (Acr), инактивирующие бактериальные Cas-нуклеазы во время инфекции25. Длительная инактивация CRISPR/Cas фагами-ингибиторами может привести к утрате или даже отсутствию CRISPR/Cas в некоторых бактериальных линиях26.
1 kb, as determined by Virsorter2 (Vs2) and DeepVirFinder (DVF) and assessed by CheckV. The number of contigs (n) is indicated. Boxplots represent the median, the first quartiles and third quartiles with whiskers drawn within the 1.5 interquartile range value. Points outside the whiskers are outliers. b Accumulation curves of the viral genomes in the combined, pier, public facility, residence, and subway datasets. c Metadata and taxonomy of 1174 viral genomes with >50% completeness. d Principal coordinate analysis of the Bray–Curtis dissimilarity matrix for all of the samples. The color and shape of the symbols indicate the built environments and surface materials, respectively./p> 0.85 (Fig. S2d), suggesting that no habitat had dominant vOTUs./p>50 genes mostly encoded proteins with functions in membrane transport (i.e., ABC transporter) and direct/indirect transcriptional regulation to control gene expression, genome replication, and transmission to other host cells (i.e., response regulator) (Fig. 3e). Other common viral functions, such as packaging, assembly, and lysis, were also found in the largest clusters (Fig. 3e)./p>50 genes. The protein-coding gene cluster that encodes beta-lactamase is highlighted in red. f The number of viral genes with putative beta-lactamase domains based on the Pfam and Kyoto Encyclopedia of Genes and Genomes (KEGG) databases. g The number of antimicrobial resistance genes (ARGs) encoding beta-lactamases based on the Resistance Gene Identifier (RGI) and Resfams databases. The Venn diagram summarizes the number of identified ARGs in the two databases, and the bar plot indicates the distribution of ARGs across BE habitats./p> 80) based on the AlphaFold2 tool. d Comparison of the high-confidence structures (plDDT > 80) of the four novel predicted Acr proteins with their closest reference./p> 80]) (Fig. S9). Comparison of the high-confidence structures of the four novel predicted Acr proteins with their closest references revealed differences, which may be responsible for the variations in their functions (Fig. 5d). Several predicted Acr proteins were located in complete circular vOTUs (with lysogenic and lytic cycles) of unknown families (Fig. S10a-b), suggesting that these proteins play roles in the evolution of poorly characterized Caudoviricetes viruses. Some Acr proteins were located between the integrase and terminase subunits in viruses with lysogenic cycles (Fig. S10a), while others were close to the terminase subunits in viruses that make lytic cycles (Fig. S10b), indicating that the Acr-encoding genes are expressed not only upon initial entry and during lysogeny but also upon transition to the lytic cycle to prevent the cleavage of progeny phage genomes by CRISPR/Cas systems, as previously demonstrated in Listeria phages50. Additionally, a set of lytic genes, including those encoding endolysins, the Rz lysis protein, holin, and holin–antiholin, were carried by specific complete circular vOTUs with lysogenic cycles (Fig. S10a). Conversely, one complete circular vOTU (SL336690_c_82__full) that makes lytic cycles still harbored an integrase (Fig. S10b), suggesting that this virus undergoes a transition from a lysogenic to a lytic cycle if the environmental condition changes51./p>90% completeness), and medium-quality (50–90% completeness) genomes were retained30 (Supplementary Data 2). For genomes that contained predicted proviruses, only the proviral regions were retained. PHASTER) (https://phaster.ca/)80 and VIBRANT (v.1.2.1)81 were separately applied to identify proviral sequences according to the following two criteria, as previously proposed21: (i) the viral contigs were from contigs with non-viral (host) flanking sequences or (ii) the viral contigs harbored lysogenic marker proteins (i.e., integrase and serine recombinase). In total, 332 unique proviruses were identified using the two aforementioned tools and CheckV, and only those (127) that were integrated into a bacterial genome had high confidence (the prophage region's total score was >90 in PHASTER) and were included in the downstream analysis./p>50% completeness were clustered into species-level vOTUs on the basis of 95% average nucleotide identity (ANI) of >85% alignment fraction relative to the shorter sequence based on centroid-based clustering30. Genus- and family-level vOTUs were generated using a combination of gene sharing and amino acid identity (AAI) based on Markov clustering82 as described previously30. Briefly, viral genomes with <20% AAI or <10% gene sharing and an inflation factor of 1.2 were clustered into family-level vOTUs, while those with <50% AAI or <20% gene sharing and an inflation factor of 2.0 were clustered into genus-level vOTUs./p>70% of the annotated proteins. At the family and genus ranks, a genome must have a minimum of two annotated proteins with >30% average AAI or three annotated proteins with >40% average AAI, respectively, aligned to a reference genome from the IMG/VR database30./p>5% amino acid representation in the total alignment length were retained. A concatenated protein phylogenetic tree was inferred from the multiple sequence alignment using FastTreeMP (v.2.1.11) with the auto model87. The tree was midpoint-rooted and visualized using iToL (v.6; https://itol.embl.de/)./p>60% to the reference sequences in the CARD database (v.3.0.9)90, and using the NCBI AMRFinderPlus (v.3.8.4) tool41, with the default options of 60% coverage and 80% identity, to the reference sequences in the Resfams database (v.1.2)40. The search was performed using the hmmsearch utility in the HMMER tool (v.3.1b2), with an E-value ≤ 1e−5 and a gathering threshold score ≥40. The Resfams annotation with the best score was adopted when an ARG received different annotations from the databases./p>1000 bp were binned into MAGs using MetaWRAP (v.1.2.1)78. The resulting MAGs were further refined using the "bin_refinement" function of MetaWRAP78 and dereplicated using the "dRep dereplicate" function of dRep (v.3.2.2)97. In total, 860 bacterial rMAGs with contamination ≤10% and completeness ≥50% were generated. The ORFs in the contigs of rMAGs were predicted using Prokka (v.1.14.6)98, and the functions were annotated using EggNOG-mapper (v.2.0.1)99./p>