304 Nerūsējošā tērauda metināta tinuma caurule/caurules ķīmiskais zomponents, globālās jūras mikrobiomas biosintētiskais potenciāls

Paldies, ka apmeklējāt vietni Nature.com.Jūs izmantojat pārlūkprogrammas versiju ar ierobežotu CSS atbalstu.Lai nodrošinātu vislabāko pieredzi, ieteicams izmantot atjauninātu pārlūkprogrammu (vai atspējot saderības režīmu pārlūkprogrammā Internet Explorer).Turklāt, lai nodrošinātu pastāvīgu atbalstu, mēs rādām vietni bez stiliem un JavaScript.
Slīdņi, kas parāda trīs rakstus katrā slaidā.Izmantojiet pogas Atpakaļ un Nākamais, lai pārvietotos pa slaidiem, vai slaidu kontrollera pogas beigās, lai pārvietotos pa katru slaidu.

Detalizēts produkta apraksts

304 Nerūsējošā tērauda metināta tīta caurule/caurule
1. Specifikācija: nerūsējošā tērauda spoles caurule / caurules
2. Tips: metināts vai bezšuvju
3. Standarts: ASTM A269, ASTM A249
4. Nerūsējošā tērauda spoles caurules OD: 6 mm līdz 25,4 mm
5. Garums: 600-3500MM vai atbilstoši klienta prasībām.
6. Sienas biezums: 0.2mm līdz 2.0mm.

7. Pielaide: OD: +/-0.01mm;Biezums: +/-0,01%.

8. Spoles iekšējā cauruma izmērs: 500MM-1500MM (var pielāgot atbilstoši klienta prasībām)

9. Spoles augstums: 200MM-400MM (var pielāgot atbilstoši klienta prasībām)

10. Virsma: gaiša vai rūdīta
11. Materiāls: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, sakausējums 625, 825, 2205, 2507 utt.
12. Iepakojums: austi maisiņi koka korpusā, koka palete, koka šahta vai atbilstoši klienta prasībām
13. Tests: ķīmiskā sastāvdaļa, tecēšanas robeža, stiepes izturība, cietības mērīšana
14. Garantija: Trešās puses (piemēram: SGS TV ) pārbaude utt.
15. Pielietojums: apdare, mēbeles, eļļas transportēšana, siltummainis, margu izgatavošana, papīra ražošana, automobiļi, pārtikas pārstrāde, medicīna utt.

Viss nerūsējošā tērauda ķīmiskais sastāvs un fizikālās īpašības, kā norādīts tālāk:

Materiāls ASTM A269 Ķīmiskais sastāvs % Maks
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Materiāls Termiskā apstrāde Temperatūra F (C) Min. Cietība
Brinels Rokvels
TP304 Risinājums 1900 (1040) 192HBW/200HV 90 HRB
TP304L Risinājums 1900 (1040) 192HBW/200HV 90 HRB
TP316 Risinājums 1900 (1040) 192HBW/200HV 90 HRB
TP316L Risinājums 1900 (1040) 192HBW/200HV 90 HRB
TP321 Risinājums 1900(1040) F 192HBW/200HV 90 HRB
TP347 Risinājums 1900 (1040) 192HBW/200HV 90 HRB

 

OD, collas OD pielaide collas (mm) WT pielaide % Garuma pielaide collas (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1/8 ( 3,2 ) 0
> 1/2 ~ 1 1/2 ± 0,005(0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~ < 3 1/2 ± 0,010(0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~ < 5 1/2 ± 0,015(0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3/16 (4,8) 0
8~< 12 ± 0,040(1,01) ± 10 3/16 (4,8) 0
12~< 14 ± 0,050(1,26) ± 10 3/16 (4,8) 0

Dabiskās mikrobu kopienas ir filoģenētiski un vielmaiņas ziņā daudzveidīgas.Papildus nepietiekami pētītām organismu grupām1 šai daudzveidībai ir arī bagātīgs potenciāls ekoloģiski un biotehnoloģijas ziņā nozīmīgu fermentu un bioķīmisko savienojumu atklāšanai2,3.Tomēr šīs daudzveidības izpēte, lai noteiktu genoma ceļus, kas sintezē šādus savienojumus un saista tos ar attiecīgajiem saimniekiem, joprojām ir izaicinājums.Mikroorganismu biosintētiskais potenciāls atklātā okeānā joprojām lielā mērā nav zināms, jo ir ierobežojumi visa genoma izšķirtspējas datu analīzē globālā mērogā.Šeit mēs pētām biosintētisko gēnu kopu daudzveidību un daudzveidību okeānā, integrējot aptuveni 10 000 mikrobu genomu no kultivētām šūnām un atsevišķām šūnām ar vairāk nekā 25 000 nesen rekonstruētiem genomiem no vairāk nekā 1000 jūras ūdens paraugiem.Šie centieni ir identificējuši aptuveni 40 000 iespējamo, galvenokārt jaunu biosintētisko gēnu kopu, no kurām dažas ir atrastas iepriekš neparedzētās filoģenētiskās grupās.Šajās populācijās mēs identificējām līniju, kas bagātināta ar biosintētisko gēnu kopām (“Candidatus Eudormicrobiaceae”), kas piederēja nekultivētai baktēriju grupai un ietvēra dažus no biosintētiski daudzveidīgākajiem mikroorganismiem šajā vidē.No tiem mēs esam raksturojuši fosfatāzes-peptīdu un pitonamīda ceļus, attiecīgi identificējot neparastas bioaktīvo savienojumu struktūras un enzimoloģijas gadījumus.Noslēgumā jāsaka, ka šis pētījums parāda, kā uz mikrobiomu balstītas stratēģijas var ļaut izpētīt iepriekš neaprakstītus fermentus un dabiskos pārtikas produktus slikti izprotamā mikrobiotā un vidē.
Mikrobi virza globālos bioģeoķīmiskos ciklus, uztur barības tīklus un uztur augus un dzīvniekus veselus5.To milzīgā filoģenētiskā, vielmaiņas un funkcionālā daudzveidība ir bagātīgs potenciāls jaunu taksonu, fermentu un bioķīmisko savienojumu, tostarp dabisko produktu, atklāšanai6.Ekoloģiskajās kopienās šīs molekulas nodrošina mikroorganismiem dažādas fizioloģiskas un ekoloģiskas funkcijas, sākot no komunikācijas līdz konkurencei 2, 7 .Papildus to sākotnējām funkcijām šie dabiskie produkti un to ģenētiski kodētie ražošanas ceļi ir piemēri biotehnoloģiskām un terapeitiskām vajadzībām2,3.Šādu ceļu un savienojumu identificēšanu ir ievērojami atvieglojusi kultivēto mikrobu izpēte.Tomēr dabiskās vides taksonomiskie pētījumi ir parādījuši, ka lielākā daļa mikroorganismu nav kultivēti8.Šī kultūras novirze ierobežo mūsu spēju izmantot daudzu mikrobu kodēto funkcionālo daudzveidību 4, 9.
Lai pārvarētu šos ierobežojumus, tehnoloģiskie sasniegumi pēdējo desmit gadu laikā ir ļāvuši pētniekiem tieši (ti, bez iepriekšējas kultūras) sekvencēt mikrobu DNS fragmentus no veselām kopienām (metagenomika) vai atsevišķām šūnām.Spēja apkopot šos fragmentus lielākos genoma fragmentos un attiecīgi rekonstruēt vairākus metagenomiski samontētus genomus (MAG) vai atsevišķus amplificētus genomus (SAG), paver nozīmīgu iespēju mikrobioma (ti, mikrobu kopienu un mikrobioma) taksocentriskiem pētījumiem.bruģēt jaunus ceļus.savs ģenētiskais materiāls noteiktā vidē) 10,11,12.Patiešām, jaunākie pētījumi ir ievērojami paplašinājuši mikrobu daudzveidības filoģenētisko attēlojumu uz Zemes1, 13 un atklājuši lielu daļu funkcionālās daudzveidības atsevišķās mikrobu kopienās, kuras iepriekš neaptvēra kultivētās mikroorganismu atsauces genoma sekvences (REF)14.Spēja izvietot neatklātu funkcionālo daudzveidību saimnieka genoma kontekstā (ti, genoma izšķirtspēja) ir būtiska, lai prognozētu vēl neraksturīgas mikrobu līnijas, kas, iespējams, kodē jaunus dabiskus produktus 15, 16 vai lai izsekotu šādus savienojumus līdz to sākotnējam ražotājam17.Piemēram, kombinētās metagenomiskās un vienas šūnas genoma analīzes pieejas rezultātā Candidatus Entotheonella, ar sūkli saistītu baktēriju grupa, ir identificēta kā dažādu zāļu potenciālu ražotāji18.Tomēr, neskatoties uz nesenajiem mēģinājumiem veikt dažādu mikrobu kopienu genomu izpēti, joprojām trūkst vairāk nekā divas trešdaļas no globālajiem metagenomiskiem datiem par Zemes lielāko ekosistēmu okeānu16, 20.Tādējādi kopumā jūras mikrobioma biosintētiskais potenciāls un tā potenciāls kā jaunu fermentatīvu un dabisku produktu krātuve joprojām lielā mērā nav pētīts.
Lai izpētītu jūras mikrobiomu biosintētisko potenciālu globālā mērogā, mēs vispirms apkopojām jūras mikrobu genomus, kas iegūti, izmantojot no kultūras atkarīgas un nekultūras metodes, lai izveidotu plašu filoģenētikas un gēnu funkciju datubāzi.Šīs datu bāzes pārbaude atklāja plašu biosintētisko gēnu klasteru (BGC) klāstu, no kuriem lielākā daļa pieder vēl neraksturīgām gēnu klasteru (GCF) ģimenēm.Turklāt mēs identificējām nezināmu baktēriju ģimeni, kurai līdz šim atklātā okeānā ir vislielākā zināmā BGC daudzveidība.Eksperimentālai apstiprināšanai mēs izvēlējāmies divus ribosomu sintēzes un pēctranslācijas modificēto peptīdu (RiPP) ceļus, pamatojoties uz to ģenētiskajām atšķirībām no pašlaik zināmajiem ceļiem.Šo ceļu funkcionālais raksturojums ir atklājis negaidītus enzīmoloģijas piemērus, kā arī strukturāli neparastus savienojumus ar proteāzes inhibējošu aktivitāti.
Sākumā mūsu mērķis bija izveidot globālu datu resursu genoma analīzei, koncentrējoties uz tā baktēriju un arheālajiem komponentiem.Šim nolūkam mēs apkopojām metagenomiskos datus un 1038 jūras ūdens paraugus no 215 globāli izplatītām paraugu ņemšanas vietām (platuma diapazons = 141, 6 °) un vairākiem dziļiem slāņiem (no 1 līdz 5600 m dziļumā, kas aptver pelaģiskās, mezopelāģiskās un bezdibenes zonas).Fons 21, 22, 23 (1.a attēls, paplašinātie dati, 1.a attēls un 1. papildu tabula).Papildus plaša ģeogrāfiskā pārklājuma nodrošināšanai šie selektīvi filtrētie paraugi ļāva mums salīdzināt dažādus jūras mikrobioma komponentus, tostarp ar vīrusiem bagātus (<0,2 µm), ar prokariotiem bagātos (0,2–3 µm), ar daļiņām bagātos (0,8 µm). ).–20 µm) un vīrusu noplicinātās (>0,2 µm) kolonijas.
a, Kopā 1038 publiski pieejami jūras mikrobu kopienu genomi (metagenomika), kas savākti no 215 globāli izplatītām vietām (62°S līdz 79°N un 179°W līdz 179°E.).Kartes flīzes © Esri.Avoti: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ un Esri.b, šie metagenomi tika izmantoti, lai rekonstruētu MAG (metodes un papildu informācija), kas datu kopās (atzīmētas ar krāsu) atšķiras pēc daudzuma un kvalitātes (metodes).Rekonstruētie MAG tika papildināti ar publiski pieejamiem (ārējiem) genomiem, tostarp ar rokām izgatavotiem MAG26, SAG27 un REF.27 Sastādīt OMD.c, salīdzinot ar iepriekšējiem ziņojumiem, kuru pamatā ir tikai SAG (GORG)20 vai MAG (GEM)16, OMD uzlabo jūras mikrobu kopienu genoma raksturojumu (metagenomiskā nolasīšanas kartēšanas ātrums; metode) divas līdz trīs reizes, nodrošinot konsekventāku padziļinātu un padziļinātu attēlojumu. platuma grādos..<0,2, n=151, 0,2–0,8, n=67, 0,2–3, n=180, 0,8–20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD grupēšana sugu klasteru līmenī (95% vidējā nukleotīdu identitāte) identificē kopējo aptuveni 8300 sugas, no kurām vairāk nekā puse iepriekš nav raksturotas saskaņā ar taksonomiskām anotācijām, izmantojot GTDB (89. versija) e, sugu klasifikācija pēc genoma veida parādīja, ka MAG, SAG un REF labi papildina viens otru, atspoguļojot filoģenētisko daudzveidību. jūras mikrobioms.Jo īpaši 55%, 26% un 11% sugu bija specifiskas attiecīgi MAG, SAG un REF.BATS, Bermudu Atlantijas laika sērija;GEM, Zemes mikrobioma genomi;GORG, globālais okeāna atsauces genoms;HOT, Havaju okeāna laika rindas.
Izmantojot šo datu kopu, mēs kopumā rekonstruējām 26 293 MAG, galvenokārt baktēriju un arheālus (1.b attēls un paplašinātie dati, 1.b attēls).Mēs izveidojām šos MAG no komplektiem no atsevišķiem, nevis apvienotiem metagenomiskiem paraugiem, lai novērstu dabisko secību variāciju sabrukumu starp paraugiem no dažādām vietām vai laika punktiem (metodes).Turklāt mēs grupējām genoma fragmentus, pamatojoties uz to izplatības korelācijām lielā skaitā paraugu (no 58 līdz 610 paraugiem atkarībā no aptaujas; metode).Noskaidrojām, ka šis ir laikietilpīgs, bet nozīmīgs solis24, kas tika izlaists vairākos vērienīgos MAG16, 19, 25 rekonstrukcijas darbos un būtiski uzlabo kvantitāti (vidēji 2,7 reizes) un kvalitāti (vidēji +20%). genoms.rekonstruēts no šeit pētītā jūras metagenoma (paplašināti dati, 2.a attēls un papildu informācija).Kopumā šie centieni izraisīja jūras mikrobu MAG pieaugumu 4,5 reizes (6 reizes, ja ņem vērā tikai augstas kvalitātes MAG), salīdzinot ar visplašāko šodien pieejamo MAG resursu16 (metodes).Pēc tam šis jaunizveidotais MAG komplekts tika apvienots ar 830 ar rokām atlasītiem MAG26, 5969 SAG27 un 1707 REF.Divdesmit septiņas jūras baktēriju un arheju sugas veidoja 34 799 genomu kombinatorisko kolekciju (1.b attēls).
Pēc tam mēs novērtējām jaunizveidoto resursu, lai uzlabotu tā spēju pārstāvēt jūras mikrobu kopienas un novērtētu dažādu genomu veidu integrācijas ietekmi.Vidēji mēs noskaidrojām, ka tas aptver aptuveni 40–60% no jūras metagenomiskiem datiem (1.c attēls), kas ir divas līdz trīs reizes lielāks par iepriekšējo MAG ziņojumu pārklājumu gan dziļumā, gan platuma grādos. Vairāk sērijas 16 vai SAG20.Turklāt, lai sistemātiski izmērītu taksonomisko daudzveidību izveidotajās kolekcijās, mēs anotējām visus genomus, izmantojot genoma taksonomijas datu bāzes (GTDB) rīku komplektu (metodes), un izmantojām vidējo genoma mēroga nukleotīdu identitāti 95%.28, lai identificētu 8304 sugu kopas (sugas).Divas trešdaļas no šīm sugām (ieskaitot jaunas klades) iepriekš nebija parādījušās GTDB, no kurām 2790 tika atklātas, izmantojot šajā pētījumā rekonstruēto MAG (1. d attēls).Turklāt mēs noskaidrojām, ka dažāda veida genomi ir ļoti komplementāri: 55%, 26% un 11% sugu pilnībā veido attiecīgi MAG, SAG un REF (1.e attēls).Turklāt MAG aptvēra visus 49 veidus, kas atrasti ūdens stabā, savukārt SAG un REF pārstāvēja tikai attiecīgi 18 un 11 no tiem.Tomēr SAG labāk atspoguļo visbiežāk sastopamo kladu daudzveidību (paplašināti dati, 3.a attēls), piemēram, pelaģiskās baktērijas (SAR11), ar SAG aptver gandrīz 1300 sugas un MAG tikai 390 sugas.Proti, REF reti pārklājās ar MAG vai SAG sugas līmenī un veidoja> 95% no aptuveni 1000 genomiem, kas nav atrasti šeit pētītajos atklātā okeāna metagenomiskos kopās, galvenokārt mijiedarbības ar cita veida izolētiem reprezentatīviem jūras paraugiem (piemēram, nogulumiem) dēļ. .vai saimniekdators).Lai padarītu to plaši pieejamu zinātnieku aprindām, šo jūras genoma resursu, kas ietver arī neklasificētus fragmentus (piemēram, no prognozētajiem fāgiem, genoma salām un genoma fragmentiem, par kuriem nav pietiekami daudz datu MAG rekonstrukcijai), var salīdzināt ar taksonomijas datiem. .Piekļūstiet anotācijām kopā ar gēnu funkcijām un kontekstuālajiem parametriem okeāna mikrobioloģijas datu bāzē (OMD; https://microbiomics.io/ocean/).
Pēc tam mēs sākām izpētīt biosintētiskā potenciāla bagātību un novitāti atklātā okeāna mikrobiomās.Šim nolūkam mēs vispirms izmantojām antiSMASH visiem MAG, SAG un REF, kas atrasti 1038 jūras metagenomās (metodēs), lai prognozētu kopumā 39 055 BGC.Pēc tam mēs tos sagrupējām 6907 neliekās GCF un 151 gēnu klasteru populācijās (GCC; 2. papildu tabula un metodes), lai ņemtu vērā raksturīgo redundanci (ti, vienu un to pašu BGC var kodēt vairākos genomos) un metagenomiskos datus Koncentrēto BGC fragmentācija.Nepilnīgi BGC būtiski nepalielināja, ja tādi bija (papildinformācija), attiecīgi GCF un GCC skaitu, kas satur vismaz vienu neskartu BGC locekli 44% un 86% gadījumu.
GCC līmenī mēs atradām plašu paredzamo RiPP un citu dabisko produktu klāstu (2.a attēls).Starp tiem, piemēram, arilpoliēni, karotinoīdi, ektoīni un siderofori pieder pie GCC ar plašu filoģenētisko izplatību un lielu daudzumu okeāna metagenomās, kas var liecināt par mikroorganismu plašu pielāgošanos jūras videi, tostarp izturību pret reaktīvām skābekļa sugām, oksidatīvais un osmotiskais stress..vai dzelzs uzsūkšanos (vairāk informācijas).Šī funkcionālā daudzveidība ir pretrunā ar nesen veikto analīzi par aptuveni 1,2 miljoniem BGC no aptuveni 190 000 genomu, kas glabājas NCBI RefSeq datubāzē (BiG-FAM/RefSeq, turpmāk saukts par RefSeq)29, kas parādīja, ka neribosomālā sintetāzes peptīdi un poliketīdu sintetāze (NRPS) (PKS) BGC (papildu informācija).Mēs arī atradām 44 (29%) GCC tikai attāli saistītus ar jebkuru RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; 2.a attēls un metodes) un 53 (35%) GCC tikai MAG , uzsverot potenciālu lai atklātu iepriekš neaprakstītas ķīmiskas vielas OMD.Ņemot vērā to, ka katrs no šiem GCC, iespējams, pārstāv ļoti dažādas biosintētiskās funkcijas, mēs turpinājām analizēt datus GCF līmenī, cenšoties nodrošināt detalizētāku BGC grupu, kas, domājams, kodēs līdzīgus dabiskos produktus29.Kopumā 3861 (56%) identificētais GCF nepārklājās ar RefSeq, un> 97% GCF nebija MIBiG, kas ir viena no lielākajām eksperimentāli apstiprināto BGC datu bāzēm (2.b attēls).Lai gan nav pārsteidzoši atklāt daudzus potenciālus jaunus ceļus iestatījumos, kas nav labi atspoguļoti atsauces genomā, mūsu metode BGC dereplicēšanai GCF pirms salīdzinošās novērtēšanas atšķiras no iepriekšējiem ziņojumiem 16 un ļauj mums sniegt objektīvu novitātes novērtējumu.Lielākā daļa no jaunās daudzveidības (3012 GCF jeb 78%) atbilst prognozētajiem terpēniem, RiPP vai citiem dabīgiem produktiem, un lielākā daļa (1815 GCF jeb 47%) ir kodēti nezināmos veidos to biosintētiskā potenciāla dēļ.Atšķirībā no PKS un NRPS kopām, šie kompaktie BGC metagenomiskās montāžas laikā 31 ir mazāk sadrumstaloti un ļauj vairāk laika un resursu ietilpīgāk raksturot to produktus.
Kopumā 39 055 BGC tika sagrupēti 6907 GCF un 151 GCC.a, datu attēlojums (iekšējais ārējais).BGC attālumu hierarhiska klasterizācija, pamatojoties uz GCC, no kurām 53 nosaka tikai MAG.GCC satur BGC no dažādiem taksoniem (ln-transformēta vārtu frekvence) un dažādām BGC klasēm (apļa izmērs atbilst tā biežumam).Katram GCC ārējais slānis attēlo BGC skaitu, izplatību (paraugu procentuālo daļu) un attālumu (minimālais BGC kosinusa attālums (min (dMIBiG))) no BiG-FAM līdz BGC.GCC ar BGC, kas ir cieši saistīti ar eksperimentāli pārbaudītiem BGC (MIBiG), ir izcelti ar bultiņām.b Salīdzinot GCF ar prognozētajiem (BiG-FAM) un eksperimentāli apstiprinātajiem (MIBiG) BGC, tika atrasts 3861 jauns (d–>0,2) GCF.Lielākā daļa (78%) no tiem kodē RiPP, terpēnus un citus iespējamos dabiskos produktus.c, visi OMD genomi, kas atrasti 1038 jūras metagenomos, tika ievietoti GTDB bāzes kokā, lai parādītu OMD filoģenētisko pārklājumu.Klādes bez genomiem OMD ir parādītas pelēkā krāsā.BGC skaits atbilst lielākajam prognozētajam BGC skaitam vienā genomā noteiktā kladē.Skaidrības labad pēdējie 15% mezglu ir sakļauti.Bultiņas norāda klades, kas bagātas ar BGC (>15 BGC), izņemot Mycobacterium, Gordonia (otrā vieta pēc Rhodococcus) un Crocosphaera (otrā pēc Synechococcus).d, nezināms c.Eremiobacterota uzrādīja vislielāko biosintētisko daudzveidību (Šenona indekss, pamatojoties uz dabīgā produkta veidu).Katra josla pārstāv genomu ar visvairāk BGC sugā.T1PKS, PKS I tips, T2/3PKS, PKS II tips un III tips.
Papildus bagātībai un novitātei mēs pētām jūras mikrobioma biosintētiskā potenciāla bioģeogrāfisko struktūru.Paraugu grupēšana pēc vidējā metagenomiskā GCF kopiju skaita sadalījuma (metodes) parādīja, ka zema platuma grādos, virszemes, ar prokariotiem bagātās un ar vīrusiem nabadzīgās kopienas, galvenokārt no virszemes vai dziļākiem saules apspīdētiem ūdeņiem, bija bagātas ar RiPP un BGC terpēniem.Turpretim polārās, dziļjūras, ar vīrusiem un daļiņām bagātās kopienas bija saistītas ar lielāku NRPS un PKS BGC daudzumu (paplašināti dati, 4. att. un papildu informācija).Visbeidzot, mēs noskaidrojām, ka labi izpētītās tropiskās un pelaģiskās kopienas ir visdaudzsološākie jaunu terpēnu avoti (Papildināto datu attēls).Lielākais potenciāls PKS, RiPP un citiem dabas produktiem (5.a attēls ar paplašinātiem datiem).
Lai papildinātu mūsu pētījumu par jūras mikrobiomu biosintētisko potenciālu, mēs centāmies kartēt to filoģenētisko izplatību un identificēt jaunas ar BGC bagātinātas klades.Šim nolūkam mēs ievietojām jūras mikrobu genomus normalizētā GTDB13 baktēriju un arheoloģiskajā filoģenētiskajā kokā un pārklājām iespējamos biosintēzes ceļus, ko tie kodē (2.c att.).Mēs esam viegli atklājuši vairākas ar BGC bagātinātas klades (kuras pārstāv vairāk nekā 15 BGC) jūras ūdens paraugos (metodes), kas pazīstamas ar savu biosintētisko potenciālu, piemēram, zilaļģes (Synechococcus) un Proteus baktērijas, piemēram, Tistrella32, 33, vai arī nesen piesaistījuši uzmanību to dēļ. dabīgie produkti.piemēram, Myxococcota (Sandaracinaceae), Rhodococcus un Planctomycetota34,35,36.Interesanti, ka šajās kladēs mēs atradām vairākas iepriekš neizpētītas līnijas.Piemēram, tās sugas ar visbagātāko biosintētisko potenciālu phyla Planctomycetota un Myxococcota piederēja attiecīgi neraksturīgām kandidātu kārtām un ģintīm (3. papildu tabula).Kopumā tas liek domāt, ka OMD nodrošina piekļuvi iepriekš nezināmai filoģenētiskai informācijai, tostarp mikroorganismiem, kas var būt jauni mērķi fermentu un dabisko produktu atklāšanai.
Tālāk mēs raksturojām ar BGC bagātināto kladi, ne tikai saskaitot maksimālo BGC skaitu, ko kodējuši tās dalībnieki, bet arī novērtējot šo BGC daudzveidību, kas izskaidro dažādu veidu dabisko kandidātproduktu biežumu (2.c attēls un metodes). )..Mēs noskaidrojām, ka šajā pētījumā biosintētiski daudzveidīgākās sugas pārstāvēja īpaši izstrādātas baktēriju MAG.Šīs baktērijas pieder nekultivētai Candidatus Eremiobacterota patversmei, kas joprojām ir lielā mērā neizpētīta, ja neskaita dažus genoma pētījumus37, 38.Jāatzīmē, ka “apm.Eremiobacterota ģints ir analizēta tikai sauszemes vidē39, un nav zināms, ka tajā būtu iekļauti BGC bagātināti locekļi.Šeit mēs esam rekonstruējuši astoņas vienas sugas MAG (nukleotīdu identitāte > 99%) 23. Tāpēc mēs piedāvājam sugas nosaukumu “Candidatus Eudoremicrobium malaspinii”, kas nosaukts nereīdas (jūras nimfas) vārdā, kas ir skaista dāvana grieķu mitoloģijā un ekspedīcijās.'Ka.Saskaņā ar 13. filoģenētisko anotāciju E. malaspinii nav iepriekš zināmu radinieku, kas būtu zemāki par sekvences līmeni, un tādējādi tā pieder jaunai baktēriju ģimenei, kuru mēs ierosinām “Ca.E. malaspinii” kā tipa sugas un „Ca.Eudormicrobiaceae” kā oficiālo nosaukumu (papildu informācija).Īsa metagenomiskā rekonstrukcija 'Ca.E. malaspinii genoma projekts tika apstiprināts ar ļoti zemu ievadi, ilgi lasāmu metagenomisko secību un mērķtiecīgu viena parauga montāžu (metodes) kā vienu 9,63 Mb lineāru hromosomu ar 75 kb dublēšanos.kā vienīgā atlikušā neskaidrība.
Lai noteiktu šīs sugas filoģenētisko kontekstu, mēs meklējām 40 cieši saistītas sugas papildu eikariotu bagātinātos metagenomiskos paraugos no Taras okeāna ekspedīcijas, izmantojot mērķtiecīgu genoma rekonstrukciju.Īsumā mēs esam saistījuši metagenomiskos nolasījumus ar genoma fragmentiem, kas saistīti ar “Ca.E. malaspinii” un izvirzīja hipotēzi, ka paaugstināts vervēšanas rādītājs šajā paraugā norāda uz citu radinieku klātbūtni (metodes).Rezultātā mēs atradām 10 MAG — 19 MAG kombināciju, kas pārstāv piecas sugas trīs ģintīs no jauna definētās ģimenes (ti, “Ca. Eudormicrobiaceae”).Pēc manuālas pārbaudes un kvalitātes kontroles (paplašināti dati, 6. att. un papildu informācija) konstatējām, ka “Ca.Eudormicrobiaceae sugām ir lielāki genomi (8 Mb) un bagātāks biosintētiskais potenciāls (14 līdz 22 BGC katrai sugai) nekā citiem “Ca” locekļiem.Clade Eremiobacterota (līdz 7 BGC) (3.a–c att.).
a, piecu “Ca” filoģenētiskās pozīcijas.Eudormicrobiaceae sugas uzrādīja BGC bagātību, kas raksturīga šajā pētījumā identificētajām jūras līnijām.Filoģenētiskajā kokā ietilpst visas 'Ca.Evolūcijas fonam (metodes) tika izmantotas MAG Eremiobacterota un citu cilšu pārstāvji (genoma numuri iekavās), kas nodrošināti GTDB (89. versija).Attālākie slāņi pārstāv klasifikāciju ģimenes līmenī ("Ca. Eudormicrobiaceae" un "Ca. Xenobiaceae") un klases līmenī ("Ca. Eremiobacteria").Šajā pētījumā aprakstītās piecas sugas ir attēlotas ar burtciparu kodiem un ierosinātajiem binomināliem nosaukumiem (papildu informācija).b, labi.Eudormicrobiaceae sugām ir septiņi kopīgi BGC kodoli.BGC trūkums A2 kladē bija saistīts ar reprezentatīvā MAG nepilnību (3. papildu tabula).BGC ir raksturīgas “Ca.Amphithomicrobium” un “Ca.Amphithomicrobium” (A un B klase) nav parādīti.c, visi BGC, kas kodēti kā “Ca.Tika konstatēts, ka Eudoremicrobium taraoceanii ir izteikts 623 metatranskriptos, kas ņemti no Taras okeāniem.Cietie apļi norāda uz aktīvo transkripciju.Oranži apļi apzīmē log2 pārveidotas locījuma izmaiņas zem un virs mājturības gēna ekspresijas ātruma (metodes).d, relatīvās pārpilnības līknes (metodes), kas parāda 'Ca.Eudormicrobiaceae sugas ir plaši izplatītas lielākajā daļā okeāna baseinu un visā ūdens stabā (no virsmas līdz vismaz 4000 m dziļumam).Pamatojoties uz šīm aplēsēm, mēs noskaidrojām, ka “Ca.E. malaspinii' veido līdz 6% prokariotu šūnu dziļjūras pelaģisko graudu kopienās.Mēs uzskatījām, ka suga atrodas vietā, ja tā tika atrasta jebkurā konkrētā dziļuma slāņa lieluma daļā.IO – Indijas okeāns, NAO – Ziemeļatlantijas, NPO – Klusā okeāna ziemeļu daļa, RS – Sarkanā jūra, SAO – Dienvidatlantijas, SO – Dienvidu okeāns, SPO – Klusā okeāna dienvidu daļa.
Ca daudzuma un izplatības izpēte.Eudormicrobiaceae, kas, kā konstatējām, dominē lielākajā daļā okeāna baseinu, kā arī visā ūdens stabā (3.d att.).Lokāli tie veido 6% no jūras mikrobu kopienas, padarot tos par nozīmīgu pasaules jūras mikrobioma daļu.Turklāt mēs atradām relatīvo Ca saturu.Eudormicrobiaceae sugas un to BGC ekspresijas līmeņi bija visaugstākie eikariotu bagātinātajā frakcijā (3.c att. un paplašinātie dati, 7. att.), kas norāda uz iespējamu mijiedarbību ar cietajām daļiņām, tostarp planktonu.Šim novērojumam ir zināma līdzība ar 'Ca.Eudoremicrobium BGC, kas ražo citotoksiskus dabiskus produktus, izmantojot zināmus ceļus, var izrādīties plēsonīga uzvedība (papildu informācija un paplašinātie dati, 8. attēls), līdzīgi citiem plēsējiem, kas īpaši ražo metabolītus, piemēram, Myxococcus41.Ca atklājums.Eudormicrobiaceae mazāk pieejamos (dziļi okeāna) vai eikariotu, nevis prokariotu paraugos var izskaidrot, kāpēc šīs baktērijas un to negaidītā BGC daudzveidība dabiskās pārtikas izpētes kontekstā joprojām ir neskaidra.
Galu galā mēs centāmies eksperimentāli apstiprināt mūsu uz mikrobiomu balstītā darba solījumu jaunu ceļu, fermentu un dabisko produktu atklāšanā.Ir zināms, ka starp dažādām BGC klasēm RiPP ceļš kodē bagātīgu ķīmisko un funkcionālo daudzveidību, ko izraisa dažādas peptīda pēctranslācijas modifikācijas, ko veic nobrieduši enzīmi42.Tāpēc mēs izvēlējāmies divus 'Ca.Eudoremicrobium' RiPP BGC (attēls 3.b un 4.a–e) ir balstīts uz to pašu, kas zināms BGC (\(\bar{d}\)MIBiG un \(\bar{d}\)RefSeq virs 0,2) .
a–c, In vitro heterologā ekspresija un in vitro enzīmu testi jaunam (\(\bar{d}\)RefSeq = 0,29) RiPP biosintēzes klasterim, kas raksturīgs dziļjūras Ca sugām.E. malaspinii' rezultātā tika ražoti difosforilēti produkti.c, modifikācijas, kas identificētas, izmantojot augstas izšķirtspējas (HR) MS/MS (fragmentācija ķīmiskajā struktūrā norādīta ar b un y joniem) un KMR (paplašināti dati, 9. att.).d, šis fosforilētais peptīds uzrāda zemu zīdītāju neitrofilo elastāzes mikromolāru inhibīciju, kas nav atrodama kontroles peptīdā un dehidratējošajā peptīdā (ķīmiskas noņemšanas izraisīta dehidratācija).Eksperiments tika atkārtots trīs reizes ar līdzīgiem rezultātiem.Piemēram, otrā jaunā proteīna biosintēzes klastera \(\bar{d}\)RefSeq = 0,33) heterologā ekspresija izskaidro četru nobriedušu enzīmu funkciju, kas modificē 46 aminoskābju kodola peptīdu.Atlikumi tiek iekrāsoti atbilstoši modifikācijas vietai, ko paredz HR-MS/MS, izotopu marķēšana un KMR analīze (papildu informācija).Pārtraukta krāsa norāda, ka modifikācija notiek vienā no diviem atlikumiem.Attēls ir daudzu heterologu konstrukciju apkopojums, lai parādītu visu nobriedušu enzīmu aktivitāti vienā kodolā.h, NMR datu ilustrācija amīda N-metilēšanai.Pilni rezultāti ir parādīti attēlā.10 ar paplašinātiem datiem.i, nobriedušā FkbM proteīna klastera enzīma filoģenētiskā pozīcija starp visiem FkbM domēniem, kas atrodami MIBiG 2.0 datu bāzē, atklāj šīs ģimenes enzīmu ar N-metiltransferāzes aktivitāti (papildu informācija).Tiek parādītas BGC (a, e), prekursoru peptīdu struktūru (b, f) un dabisko produktu iespējamās ķīmiskās struktūras (c, g) shematiskās diagrammas.
Pirmais RiPP ceļš (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) tika atrasts tikai dziļūdens sugām “Ca.E. malaspinii” un peptīdu prekursora kodi (4.a, b. att.).Šajā nobriedušajā fermentā mēs esam identificējuši vienu funkcionālu domēnu, kas ir homologs lantipeptīda sintāzes dehidratācijas domēnam, kas parasti katalizē fosforilāciju un sekojošu 43 noņemšanu (papildu informācija).Tāpēc mēs prognozējam, ka prekursora peptīda modifikācija ietver šādu divpakāpju dehidratāciju.Tomēr, izmantojot tandēma masas spektrometriju (MS/MS) un kodolmagnētiskās rezonanses spektroskopiju (NMR), mēs identificējām polifosforilētu lineāru peptīdu (4.c attēls).Lai gan tas bija negaidīts, mēs atradām vairākas pierādījumu līnijas, kas apstiprina, ka tas ir galaprodukts: divi dažādi heterologi saimnieki un bez dehidratācijas in vitro testos, galveno atlieku identificēšana, kas mutē nobriedušā enzīma katalītiskā dehidratācijas vietā.visu rekonstruēja “Ca”.E. malaspinii genoms (paplašināti dati, 9. att. un papildu informācija) un, visbeidzot, fosforilētā produkta bioloģiskā aktivitāte, bet ne ķīmiski sintezētā dehidrētā forma (4.d att.).Faktiski mēs noskaidrojām, ka tam piemīt zema mikromolārā proteāzes inhibējošā aktivitāte pret neitrofilo elastāzi, kas ir salīdzināma ar citiem saistītiem dabīgiem produktiem koncentrācijas diapazonā (IC50 = 14,3 μM) 44 , neskatoties uz to, ka ekoloģiskā loma vēl ir jānoskaidro.Pamatojoties uz šiem rezultātiem, mēs ierosinām ceļu nosaukt par "fosfeptīnu".
Otrais gadījums ir sarežģīts RiPP ceļš, kas raksturīgs “Ca.Tika prognozēts, ka ģints Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) kodē dabiskos proteīna produktus (4.e attēls).Šie ceļi ir īpaši nozīmīgi biotehnoloģiski, jo paredzams blīvums un neparastu ķīmisko modifikāciju daudzveidība, ko nosaka fermenti, ko kodē salīdzinoši īsie BGC45.Mēs atklājām, ka šis proteīns atšķiras no iepriekš raksturotajiem proteīniem ar to, ka tajā trūkst gan galvenā polikeramīdu NX5N motīva, gan landornamīdu lantionīna cilpas 46 .Lai pārvarētu parasto heterologo ekspresijas modeļu ierobežojumus, mēs tos izmantojām kopā ar pielāgotu Microvirgula aerodenitrificans sistēmu, lai raksturotu četrus nobriedušu ceļa fermentus (metodes).Izmantojot MS/MS, izotopu marķēšanas un KMR kombināciju, mēs atklājām šos nobriedušos enzīmus peptīda 46 aminoskābju kodolā (4.f, g att., paplašināti dati, 10.–12. att. un papildu informācija).Starp nobriedušiem enzīmiem mēs raksturojām pirmo FkbM O-metiltransferāzes ģimenes locekļa 47 parādīšanos RiPP ceļā un negaidīti atklājām, ka šis nobriedis enzīms ievada mugurkaula N-metilēšanu (4.h, i att. un papildu informācija).Lai gan šī modifikācija ir zināma dabiskajos NRP48 produktos, amīda saišu fermentatīvā N-metilēšana ir sarežģīta, bet biotehnoloģiski nozīmīga reakcija49, kas līdz šim ir interesējusi RiPP borozīnu saimi.Specifiskums 50,51.Šīs aktivitātes identificēšana citās enzīmu un RiPP ģimenēs var atvērt jaunus lietojumus un paplašināt proteīnu funkcionālo daudzveidību 52 un to ķīmisko daudzveidību.Pamatojoties uz identificētajām modifikācijām un piedāvātās produkta struktūras neparasto garumu, mēs piedāvājam ceļa nosaukumu “pythonamide”.
Negaidītas enzimoloģijas atklāšana funkcionāli raksturotā enzīmu saimē ilustrē vides genomikas solījumu jauniem atklājumiem, kā arī ilustrē ierobežoto spēju veikt funkcionālus secinājumus, pamatojoties tikai uz sekvences homoloģiju.Tādējādi kopā ar ziņojumiem par nekanoniskiem bioaktīviem polifosforilētiem RiPP mūsu rezultāti parāda resursu ietilpīgu, bet kritisku vērtību sintētiskās bioloģijas centieniem pilnībā atklāt bioķīmisko savienojumu funkcionālo bagātību, daudzveidību un neparastās struktūras.
Šeit mēs demonstrējam mikrobu kodēto biosintētiskā potenciāla klāstu un to genoma kontekstu globālajā jūras mikrobiomā, atvieglojot turpmāko izpēti, padarot iegūto resursu pieejamu zinātnieku aprindām (//microbiomics.io/ocean/).Mēs noskaidrojām, ka lielu daļu tā filoģenētisko un funkcionālo jaunumu var iegūt, tikai rekonstruējot MAG un SAG, jo īpaši nepietiekami izmantotās mikrobu kopienās, kas varētu vadīt turpmākos bioloģiskās izpētes centienus.Lai gan mēs šeit koncentrēsimies uz "Ca.Eudormicrobiaceae” kā cilts, īpaši biosintētiski “talantīga”, daudzi no neatklātajā mikrobiotā prognozētajiem BGC, iespējams, kodē iepriekš neaprakstītas fermentācijas, kas rada savienojumus ar videi un/vai biotehnoloģiski nozīmīgu darbību.
Tika iekļautas metagenomiskās datu kopas no galvenajiem okeanogrāfiskajiem un laikrindu pētījumiem ar pietiekamu secības dziļumu, lai maksimāli palielinātu globālo jūras mikrobu kopienu pārklājumu okeāna baseinos, dziļajos slāņos un laika gaitā.Šajās datu kopās (1. papildu tabula un 1. attēls) ir ietverta metagenomika no paraugiem, kas savākti Taras okeānos (bagātināti ar vīrusiem, n = 190; bagātināti ar prokariotiem, n = 180) 12, 22 un BioGEOTRACES ekspedīcija (n = 480).Havaju okeāna laika sērija (HOT, n = 68), Bermudu un Atlantijas okeāna laika sērija (BATS, n = 62)21 un Malaspinas ekspedīcija (n = 58)23.Sekvences nolasījumi no visiem metagenomiskiem fragmentiem tika filtrēti pēc kvalitātes, izmantojot BBMap (v.38.71), no nolasīšanas noņemot sekvencēšanas adapterus, noņemot nolasījumus, kas kartēti ar kvalitātes kontroles sekvencēm (PhiX genomi), un izmantojot trimq=14, maq=20 atmet sliktu lasīšanas kvalitāti. maxns = 0 un minlength = 45. Turpmākās analīzes tika veiktas vai apvienotas ar QC nolasījumiem, ja norādīts (bbmerge.sh minoverlap = 16).QC rādījumi tika normalizēti (bbnorm.sh mērķis = 40, minddepth = 0) pirms izveides, izmantojot metaSPA (v.3.11.1 vai v.3.12, ja nepieciešams)53.Iegūtie sastatņu kontigi (turpmāk tekstā – sastatnes) beidzot tika filtrēti pēc garuma (≥1 kb).
1038 metagenomiski paraugi tika sadalīti grupās, un katrai paraugu grupai visu paraugu metagenomiskās kvalitātes kontroles nolasījumi tika saskaņoti ar katra parauga iekavām atsevišķi, kā rezultātā tika iegūts šāds pa pāriem iekavētu grupu nolasījumu skaits: Tara Marine Viruses – Enriched (190 × 190), Prokariotu bagātināti (180 × 180), BioGEOTRACES, HOT and BATS (610 × 610) un Malaspina (58 × 58).Kartēšana tika veikta, izmantojot Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, kas ļauj rādījumus saskaņot ar sekundārajām vietām (izmantojot karogu -a).Izlīdzinājumi tika filtrēti, lai tie būtu vismaz 45 bāzes gari, tiem būtu ≥97% identitāte un ≥80% nolasījumu diapazons.Iegūtie BAM faili tika apstrādāti, izmantojot MetaBAT2 (v.2.12.1)55 skriptu jgi_summarize_bam_contig_depths, lai nodrošinātu katras grupas iekšējo un starpizlases pārklājumu.Visbeidzot, iekavas tika grupētas, lai palielinātu jutību, atsevišķi palaižot MetaBAT2 visos paraugos ar –minContig 2000 un –maxEdges 500. Mēs izmantojam MetaBAT2, nevis ansambļa bokseri, jo neatkarīgos testos ir pierādīts, ka tas ir visefektīvākais viens bokseris.un 10 līdz 50 reizes ātrāk nekā citi parasti izmantotie bokseri57.Lai pārbaudītu pārpilnības korelāciju ietekmi, nejauši izvēlēts metagenomikas apakšparaugs (10 katrai no divām Tara Ocean datu kopām, 10 BioGEOTRACES, 5 katrai laika rindai un 5 Malaspina) papildus izmantoja tikai paraugus.Iekšējie paraugi tiek grupēti, lai iegūtu informāciju par pārklājumu.(Papildus informācija).
Turpmākajā analīzē tika iekļauti papildu (ārējie) genomi, proti, 830 manuāli atlasīti MAG no Tara Oceans26 datu kopas apakškopas, 5287 SAG no GORG20 datu kopas un dati no MAR datu bāzes (MarDB v. 4) no 1707 izolētiem REF un 682 SAG) 27. MarDB datu kopai genomi tiek atlasīti, pamatojoties uz pieejamajiem metadatiem, ja izlases veids atbilst šādai regulārajai izteiksmei: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] izolēts'.
Katra metagenomiskā konteinera un ārējo genomu kvalitāte tika novērtēta, izmantojot CheckM (v.1.0.13) un Anvi'o's Lineage Workflow (v.5.5.0)58,59.Ja CheckM vai Anvi'o ziņo par ≥50% pilnīgumu/pabeigtību un ≤10% piesārņojumu/redundanci, saglabājiet metagenomiskās šūnas un ārējos genomus vēlākai analīzei.Pēc tam šie rādītāji tika apvienoti vidējā pilnībā (mcpl) un vidējā piesārņojumā (mctn), lai klasificētu genoma kvalitāti saskaņā ar kopienas kritērijiem60 šādi: augsta kvalitāte: mcpl ≥ 90% un mctn ≤ 5%;laba kvalitāte: mcpl ≥ 70%, mctn ≤ 10%, vidēja kvalitāte: mcpl ≥ 50% un mctn ≤ 10%, godīga kvalitāte: mcpl ≤ 90% vai mctn ≥ 10%.Pēc tam filtrētie genomi tika korelēti ar kvalitātes rādītājiem (Q un Q') šādi: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (celmu mainīgums)/100 + 0,5 x log[N50].(īstenots dRep61).
Lai varētu veikt dažādu datu avotu un genomu tipu (MAG, SAG un REF) salīdzinošu analīzi, no 34 799 genomiem tika atceltas atsauces, pamatojoties uz genoma mēroga vidējo nukleotīdu identitāti (ANI), izmantojot dRep (v.2.5.4).Atkārtojas)61 ar 95% ANI sliekšņiem28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) un vienas kopijas marķiera gēniem, izmantojot SpecI63, nodrošinot genoma klasterizāciju sugu līmenī.Katrai dRep klasterim tika izvēlēts reprezentatīvs genoms atbilstoši iepriekš noteiktajam maksimālajam kvalitātes rādītājam (Q'), kas tika uzskatīts par sugas reprezentatīvu.
Lai novērtētu kartēšanas ātrumu, tika izmantots BWA (v.0.7.17-r1188, -a), lai kartētu visas 1038 metagenomisko nolasījumu kopas ar 34 799 genomiem, kas ietverti OMD.Kvalitātes kontrolēti nolasījumi tika kartēti viena gala režīmā, un iegūtie izlīdzinājumi tika filtrēti, lai saglabātu tikai līdzinājumus, kuru garums ir ≥45 bp.un identitāte ≥95%.Katra parauga displeja attiecība ir pēc filtrēšanas atlikušo rādījumu procentuālā daļa, kas dalīta ar kopējo kvalitātes kontroles rādījumu skaitu.Izmantojot to pašu pieeju, katrs no 1038 metagenomiem tika samazināts līdz 5 miljoniem ieliktņu (paplašināti dati, 1.c attēls) un saskaņots ar GORG SAG OMD un visās GEM16.No jūras ūdens atgūto MAG daudzumu GEM16 katalogā noteica, izmantojot metagenomisko avotu atslēgvārdu vaicājumus, atlasot jūras ūdens paraugus (piemēram, atšķirībā no jūras nogulumiem).Konkrētāk, mēs atlasām “ūdens” kā “ekosistēmas_kategorija”, “jūras” kā “ekosistēmas_veids” un filtrējam “biotopu” kā “okeāna dziļums”, “jūra”, “jūras okeāns”, “jūras pelaģiska”, “jūras ūdens”, “Okeāns”, “Jūras ūdens”, “Virszemes jūras ūdens”, “Virszemes jūras ūdens”.Tā rezultātā tika iegūti 5903 MAG (734 augstas kvalitātes), kas tika izplatīti 1823 OTU (skati šeit).
Prokariotu genomi tika taksonomiski anotēti, izmantojot GTDB-Tk (v.1.0.2)64 ar noklusējuma parametriem, kas orientēti uz GTDB r89 versiju 13. Anvi'o tika izmantots, lai identificētu eikariotu genomus, pamatojoties uz domēna prognozēšanu un atsaukšanu ≥50% un atlaišanu ≤ 10%.Sugas taksonomiskā anotācija ir definēta kā viens no tās reprezentatīvajiem genomiem.Izņemot eikariotus (148 MAG), katrs genoms vispirms tika funkcionāli anotēts, izmantojot prokka (v.1.14.5)65, nosaucot pilnīgus gēnus, definējot “arhejas” vai “baktēriju” parametrus pēc vajadzības, par ko ziņots arī par nesaistītiem gēniem. kodē gēnus.un CRISPR reģioni, starp citām genoma iezīmēm.Anotējiet paredzētos gēnus, identificējot universālos vienas kopijas marķiera gēnus (uscMG), izmantojot fetchMG (v.1.2)66, piešķiriet ortologu grupas un veiciet vaicājumu, izmantojot emapper (v.2.0.1)67, pamatojoties uz eggNOG (v.5.0)68.KEGG datu bāze (publicēta 2020. gada 10. februārī) 69. Pēdējais solis tika veikts, saskaņojot proteīnus ar KEGG datu bāzi, izmantojot DIAMOND (v.0.9.30)70 ar vaicājumu un tēmas pārklājumu ≥70%.Rezultāti tika tālāk filtrēti saskaņā ar NCBI Prokariotic Genome Annotation Pipeline71, pamatojoties uz bitu pārraides ātrumu ≥ 50% no maksimālā paredzamā bitu pārraides ātruma (pats saite).Gēnu sekvences tika izmantotas arī kā ievade, lai identificētu BGC genomā, izmantojot antiSMASH (v.5.1.0)72 ar noklusējuma parametriem un dažādiem klasteru sprādzieniem.Visi genomi un anotācijas ir apkopoti OMD kopā ar kontekstuālajiem metadatiem, kas pieejami tīmeklī (//microbiomics.io/ocean/).
Līdzīgi iepriekš aprakstītajām metodēm12,22 mēs izmantojām CD-HIT (v.4.8.1), lai sagrupētu >56,6 miljonus proteīnus kodējošo gēnu no baktēriju un arheālajiem genomiem no OMD 95% identitātē un īsākos gēnos (90% pārklājums)73 līdz. >17,7 miljoni gēnu kopu.Garākā secība tika izvēlēta kā reprezentatīvais gēns katram gēnu klasterim.Pēc tam 1038 metagenomi tika saskaņoti ar> 17, 7 miljoniem BWA (-a) klastera locekļu, un iegūtie BAM faili tika filtrēti, lai saglabātu tikai līdzinājumus ar ≥95% procentu identitāti un ≥45 bāzes izlīdzinājumiem.Garuma normalizētā gēnu pārpilnība tika aprēķināta, vispirms saskaitot ieliktņus no labākā unikālā līdzinājuma un pēc tam izplūduši kartētiem ieliktņiem pievienojot daļēju skaitu attiecīgajiem mērķa gēniem, kas ir proporcionāli to unikālo ieliktņu skaitam.
Genomi no paplašinātā OMD (ar papildu MAG no “Ca. Eudormicrobiaceae”, skatīt zemāk) tika pievienoti mOTUs74 metagenomiskās analīzes rīka datubāzei (v.2.5.1), lai izveidotu paplašinātu mOTU atsauces datu bāzi.No desmit uscMG izdzīvoja tikai seši vienas kopijas genomi (23 528 genomi).Datu bāzes paplašināšanas rezultātā sugu līmenī tika izveidoti 4494 papildu klasteri.1038 metagenomi tika analizēti, izmantojot noklusējuma mOTU parametrus (v.2).Kopumā mOTU profilā netika atklāti 989 genomi, kas atrodas 644 mOTU klasteros (95% REF, 5% SAG un 99, 9%, kas pieder MarDB).Tas atspoguļo dažādus papildu MarDB genomu jūras izolācijas avotus (lielākā daļa neatklāto genomu ir saistīti ar organismiem, kas izolēti no nogulumiem, jūras saimniekiem utt.).Lai šajā pētījumā turpinātu koncentrēties uz atklātā okeāna vidi, mēs tos izslēdzām no pakārtotās analīzes, ja vien tie netika atklāti vai iekļauti šajā pētījumā izveidotajā paplašinātajā mOTU datubāzē.
Visi BGC no MAG, SAG un REF OMD (skatīt iepriekš) tika apvienoti ar BGC, kas identificēti visās metagenomiskajās pamatnēs (antiSMASH v.5.0, noklusējuma parametri) un raksturoti, izmantojot BiG-SLICE (v.1.1) (PFAM domēns)75.Pamatojoties uz šīm pazīmēm, mēs aprēķinājām visus kosinusa attālumus starp BGC un grupējām tos (vidējās saites) GCF un GCC, izmantojot attāluma sliekšņus attiecīgi 0, 2 un 0, 8.Šie sliekšņi ir to sliekšņu adaptācija, kas iepriekš tika izmantoti, izmantojot Eiklīda attālumu75 kopā ar kosinusa attālumu, kas mazina dažas kļūdas sākotnējā BiG-SLICE klasterizācijas stratēģijā (papildu informācija).
Pēc tam BGC tika filtrēti, lai saglabātu tikai ≥5 kb, kas kodēti uz sastatnēm, lai samazinātu sadrumstalotības risku, kā aprakstīts iepriekš16, un izslēgtu MarDB REF un SAG, kas nav atrasti 1038 metagenomos (skatīt iepriekš).Tā rezultātā OMD genoms kodē kopumā 39 055 BGC, un papildu 14 106 tika identificēti metagenomiskos fragmentos (ti, nav apvienoti MAG).Šie “metagenomiskie” BGC tika izmantoti, lai novērtētu jūras mikrobiomu biosintēzes potenciāla daļu, kas nav iekļauta datu bāzē (papildu informācija).Katrs BGC tika funkcionāli raksturots atbilstoši paredzamajiem produktu veidiem, kas definēti ar anti-SMASH vai rupjākām produktu kategorijām, kas definētas BiG-SCAPE76.Lai novērstu paraugu ņemšanas novirzes kvantitatīvajā noteikšanā (GCC/GCF taksonomiskais un funkcionālais sastāvs, GCF un GCC attālums līdz atsauces datu bāzēm un GCF metagenomisks pārpilnība), katrai sugai saglabājot tikai garāko BGC uz GCF, 39 055 BGC tika vēl vairāk noņemti, kopā veidojot 17 689 BGC.
GCC un GCF novitāte tika novērtēta, pamatojoties uz attālumu starp aprēķināto datu bāzi (RefSeq datu bāze BiG-FAM)29 un eksperimentāli pārbaudīto (MIBIG 2.0)30 BGC.Katram no 17 689 reprezentatīvajiem BGC mēs izvēlējāmies mazāko kosinusa attālumu līdz attiecīgajai datubāzei.Šie minimālie attālumi pēc tam tiek aprēķināti vidēji (vidēji) atbilstoši GCF vai GCC.GCF tiek uzskatīts par jaunu, ja attālums līdz datu bāzei ir lielāks par 0,2, kas atbilst ideālam attālumam starp (vidējo) GCF un atsauci.GCC mēs izvēlamies 0,4, kas ir divreiz lielāks par GCF noteikto slieksni, lai bloķētu ilgtermiņa attiecības ar saitēm.
BGC metagenomiskā pārpilnība tika novērtēta kā tā biosintētisko gēnu vidējā pārpilnība (ko noteica anti-SMASH), kas pieejama no gēnu līmeņa profiliem.Pēc tam katra GCF vai GCC metagenomiskā pārpilnība tika aprēķināta kā reprezentatīvo BGC summa (no 17 689).Šīs pārpilnības kartes pēc tam tika normalizētas attiecībā uz šūnu sastāvu, izmantojot katra parauga mOTU skaitu, kas arī atspoguļoja sekvencēšanas centienus (paplašināti dati, 1. d attēls).GCF vai GCC izplatība tika aprēķināta kā to paraugu procentuālā daļa, kuru pārpilnība > 0.
Eiklīda attālums starp paraugiem tika aprēķināts no normalizētā GCF profila.Šie attālumi tika samazināti, izmantojot UMAP77, un iegūtie ieguljumi tika izmantoti neuzraudzītai uz blīvumu balstītai klasterizācijai, izmantojot HDBSCAN78.Optimālais minimālais punktu skaits klasterim (un līdz ar to arī klasteru skaits), ko izmanto HDBSCAN, tiek noteikts, maksimāli palielinot klastera dalības kumulatīvo varbūtību.Identificēto klasteru (un nejauši līdzsvarotu šo klasteru apakšizlasi, lai ņemtu vērā novirzes permutācijas daudzfaktoru dispersijas analīzē (PERMANOVA)) tika pārbaudīta nozīmība pret nesamazinātiem Eiklīda attālumiem, izmantojot PERMANOVA.Paraugu vidējais genoma lielums tika aprēķināts, pamatojoties uz mOTU relatīvo pārpilnību un genomu locekļu aplēsto genoma lielumu.Jo īpaši katra mOTU vidējais genoma lielums tika novērtēts kā tā dalībnieku genoma lieluma vidējais lielums, kas koriģēts pēc pilnīguma (pēc filtrēšanas) (piemēram, 75% pilnīga genoma, kura garums ir 3 Mb, pielāgotais izmērs ir 4 Mb).vidējiem genomiem ar integritāti ≥70%.Pēc tam katra parauga vidējais genoma lielums tika aprēķināts kā mOTU genoma izmēru summa, kas svērta pēc relatīvā daudzuma.
Filtrēts genoma kodētu BGC komplekts OMD ir parādīts baktēriju un arheālos GTDB kokos (≥5 kb ietvaros, izņemot REF un SAG MarDB, kas nav atrasti 1038 metagenomos, skatīt iepriekš) un to prognozētajās produktu kategorijās, pamatojoties uz filoģenētisko. genoma stāvoklis (skatīt iepriekš).Vispirms mēs samazinājām datus pa sugām, kā reprezentatīvu izmantojot genomu ar visvairāk BGC šajā sugā.Vizualizācijai pārstāvji tika tālāk sadalīti koku grupās, un atkal katrai šūnu kladei kā pārstāvis tika izvēlēts genoms, kurā bija vislielākais BGC skaits.Ar BGC bagātinātās sugas (vismaz viens genoms ar > 15 BGC) tika tālāk analizētas, aprēķinot Šenonas daudzveidības indeksu produktu veidiem, kas kodēti šajos BGC.Ja visi paredzamie produktu veidi ir vienādi, ķīmiskie hibrīdi un citi sarežģīti BGC (kā paredz anti-SMAH) tiek uzskatīti par piederīgiem vienam produkta veidam neatkarīgi no to secības klasterī (piemēram, proteīna-bakteriocīna un bakteriocīna-proteoproteīna saplūšana ķermenis).hibrīds).
Atlikusī DNS (aptuveni 6 ng) no Malaspina parauga MP1648, kas atbilst bioloģiskajam paraugam SAMN05421555 un ir saskaņota ar Illumina SRR3962772 metagenomisko nolasīšanas komplektu īsai lasīšanai, apstrādāta saskaņā ar PacBio sekvencēšanas protokolu ar īpaši zemu ievadi, lai izmantotu Pacbelllification komplektu Pacbelllification gDNA. komplekts (100-980-000) un SMRTbell Express 2.0 veidņu sagatavošanas komplekts (100-938-900).Īsumā, atlikušā DNS tika sagriezta, salabota un attīrīta (ProNex lodītes), izmantojot Covaris (g-TUBE, 52104).Pēc tam attīrītā DNS tiek pakļauta bibliotēkas sagatavošanai, amplifikācijai, attīrīšanai (ProNex lodītes) un izmēra izvēlei (> 6 kb, Blue Pippin) pirms pēdējās attīrīšanas posma (ProNex lodītes) un sekvencēšanas Sequel II platformā.
Pirmo divu rekonstrukcija apm.Attiecībā uz MAG Eremiobacterota mēs identificējām sešus papildu ANI> 99% (tie ir iekļauti 3. attēlā), kas sākotnēji tika filtrēti, pamatojoties uz piesārņojuma rādītājiem (vēlāk identificēti kā gēnu dublēšanās, skatīt zemāk).Mēs atradām arī paplāti ar uzrakstu “Ca”.Eremiobacterota” no dažādiem pētījumiem23 un izmantoja tos kopā ar astoņiem MAG no mūsu pētījuma kā atsauci metagenomiskiem nolasījumiem no 633 eikariotu bagātinātiem (>0,8 µm) paraugiem, izmantojot BWA (v.0.7.17) Ref -r1188, – karodziņu), lai samazinātu paraugus. kartēšana (5 miljoni nolasījumu).Pamatojoties uz bagātināšanai specifiskām kartēm (filtrētas pēc 95% izlīdzināšanas identitātes un 80% nolasīšanas pārklājuma), montāžai tika atlasīti 10 metagenomi (paredzamais pārklājums ≥5×) un papildu 49 metagenomi (paredzamais pārklājums ≥1×) satura korelācijai.Izmantojot tos pašus parametrus, kas norādīti iepriekš, šie paraugi tika apvienoti un tika pievienoti 10 papildu Ca.MAG Eremiobacterota ir atjaunota.Šie 16 MAG (neskaitot divus, kas jau ir datu bāzē) kopējo genomu skaitu paplašinātajā OMD palielina līdz 34 815.MAG tiek piešķirtas taksonomiskās pakāpes, pamatojoties uz to genoma līdzību un pozīciju GTDB.18 MAG tika dereplicēti, izmantojot dRep, 5 sugās (intraspecifisks ANI > 99%) un 3 ģints (intrageneric ANI 85% līdz 94%) vienā ģimenē79.Sugu pārstāvji tika manuāli atlasīti, pamatojoties uz integritāti, piesārņojumu un N50.Ieteicamā nomenklatūra ir sniegta papildinformācijā.
Novērtējiet Ca integritāti un piesārņojumu.MAG Eremiobacterota, mēs novērtējām uscMG klātbūtni, kā arī cilts un domēna specifiskās vienas kopijas marķieru gēnu komplektus, ko izmantoja CheckM un Anvi'o.2 dublikātu no 40 uscMG identificēšana tika apstiprināta ar filoģenētisko rekonstrukciju (skatīt zemāk), lai izslēgtu iespējamo piesārņojumu (tas atbilst 5%, pamatojoties uz šiem 40 marķieru gēniem).Papildu pētījums par pieciem reprezentatīviem MAG 'Ca.Zemais piesārņotāju līmenis šajos rekonstruētajos genomos tika apstiprināts Eremiobacterota sugām, izmantojot interaktīvo Anvi'o saskarni, kuras pamatā ir pārpilnības un secību sastāva korelācijas (papildu informācija)59.
Filogenomiskajai analīzei mēs izvēlējāmies piecus reprezentatīvus MAG “Ca”.Eudormicrobiaceae”, visas sugas “Ca.Eremiobacterota un citu dzimtas locekļu (tostarp UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria un Planctomycetota) genoms ir pieejams no GTDB (r89)13.Visi šie genomi tika anotēti, kā aprakstīts iepriekš viena eksemplāra marķiera gēna ekstrakcijai un BGC anotācijai.GTDB genomi tika saglabāti saskaņā ar iepriekšminētajiem integritātes un piesārņojuma kritērijiem.Filoģenētiskā analīze tika veikta, izmantojot Anvi'o Phylogenetics59 darbplūsmu.Koks tika izveidots, izmantojot IQTREE (v.2.0.3) (noklusējuma opcijas un -bb 1000)80 uz 39 tandēmu ribosomu proteīnu izlīdzināšanas, ko identificēja Anvi'o (MUSCLE, v.3.8.1551)81.Viņa pozīcijas tika samazinātas.lai aptvertu vismaz 50% no genoma82, un Planctomycecota tika izmantota kā ārējā grupa, pamatojoties uz GTDB koka topoloģiju.Viens koks no 40 uscMG tika uzbūvēts, izmantojot tos pašus rīkus un parametrus.
Mēs izmantojām Traitar (v.1.1.2) ar noklusējuma parametriem (fenotips, no nukleotīdiem)83, lai prognozētu parastās mikrobu pazīmes.Mēs izpētījām iespējamo plēsīgo dzīvesveidu, pamatojoties uz iepriekš izstrādātu plēsonīgo indeksu84, kas ir atkarīgs no proteīnu kodējošā gēna satura genomā.Konkrēti, mēs izmantojam DIAMOND, lai salīdzinātu proteīnus genomā ar OrthoMCL datu bāzi (v.4)85, izmantojot opcijas – sensitīvāks –id 25 –query-cover 70 –subject-cover 70 –top 20 UN saskaitītu gēnus, kas atbilst marķieru gēni plēsējiem un neplēsējiem.Indekss ir starpība starp plēsonīgo un neplēsīgo atzīmju skaitu.Kā papildu kontroli mēs analizējām arī “Ca” genomu.Entotheonella TSY118 faktors ir balstīts uz tā saistību ar Ca.Eudoremicrobium (liels genoma izmērs un biosintētiskais potenciāls).Pēc tam mēs pārbaudījām iespējamās saiknes starp plēsēju un neplēsēju marķieru gēniem un Ca biosintētisko potenciālu.Eudormicrobiaceae” un konstatēja, ka ne vairāk kā viens gēns (no jebkura veida marķiergēna, ti, plēsoņa/neplēsoņa gēna) pārklājas ar BGC, kas liecina, ka BGC nesajauc plēsonīgos signālus.Papildu kodēto replikonu genoma anotācija tika veikta, izmantojot TXSSCAN (v.1.0.2), lai īpaši pārbaudītu sekrēcijas sistēmu, pili un flagella86.
Pieci reprezentatīvi Ca tika kartēti, kartējot 623 metatranskriptus no Taras okeāna prokariotu un eikariotu bagātināšanas frakcijām22, 40, 87 (izmantojot BWA, v.0.7.17-r1188, -a karogu).Eudormicrobiaceae genoms.BAM faili tika apstrādāti ar FeatureCounts (v.2.0.1)88 pēc 80% lasīšanas pārklājuma un 95% identitātes filtrēšanas (ar opcijām featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ). ieliktņu skaits vienā gēnā.Ģenerētās kartes tika normalizētas attiecībā uz gēnu garumu un marķiera gēnu pārpilnību mOTU (normalizēts vidējais ievietošanas skaits gēniem ar ievietošanas skaitu >0) un logaritmiski pārveidotas līdz 22,74, lai iegūtu katra gēna līmeņa relatīvo ekspresiju uz vienu šūnu, kas arī izskaidro mainīgums no parauga uz paraugu sekvencēšanas laikā.Šādas attiecības ļauj veikt salīdzinošu analīzi, mazinot sastāva problēmas, izmantojot relatīvās pārpilnības datus.Turpmākai analīzei tika ņemti vērā tikai paraugi ar> 5 no 10 mOTU marķieru gēniem, lai varētu noteikt pietiekami lielu genoma daļu.
Normalizētais transkripta profils 'Ca.E. taraoceanii tika pakļauts dimensiju samazināšanai, izmantojot UMAP, un iegūtais attēlojums tika izmantots neuzraudzītai klasterēšanai, izmantojot HDBSCAN (skatīt iepriekš), lai noteiktu ekspresijas statusu.PERMANOVA pārbauda atšķirību nozīmīgumu starp identificētajiem klasteriem sākotnējā (nav samazinātā) attāluma telpā.Šo apstākļu diferenciālā ekspresija tika pārbaudīta visā genomā (skatīt iepriekš), un tika identificēts 201 KEGG ceļš 6 funkcionālajās grupās, proti: BGC, sekrēcijas sistēma un flagellārie gēni no TXSSCAN, degradācijas enzīmi (proteāze un peptidāzes) un plēsīgie un ne- plēsonīgie gēni.plēsīgo indeksu marķieri.Katram paraugam mēs aprēķinājām vidējo normalizēto izteiksmi katrai klasei (ņemiet vērā, ka pati BGC ekspresija tiek aprēķināta kā biosintētisko gēnu vidējā ekspresija šim BGC) un pārbaudīta, vai tā ir nozīmīga dažādos stāvokļos (Kruskal-Wallis tests, kas pielāgots FDR).
Sintētiskie gēni tika iegādāti no GenScript, un PCR primeri tika iegādāti no Microsynth.DNS amplifikācijai tika izmantota Phusion polimerāze no Thermo Fisher Scientific.DNS attīrīšanai tika izmantotas NucleoSpin plazmīdas, NucleoSpin gels un Macherey-Nagel PCR attīrīšanas komplekts.Restrikcijas enzīmi un T4 DNS ligāze tika iegādāti no New England Biolabs.Ķimikālijas, kas nav izopropil-β-d-1-tiogalaktopiranozīds (IPTG) (Biosynth) un 1,4-ditiotreitols (DTT, AppliChem), tika iegādātas no Sigma-Aldrich un izmantotas bez turpmākas attīrīšanas.Antibiotikas hloramfenikols (Cm), spektinomicīna dihidrohlorīds (Sm), ampicilīns (Amp), gentamicīns (Gt) un karbenicilīns (Cbn) tika iegādātas no AppliChem.Bacto Tryptone un Bacto Yeast Extract barotnes komponenti tika iegādāti no BD Biosciences.Tripsīns sekvencēšanai tika iegādāts no Promega.
Gēnu sekvences tika iegūtas no anti-SMASH prognozētā BGC 75.1.E. malaspinii (papildu informācija).
Gēni embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) un embAM (ieskaitot starpgēnu reģionus) tika konstruēti un optimizēti kā ekspresijai E 5 ar sintētisku5 un sekvencēti (kopā pRRUC)5. kad.EmA gēns tika subklonēts pACYCDuet-1 (CmR) un pCDFDuet-1 (SmR) pirmajā daudzkārtējā klonēšanas vietā (MCS1) ar BamHI un HindIII šķelšanās vietām.EmM un embMopt gēni (optimizēti ar kodoniem) tika subklonēti MCS1 pCDFDuet-1(SmR) ar BamHI un HindIII un ievietoti pCDFDuet-1(SmR) un pRSFDuet-1(KanR) (MCS2) otrajā daudzkārtējā klonēšanas vietā ar NdeI/ChoI.EmAM kasete tika subklonēta pCDFDuet1 (SmR) ar BamHI un HindIII šķelšanās vietām.Orf3/embI gēns (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) tika konstruēts ar pārklāšanās paplašinājuma PCR, izmantojot primerus EmbI_OE_F_NdeI un EmbI_OE_R_XhoI, sagremots ar NdeI/XhoI-D, izmantojot restrikcijas pCSM1 (pats-Xho1-D). fermenti (papildu tabula).6).Restrikcijas enzīmu gremošana un ligēšana tika veikta saskaņā ar ražotāja protokolu (New England Biolabs).

 


Izsūtīšanas laiks: 14.03.2023