Evolusjon AV RISC-relaterte SIDEN medlemmer

AGO protein familien spiller en sentral rolle I RISC-mediert genregulering. AGOs involverer hovedsakelig fire karakteristiske domener: En N-terminal, PAZ( som er ansvarlig for liten RNA-binding), Mid og En C-terminal PIWI (som gir katalytiske aktiviteter) domene (Supplerende Figs S1 Og S2) 18,19. En rekke ikke-kodende Rna er deres substrater, inkludert mirna, sirna og Piwi-interagerende rna (pirna)20. Små Rna guide AGOs til sine spesifikke mål gjennom sekvens komplementaritet, som vanligvis fører til silencing av målet for det meste av post-transkripsjonell hemming eller mRNA degradering.AGO2 OG dets homologer har blitt identifisert I Chordata, Arthropoda, Nematoda Og Platyhelminthes, og et fylogenetisk tre Av AGOs ble konstruert (Fig. 1a Og Utfyllende Fig. S3). I HENHOLD til DERES RNA-bindende egenskaper eller funksjoner ble Disse Agoene delt inn i tre klasser: (I) multifunksjonelle Agoer; (II) siRNA-assosiert Agoer; OG (III) piRNA-assosiert Agoer. Klasse I agos inneholder akkordat AGO1-4, hvor alle menneskelige AGOs forbinder med både siRNAs og miRNAs. Som vist I Fig. 1a, akkordat AGO1 – 4 inneholder TO underklasser: AGO2 OG AGO1/3 / 4. BARE AGO2 protein fungerer som en endonuklease, spalte mRNA innenfor regioner som basepar med perfekt komplementære siRNAs eller miRNAs. AGO1/3/4 er slicing-inkompetente AGOs21, 22 og fjerne passasjer tråder via bypass mekanisme. Klasse II agos binder seg spesielt til siRNAs, som inneholder Arthropoda (Drosophila AGO2) OG Nematoda AGOs (TAG-76 / ERGO1 / WAGO1 / YQ53 / NRDE3). AGOs I Arthropoda og Nematoda har evolusjonære kompleksiteter sammenlignet med den monofyletiske gruppen av pattedyragos(Fig. 1a Og Utfyllende Fig. S3). Drosophila AGO2, som en del AV RISC-komplekset, er nødvendig for avvikling av siRNA duplex og påfølgende montering av siRNA I RISC i Drosophila-embryoer. Drosophila AGO2 delte et nært evolusjonært forhold til plante / Chordata AGOs (Supplerende Fig. S3). AGO1 er dispensable for effektiv RNAi I Drosophila embryos23, men det er unreviewed I UniProt og unannotated I Fig. 1A. fylogenetisk treet Og Pfam / SMART-baserte domene strukturer viser AT TAG-76 (Caenorhabditis elegans, C. elegans) har beskjedne likheter med pattedyr AGOs (Supplerende Fig. S2). Dessverre er dens biologiske funksjon fortsatt uklar, men andre nematodaproteiner deltar i rnai-banen. ERGO-1 fungerer SOM EN AGO og fungerer i den endogene rnai pathway24. WAGO1 er en ormspesifikk AGO og stilner visse gener, transposoner, pseudogener og kryptiske loci25. Ukarakterisert YQ53 med paz og PIWI domener vist I Supplerende Fig. S2 har en mulig funksjon av endogen Og eksogen RNAi18. ET annet NUKLEÆRT AGO-protein, NRDE3, binder seg til sirna og er nødvendig for kjernefysisk RNAi, og transporterer dermed bestemte klasser av små regulatoriske Rna til forskjellige cellulære rom for å regulere genekspressjon26. Klasse III AGOs består av akkordat PIWIL1-4, Arthropoda AGO3/AUB / PIWI / SIWI og Platyhelminthes PIWIL / PIWI1 / PIWI2. PIWIL1-4, medlemmene AV PIWI-familien, binder seg til pirna og uttrykkes utelukkende i kimlinjeceller, men andre Agoer uttrykkes allestedsnærværende i de fleste vev27. I Tillegg Supplerende Fig. S3 viser at Andre Arthropoda AGO2-relaterte proteiner er nær subclade av akkordat PIWIL1-4, og de er regissert av piRNAs å spalte transposon transkripsjoner og instruere Piwi å undertrykke transposon transkripsjon for å beskytte germline genomet I Drosophila ovarian bakterie celler. Medlemmene AV PIWI-proteinfamilien (PIWIL, PIWI1 OG PIWI2) har også blitt identifisert I Platyhelminthes(Dugesia japonica og Schmidtea mediterranea). De har domener som ligner på dyr AGOs og kan være nødvendig for stamcellefunksjon og piRNA biogenese (Supplerende Fiken S2 Og S3)28,29.

Tidligere studier har bestemt tre clades Av AGOs i planter30. For Eksempel viser Arabidopsis thaliana (A. thaliana) en lik fordeling av sine ti medlemmer innen tre klader: (I) AGO1, AGO5, AGO10; (II) AGO2, AGO3, AGO7; OG (III) AGO4, AGO6, AGO8, AGO9. I samsvar med disse resultatene viste våre analyser tre store klader, og disse planteagoene ble kunstig gruppert i tre klasser basert på deres funksjoner: (I) multifunksjonelle Agoer; (II) siRNA-assosierte Agoer; OG (III) komplementære fungerende Agoer. Protein sekvens identitetsbaserte BLAST score gir imidlertid ikke de mer presise klassifikasjoner (Fig. 1a Og Utfyllende Fig. S3). Klasse I Er AGO1/AGO5/AGO10 (a. thaliana) OG AGO1A/AGO1B/AGO1C/AGO1D/AGO11/AGO12/AGO13 / AGO14/AGO17/AGO18/PNH1 / MEL1 (Oryza sativa, O. sativa). AGO1 virker i miRNA-og siRNA-banene, OG AGO10 deltar muligens i disse banene, i det minste i noen vev; AGO5, lokalisert i både kjernen og cytoplasma, binder seg til små Rna-Er og regulerer rna-mediert post-transkripsjonell gent-lyddemping31. PNH1 (O. sativa) sannsynligvis påvirker dannelsen av shoot apical meristem og blad adaksial celle spesifikasjon OG RNA slå pathway32, 33. MEL1 medierer sannsynligvis liten RNA-relatert gendeaktivering og dens funksjon kan utføres av en ANNEN AGO I Arabidopsis33. Klasse II AGOs inneholder AGO2/AGO3/AGO7 (a. thaliana) OG AGO2 / AGO3 / AGO7 (O. sativa). AGO7 fungerer I RDR6 / SGS3 / DCL4 / AGO7 trans-fungerende siRNA pathway involvert i blad utviklings timing. AGO2 / 3 mangler DDH-motivet I PIWI-domenet og har muligens lignende aktiviteter; OG AGO2 / AGO3 mutanter viser ingen utviklingsfeil. Klasse III AGOs inneholder AGO4/AGO6/AGO8/AGO9 (a. thaliana) OG AGO4A / AGO4B / AGO15 / AGO16 (O. sativa). Disse AGOs har komplementære biologiske funksjoner. AGO4 er muligens delt i forskjellige atomkomplekser og i en distinkt bane34. AGO6 er nødvendig for heterochromatin siRNA og transkripsjonelle gendeaktiveringsveier, OG AGO6-aktivitet er delvis overflødig med AKTIVITETEN TIL AGO4. AGO8 / 9 (a. thaliana) mrna har en annen vevsfordeling, og deres mutanter har ingen effekt på plantefenotyper. Basert på sekvensidentiteter er Det en klar gruppe Klasse i-medlemmer (oransje), men det er en overlappende region Mellom Klasse II (grønn) og KLASSE III-medlemmer (mørkegrønn) (Fig. 1A). AtAGOs har blitt studert i flere tiår, men mange spørsmål forblir fortsatt. OsAGOs synes å ha høyere forskjeller og gen duplikasjoner fordi mange isoformer ble identifisert som vist I Fig. 1a Og Utfyllende Fig. S3.

en ENKELT AGO som inneholder PIWI domener er identifisert I Protista Giardia intestinalis (Giardia lamblia) genom og regulerer variant-spesifikk overflate protein (VSP) uttrykk på overflaten av hver parasitt via En rnai bane (Supplerende Fiken S2 Og S3)35. Overraskende, en enkelt AGO1 med PAZ og Piwi domener fra gjær ble funnet i sopp og tett plassert på den tredje klade av planter (Supplerende Fiken S2 Og S3). Det kan ha sekvensspesifikk DNA-bindingsaktivitet, og dens detaljerte rolle I RISC kan utforskes i dybden.

Evolusjon AV RISC-relaterte Dicer-medlemmer

RNAi-prosessen oppstår fra en interaksjon MELLOM RNA-molekyler og RISC. Dicer forankrer et dsrna-molekyl og kutter det for å produsere korte dsrna som et primært rna-gjenkjennings-og prosesseringsenzym i RNAi-prosessen. Dicer er medlem Av RNase III familien og svært bevart i utviklingen. Sekvensanalyser viser at Dicer av hver art har lignende domener. I de fleste arter er N-terminus Av Dicer et rna helicase-domene etterfulgt av ET paz-domene (Supplerende Fig. S1). C-terminus Av Dicer har to rnase III domener og en dsrna bindende domain36.

Dicers finnes mye i eukaryoter. Det nåværende fylogenetiske treet TIL DICER-familien viser sin uavhengige diversifisering hos dyr, planter og sopp (Fig. 1b Og Utfyllende Fig. S4). Distinkt med fylogenetisk tre av dyr AGOs, en monofyletisk gruppe av dyr DICER ble funnet å inkludere Chordata, Arthropoda Og Nematoda og en klasse ble funksjonelt generert: multifunksjonelle DICERs. Disse DICERs har den doble funksjonen til å gjenkjenne en hårnål eller dsRNA og behandle dem i modne miRNA-miRNA * / siRNA duplekser. Det er bemerkelsesverdig At Arthropoda DICER (Drosophila DCR1) er nødvendig for miRNA biogenesis, og den ureviderte Drosophila DICER paralogue DCR2 I UniProt kan være for å generere siRNAs. Helikasemotivene Til Nematoda DICER (c. elegans dcr1) kreves for siRNA, men ikke miRNA, prosessering37, 38, 39, 40. Dicer som kreves for piRNA-behandling forblir uidentifisert. Den ekstra konstruerte akkordatunderklassen inkluderer DDX58, DHX58, IFIH1, FANCM og RNC (Fig. 1b Og Utfyllende Fig. S4). DE har alle helikaseaktiviteter, MEN DDX58 og DHX58 binder SEG TIL DNA, OG IFIH1 og FANCM har rna-bindingsaffiniteter. Funksjonelt kunne de delta I RISC-lignende komplekser og reagere på eksogent stress. RNC koder dsRNA-spesifikk RNASE III.

det er fire DICERs (DCL1-4) i plants38. Supplerende Fig. S4 viser en monofyletisk gruppe Av Plante DICERs som inneholder fire subclades: DCL1, DCL2, DCL3 OG DCL4. Basert på modningstyper av plante små Rna, ble Disse DICERs gruppert i to klasser: (I) multifunksjonelle DICERs (DCL1); og (II) siRNA-tilknyttede DICERs (DCL2-4). DCL1 deltar I RISC-formasjonen for å behandle miRNA / siRNA forløpere. AtDCL2-4 generere siRNAs og er innblandet i virus forsvar og produksjon av siRNAs fra naturlige cis-virkende antisense transkripsjoner, kromatin modifikasjon veiledning eller vegetative faseendring regulation39,40,41. RTL3 (O. sativa) tilhører DCL1-underklassen og rnase III-familien, noe som tyder på at det muligens involverer miRNA/siRNA-banen. Videre ble flere DICER-isoformer funnet I O. sativa, som indikerer at en gen duplisering hendelse kan ha oppstått under rice DICER evolusjon. En plante klade lokaliserer på outgroup, inkludert RTL3 (a. thaliana) OG RTL2 (A. thaliana Og O. sativa), som er ribonukleaser spalte dsRNA og produsere små Rna.

Sopp (Ascomycota) Dicers viser to undergrupper støttet av en bootstrap verdi på 64: (I) DCL1, DCR1(Schizosaccharomyces pombe, S. pombe); OG (II) DCL2 (Fig. 1b Og Utfyllende Fig. S4). I vegetative celler ER DCL2 et viktig Dicer-enzym i prosessen med siRNA biogenese, MEN DCL1 har en overflødig rolle42. IMIDLERTID er BARE DCL1 spesifikt uttrykt og nødvendig for meiotisk silencing under meiosis43. I siRNA-modningsprosessen behandles dsrna-forløpere AV DCR1 med lignende domener av kanonisk DICER hos dyr. DCR1 (S. pombe) er En Dicer homolog i fisjon gjær. MPH1 er EN ATP-avhengig DNA-helikase assosiert MED DNA-skaderespons for å opprettholde genomintegritet44. Gjær MFH2 har DNA binding OG DNA helicase aktiviteter. Andre klader er hovedsakelig fra bakterielle Rncer (Actinobacteria, Aquificae, Firmicutes, Proteobacteria, Tenericutes og Thermotogae) som koder For RNase og cleave RNAs (Fig. 1b Og Utfyllende Fig. S4).

Utvikling AV RISC-relaterte trbp og PACT medlemmer

TRBP er involvert I HIV-1 gen ekspresjon45, muligens knytte miRNAs OG RESPONSEN AV IFN-PKR vei TIL HIV-1 infeksjon46. Hos vertebrater ER TRBP en paralog til proteinkinasen R (PKR) – aktiverende protein ELLER PACT46,47. De regulerer PKR som en inhibitor (TRBP) eller aktivator (PACT). RISC-relaterte biologiske funksjoner AV TRBP og / eller PACT med tre DRSM-domener (som binder seg til dsrna og medierer protein-proteininteraksjon), vist I Supplerende Fig. S2, er følgende: rekruttere substrater Til Dicer, tilrettelegge Dicer-mediert behandling av umodne miRNAs, fjerne Dicer produktet og kontrollere hvilken type dsRNA er lastet På AGOs12,13.

I våre fylogenetiske trær vises TRBPs/Pakter bare I Chordata(Fig. 1c, D Og Supplerende Fiken S5 Og S6). Ellers Drosophila R2D2 Og C. elegans RDE-4, begge kjente deltakere I rnai-prosessering, er fjernt relatert TIL TRBP / PACT OG oppstår ikke i akkordatklader AV TRBP / PACT. Loquacious har blitt identifisert i insekter, men de vurderes ikke på grunn av lav sekvensidentitet og urevidert oppføring I UniProt(Fig . 1C, D). Andre evolusjonært relaterte rna / DNA-bindende gener er DSRAD (Chordata), STAU1 / 2 / STAUH (Chordata, Mollusca og Arthropoda), ILF3 (Chordata), STRBP (Chordata), RED1/2 (Chordata) og RNC (Chloroflexi og Proteobacteria). DSRADs er involvert I rna redigering og lette lasting av miRNA PÅ RISC48. Akkordat STAU1 / 2 / STAUH ser ut til å fungere i mRNA-transport eller distribusjon49,50, og ligner miRNA-forløpere, Transporterer Exportin-5 Staufen-dsRNA-komplekser ut av nukleus51. Akkordat ILF3 binder SEG TIL RNA og fungerer i biogenesen av sirkulære rna (circrna). Chordate STRBP regulerer spermatogenese og sperm funksjon gjennom binding dsDNA / RNA. Chordate RED1 katalyserer a-til-I rna-redigering for å påvirke genuttrykk og funksjon. Akkordat RED2 med adenosindeaminaseaktivitet og dsRNA/ssRNA-bindingsaffinitet forhindrer binding av ANDRE adar-enzymer til mål og reduserer effektiviteten av disse enzymene. Rncer I Klorflexi og Proteobakterier tilhører rnase III-familien. Uventet, DRB2 (O. sativa) og IIV6-340r (Virvelløse iriserende virus 6) ble plassert på klader av akkordat DSRAD og bakterielle RNCs i vår fylogenetisk TRE AV PACT, henholdsvis (Fig. 1d Og Utfyllende Fig. S6). De binder seg muligens til Og klipper Rna i planter eller deres vert, men DERES RISC-relaterte funksjoner er fortsatt ukjente.

Utvikling AV RISC-relaterte GW182 medlemmer

GW182 identifisert hos dyr er en nøkkelkomponent I RISC, interagerer PIWI-domenet TIL AGO1 via Sin N-terminale region for miRNA-mediert genregulering (Supplerende Fig. S1) og viser høye forskjeller i sekvenslengde, bevaring og sammensetning. I denne studien, full-lengde sekvenser AV GW182 og dens orthologues ble brukt for en pålitelig fylogenetisk rekonstruksjon, som var i samsvar med tidligere resultater (Supplerende Fig. S7) 17. Resultatene indikerer at pattedyr TNRC6C er grunnleggeren av akkordatgenfamilien som representerer og divergerer fra orthologen av nonchordate GW182-gener.

i vår studie ble et begrenset antall GW182 identifisert og karakterisert, inkludert menneske, mus og fly (Fig. 1e Og Utfyllende Fig. S7). En ytterligere database BLAST søk analyse AV GW182 mRNA / protein viste ingen flere homologer med svært overbevist sekvens likheter og biologiske funksjoner, selv i Nematoda. I stedet er to funksjonelle analoger, AIN-1 og AIN-2, kodet I genomet Av c. elegans. Observasjonen er ikke overraskende fordi mer enn halvparten av genene kodet i Nematoda er unike52.

gen duplisering analyse av DE store RISC medlemmer

Gen duplisering er en avgjørende drivkraft for fenotype mangfold, årsaken til menneskelige sykdommer, og evolusjon. I vår studie kvantifiserte vi gen duplisering hendelser av DE store RISC medlemmer. Det var 51 gen duplikasjoner identifisert i treet Av AGOs(Supplerende Fig. S8). Klasse I, II og III av dyr AGOs inneholdt henholdsvis 6, 4 og 14 gen duplikasjoner. Klasse i, II og III av plante AGOs inkludert 13, 3 og 5 gen duplikasjoner, henholdsvis. I DICERs tre ble 61 genduplikasjoner bestemt (Supplerende Fig. S9). Av denne klassen av Dyr DICERs oppsto 4 gen duplikasjoner fra Chordata. I de to klassene av plantedicere hadde bare klasse II 6 genduplikasjoner. FOR TRBP / PACT / GW182 var det 68/27/10 genduplikasjoner, hvor tallene for deres nært tilknyttede genduplikasjoner var henholdsvis 1, 3 og 2 (Supplerende Fiken 10-12). Disse resultatene tyder på at mange genduplikasjoner i AGOs og DICERs kan være den viktigste bidragsyteren til evolusjonært mangfold.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.