resultater

Uorf-prævalens inden for Pattedyrstranskripter.

vi definerer en uORF som dannet af et startkodon inden for en 5′ UTR, et in-frame stopkodon forud for slutningen af hovedkodningssekvensen (CDS) og længde mindst 9 nt inklusive stopkodonet. Som vist i Fig. 1A, denne definition omfatter uORFs både fuldt opstrøms og overlappende CD ‘ erne, fordi begge typer forventes at være funktionelle (20). Vi søgte efter uORFs inden for alle humane og mus Refseks udskrifter med annoterede 5’ UTR ‘ er >10 nt. I overensstemmelse med tidligere estimater (9, 10) finder vi, at 49% af humane og 44% af museafskrifter indeholder mindst 1 uORF (Fig. 1B). Interessant nok er mennesker og mus uorf startkodoner (uauger) det mest konserverede 5’ UTR trinukleotid på tværs af hvirveldyr arter (Fig. S1), i overensstemmelse med en udbredt funktionel rolle.

Uorf indvirkning på cellulære proteinniveauer.

hvis uorf ‘ er forårsager udbredt reduktion i proteinekspression, som forudsagt af ribosomscanningsmodeller, ville vi forvente, at uorf-holdige transkripter korrelerer med lavere proteinniveauer sammenlignet med uORF-mindre transkripter. For at teste denne hypotese analyserede vi i alt 11.649 matchede mRNA-og proteinoverflodsmålinger fra 4 offentliggjorte undersøgelser på tværs af en række musevæv og udviklingsstadier. Disse omfattede: 2.484 gener udtrykt i lever (12), 722 gener udtrykt i 6 stadier af lungeudvikling (13), 487 mitokondrier-lokaliserede genprodukter udtrykt i 14 væv (14) og 925 gener udtrykt i 6 væv (15) (Se si-tekst for detaljer). Proteiner blev påvist via tandemmassespektrometri (MS/MS), og overflod blev estimeret ved standardmetoder ved anvendelse af det normaliserede Antal (12, 13, 15) eller det samlede spidsareal (14) af matchende MS-spektre. mRNA-overflod under disse forhold blev målt ved mikroarrays (21, 22). Selvom ingen af teknologierne giver absolut kvantificering, kan disse store datasæt afsløre tendenser på tværs af tusinder af gener. Fordi MS / MS-teknologi ikke pålideligt kan skelne mellem splejsningsvarianter, analyserede vi ekspression på genniveau og betragtede kun de gener, hvis kollektive splejsningsvarianter enten alle indeholder eller alle mangler uORFs. I overensstemmelse med tidligere rapporter (23) observerede vi, at de 10% mest udtrykte udskrifter baseret på mikroarray vævsatlaser (21) har tendens til at mangle uorfer (Fig. S2 og SI tekst), og derfor udelukkede vi konservativt disse gener for at undgå at overvurdere uorf-effekter.

på trods af forskelle i eksperimentel metode viste alle 4 uafhængige datasæt en reduceret fordeling af proteinniveauer for gener indeholdende versus manglende uorf ‘ er (Fig. 2 A-D). Medianproteinniveauerne blev reduceret med henholdsvis 39% (P = 1e−5), 29% (P = 0,007), 34% (P = 0,008) og 13% (P = 0,36), hvor signifikansen blev bestemt ved empirisk permutationstest. mRNA-niveauerne blev reduceret i mindre grad, idet kun leverdatasættet (12) viste en statistisk signifikant medianreduktion (Fig. 2 og Fig. S3). Det er vigtigt, at forholdet mellem protein og mRNA blev signifikant reduceret for uorf-holdige gener i 3 af 4 datasæt (Fig. 2 og Fig. S3), hvilket antyder, at uorf-tilstedeværelse sandsynligvis hæmmer oversættelse af hovedkodningssekvensen. Vi observerede de samme tendenser, da vi ændrede definitionen af en uORF ved at ændre længde-og overlapningskriterier, og når vi inkluderede de 10% mest udtrykte gener (Fig. S4). Analyse af yderligere 2 MS / MS-studier af Muse-adipocytceller (16) og differentierende embryonale stamceller (17) viste også reducerede proteinniveauer for uorf-holdige gener, skønt matchede mRNA-data ikke var tilgængelige (Fig. S3). Samlet viste disse analyser på tværs af 3.297 musegener den første store korrelation af uorf-tilstedeværelse med reducerede proteinniveauer.

Fig. 2.

proteinekspression af uorf-holdige gener. (A–D) kumulativ fordeling af proteinekspression for musegener, der indeholder uorfer (rød kurve) eller mangler uorfer (grå kurve) i hver af 4 uafhængige MS/MS-studier (12-15). N angiver antallet af unikke gener i hvert sæt. (E) Median reduktion af protein-og mRNA-ekspression for gener indeholdende uorfer sammenlignet med gener, der mangler uorfer, med P-værdier (i parentes) beregnet ved empirisk permutationstest.

for at afgøre, om uorf ‘ er spiller en kausal rolle i reduktion af proteinniveauer og for mere præcist at kvantificere deres effektstørrelse, udførte vi en række eksperimenter på 15 uorf-holdige gener ved hjælp af dual-luciferase reporter konstruktioner (se materialer og metoder). Fem gener blev valgt tilfældigt fra sættet af alle musetranskripter indeholdende enkelt uorf’ er, og hvor 5 ‘ UTR-længden for teknisk lethed oversteg 100 nt (Fig. 3 B og F). Yderligere 10 blev valgt fra vores mitokondrielle undersøgelse (14), hvor MS/MS og bevaringsdata foreslog funktionalitet (Fig. 3 C og G). Vi klonede 5 ‘ UTR for hvert valgt gen opstrøms for en luciferase reporter (Fig. 3A). HEK 293a-celler blev derefter transficeret med uorf-holdige luciferase-konstruktioner eller kontrolkonstruktioner, hvor uorfs startkodon (ATG) blev muteret til TTG. Efter 48 timer blev celler analyseret for luciferase-transkriptionsniveauer ved kvantitativ PCR og for luciferaseaktivitet ved luminometri. Disse eksperimenter viste, at uORFs i gennemsnit forårsager et fald på 58% i proteinniveauer (Fig. 3 B og C) og et fald på 5% i transkriptionsniveauer (Fig. 3 F og G). Alle individuelle proteinforskelle og 4 mRNA-forskelle var statistisk signifikante (Fig. 3), og alle forskelle i protein/mRNA-forholdet var statistisk signifikante bortset fra Gen Hsdl2 (tabel S2). Konstruktionerne med tilfældigt udvalgte uorfer viste højere proteinniveauer sammenlignet med de uorfer, der blev valgt med bevis for funktionalitet (P = 1e−5 baseret på t-test). Lignende resultater blev opnået ved anvendelse af HEK 293t-celler. Sammen viser de store korrelationer og valideringseksperimenter, at uorf ‘ er forårsager stump proteinekspression af nedstrøms kodende sekvenser.

Fig. 3.

Luciferase-analyser af uorf-effekter på protein-og mRNA-niveauer. (A) eksperimentelt design af reporterkonstruktioner med og uden uORFs er vist for eksempel Mrpl11. (B–I) normaliseret luciferaseaktivitet (B–E) og mRNA–ekspression (F-I) vises for reporterkonstruktioner, der indeholder en uORF (rød) eller mangler en uorf (grå) på grund af en mutation, der forstyrrer uORF-startkodonet. Konstruktionerne indeholder 5 ‘ UTR ‘ er fra: 5 musegener valgt tilfældigt (B og F), 10 musegener med proteomiske og bevaringsunderskrifter af funktionelle uorfer (C og G), 5 humane gener med polymorfe uorfer (D og H) og 5 humane sygdomsgener med uorf-ændrende mutationer påvist hos patienter (E og i). Fejlbjælker repræsenterer Karr SE af Karr 6 biologiske replikater (B–E) og Karr 4 tekniske replikater (F–i). Stjerner angiver signifikant forskel (P < 0,01).

indflydelse af Uorf kontekst, Position og bevarelse.

vi undersøgte derefter, om specifikke uorf-egenskaber var forbundet med stærkere translationel inhibering. Vi analyserede uorf-længde, antal, bevarelse, position i forhold til hætten, position i forhold til CDS og uAUG-kontekst (også kaldet “Kosak-sekvens”) (se materialer og metoder). Vi kvantificerede uorf-effekter ved hjælp af Kolmogorov–Smirnov (KS) d statistik inden for det største datasæt (lever), som tilbød statistisk styrke til disse analyser. Alle testede undergrupper af uorf ‘ er viste reducerede proteinniveauer sammenlignet med uorf-mindre gener (P < 0.05), skønt visse egenskaber ændrede effektstørrelsen (Fig. S5). Som forudsagt af Kosaks klassiske eksperimenter (1, 20, 24-26), øget inhibering korreleret med stærk versus svag uAUG-kontekst (P = 0,04), lang versus kort cap-to–uORF−afstand (P = 0,009 til 4e−4), tilstedeværelse af flere uORFs i 5′ UTR (P = 8e-6) og øget konservering (P = 1e-6) (Fig. S5). Overraskende observerede vi ingen signifikant forskel mellem uORFs helt opstrøms versus overlappende CDS (P = 0.9), mellem uORFs af forskellig nærhed til CDS (P = 0.6 til 0.5) eller mellem uORFs af forskellig længde (P = 0,3). Disse sammenligninger over hundreder af levergener indikerer, at selvom alle typer uorf’ er kan reducere proteinekspression, er 4 uorf-egenskaber forbundet med større hæmning: stærk uAUG-kontekst, evolutionær bevarelse, øget afstand fra hætten og flere uorf ‘er i 5’ UTR.

polymorfe uorfer hos mennesker.

i betragtning af at uorfer reducerer proteinekspression, kan polymorfier, der skaber eller sletter uorfer, påvirke humane fænotyper. Derfor søgte vi efter uorf-ændrende varianter inden for de 12 millioner SNP ‘ er i den menneskelige dbsnp-database (18). Vi mønter udtrykket polymorf uORF (puORF) for at indikere en uORF, der oprettes eller slettes af en polymorfisme. Vi identificerede puorfer i 509 unikke gener (tabel S3), hvoraf 366 gener havde flere uorfer, og 143 gener havde enkelt uorfer (tabel 1). Ved hjælp af de cellulære reporterkonstruktioner, der er beskrevet ovenfor, testede vi funktionaliteten af 5 puORFs. I alle tilfælde producerede konstruktionerne med uorf ‘ er 30-60% mindre protein end dem med den UORF-mindre SNP-variant med et gennemsnitligt 3% fald i mRNA-niveauer (Fig. 3 D og H). Alle individuelle reduktioner af protein og protein/mRNA var statistisk signifikante (tabel S2). Virkningen af puORFs var sammenlignelig med alle andre uORFs, der blev testet eksperimentelt (Fig. 3). Således vil naturligt forekommende uorf-ændrende polymorfier sandsynligvis ændre cellulær ekspression af nedstrømsproteinet.

se denne tabel:

  • Vis inline
  • Vis popup
tabel 1.

bemærkelsesværdige menneskelige varianter, der skaber polymorfe uorfer

puORF-medierede forskelle i proteinniveauer.

en af de humane Uorf-ændrende SNP ‘ er (rs1801020) har tidligere været forbundet med forskelle i cirkulerende plasmaniveauer af koagulationsfaktor i 5 uafhængige undersøgelser (27-31) (Fig. 4). Denne SNP repræsenterer en almindelig T / C-polymorfisme med prævalens af T-allelen estimeret til 20% hos kaukasiske og 70% i asiatiske populationer (27-31). Kanaji og kolleger demonstrerede, at T-allelen reducerer proteinniveauer og foreslog, at mekanismen kunne skyldes forstyrrelse af Kosak-konsensussekvensen eller indførelsen af en uORF, skønt disse hypoteser ikke blev testet (30). For eksperimentelt at teste uorf-hypotesen oprettede vi 8 reporterkonstruktioner, der omfattede alle 4 mulige nukleotidvarianter på SNP-stedet, 3 kunstige uORF-genererende mutationer og 1 mutation, der skabte et alternativt startsted i rammen (Fig. 4A). Alle 4 uorf-holdige UTR-konstruktioner viste > 50% reduktion i proteinniveauer (P < 2e−6), mens de 4 konstruktioner, der manglede uorf ‘ er, ikke viste stærke forskelle i proteinniveauer (Fig. 4B). mRNA-niveauerne blev ændret med < 30% (tabel S2). Disse resultater tyder stærkt på, at tilstedeværelsen af en puORF er ansvarlig for den observerede variation i humane proteinniveauer.

Fig. 4.

polymorf uORF ændrer proteinekspression. (A) 5′ UTR-sekvens af FKS vist med 2 SNP-varianter, hvor T-allelen opretter en uORF (rød tekst). Nedenfor er 8 konstruktioner med introducerede mutationer (understreget tekst), hvor farvet tekst angiver en uORF (rød) eller in-frame alternativ start (grøn). (B) Luciferase-aktivitet fra reporterkonstruktioner, der er anført i A. Fejlbjælker repræsenterer Karr SD af Karr 6 biologiske replikater. C) metaanalyse af plasmaaktivitetsniveauer målt ved 5 uafhængige undersøgelser, stratificeret efter genotype af SNP rs1801020.

Uorf-ændrende mutationer relateret til Human sygdom.

ud over almindelige puorfer kan sjældne mutationer, der ændrer uorfer, forårsage sygdom, som det er vist for 3 gener (tabel 2). For systematisk at identificere yderligere tilfælde søgte vi den humane Genmutationsdatabase (19) efter mutationer, der introducerer eller eliminerer uorf ‘ er. Vi fandt 11 yderligere mutationer (tabel 2), der blev påvist ved gensekventering i kendte sygdomsrelaterede gener hos berørte patienter (32-42). Disse uorf-ændrende mutationer var ikke til stede i populationskontroller (32-42) og var enten den eneste mutation, der blev påvist i de sekventerede eksoner, eller var sammensatte heterosygøse med en missense/nonsense-mutation (tabel 2). Patientpræsentationen var i overensstemmelse med en recessiv fænotype i 3 af de 4 sammensatte heterosygøse tilfælde (37, 38, 42, 43), og var tvetydig i det resterende tilfælde (36). Så vidt vi ved, var den mekanistiske forbindelse mellem genmutationen og uORFs ikke tidligere blevet foreslået for SRY (32), IRF6 (33) eller GCH1 (34).

se denne tabel:

  • Vis inline
  • Vis popup
tabel 2.

uorf-ændrende mutationer forbundet med sygdom

for at vurdere, om de uorf-ændrende mutationer påvirkede proteinekspression, brugte vi luciferase reporter-konstruktioner til at teste patientmutationer i 5 gener (HBB, PRKAR1A, IRF6, SRY og SPINK1). De uorf-ændrende mutationer i disse gener reducerede luciferase mRNA-niveauer med <20% og luciferase-aktivitetsniveauer med 70-100% (Fig. 3 E og I). Disse virkninger på proteinniveauer var meget signifikante (P < 2e−12) og var større end i de andre uorf ‘ er, der blev testet eksperimentelt (P = 4e−4). Således forårsager disse uorf-ændrende mutationer dramatisk reducerede proteinniveauer i vores reporteranalyser, hvilket antyder, at de faktisk kan være ansvarlige for de observerede sygdomsfænotyper.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.