výsledky

Prevalence uORF v Transkriptech savců.

definujeme uORF jako tvořený počátečním kodonem v rámci 5′ UTR, in-frame stop kodonem předcházejícím konci hlavní kódovací sekvence (CDS) a délkou alespoň 9 nt včetně stop kodonu. Jak je znázorněno na obr. 1A, tato definice zahrnuje uORFs jak plně upstream, tak překrývající se CDS, protože se předpokládá, že oba typy jsou funkční (20). Hledali jsme uORFs ve všech lidských a myších RefSeq transkriptech s anotovanými 5′ UTRs >10 nt. V souladu s předchozími odhady (9, 10) zjistíme, že 49% lidských a 44% myších transkriptů obsahuje alespoň 1 uORF (obr. 1B). Zajímavé je, že lidské a myší kodony (uAUGs) jsou nejzachovalejším trinukleotidem 5 ‚ UTR napříč druhy obratlovců (obr. S1), v souladu s rozšířenou funkční rolí.

uORF vliv na hladiny buněčných proteinů.

pokud uORFs způsobí rozsáhlé snížení exprese proteinu, jak předpovídají modely skenování ribozomů, očekávali bychom, že transkripty obsahující uORF budou korelovat s nižšími hladinami proteinu ve srovnání s transkripty bez uORF. Abychom otestovali tuto hypotézu, analyzovali jsme celkem 11 649 shodných měření mRNA a proteinu ze 4 publikovaných studií napříč různými myšími tkáněmi a vývojovými stádii. Mezi ně patřily: 2 484 genů exprimovaných v játrech (12), 722 genů exprimovaných v 6 stádiích vývoje plic (13), 487 genových produktů lokalizovaných v mitochondriích exprimovaných ve 14 tkáních (14) a 925 genů exprimovaných v 6 tkáních (15) (podrobnosti viz Text SI). Proteiny byly detekovány pomocí tandemové hmotnostní spektrometrie (MS/MS) a hojnost byla odhadnuta standardními metodami za použití normalizovaného počtu (12, 13, 15) nebo celkové plochy píku (14) odpovídajících MS spekter. množství mRNA v těchto podmínkách bylo měřeno mikroarrays (21, 22). Ačkoli ani jedna technologie neposkytuje absolutní kvantifikaci, tyto rozsáhlé datové soubory mohou odhalit trendy napříč tisíci genů. Protože technologie MS / MS nedokáže spolehlivě rozlišit varianty spojů, analyzovali jsme expresi na úrovni genů a zvažovali pouze ty geny, jejichž kolektivní varianty spojů buď všechny obsahují, nebo všechny chybí, uORFs. V souladu s předchozími zprávami (23) jsme zjistili, že 10% nejvíce exprimovaných transkriptů založených na atlasech tkáně microarray (21) má tendenci postrádat uORFs (obr. S2 a SI Text), a proto jsme tyto geny konzervativně vyloučili, abychom se vyhnuli přeceňování účinků uORF.

navzdory rozdílům v experimentální metodice vykazovaly všechny 4 nezávislé datové sady sníženou distribuci hladin proteinů pro geny obsahující oproti chybějícím uorf (obr. 2 A-D). Medián hladin proteinu byl snížen o 39% (P = 1e−5), 29% (P = 0, 007), 34% (P = 0, 008) a 13% (P = 0, 36), kde významnost byla stanovena empirickým permutačním testem. hladiny mRNA byly sníženy v menší míře, přičemž pouze jaterní datová sada (12) vykazovala statisticky významné mediánové snížení (obr. 2E a obr. Galaxie). Důležité je, že poměr proteinu k mRNA byl významně snížen u genů obsahujících uORF ve 3 ze 4 datových sad (obr. 2E a obr. S3), což naznačuje, že přítomnost uORF pravděpodobně inhibuje translaci hlavní kódovací sekvence. Stejné trendy jsme pozorovali, když jsme upravili definici uORF změnou kritérií délky a překrytí a když jsme zahrnuli 10% nejvíce exprimovaných genů (obr. S4). Analýza 2 dalších studií MS/MS u myší adipocytových buněk (16) a diferenciace embryonálních kmenových buněk (17) také ukázala snížené hladiny bílkovin pro geny obsahující uORF, ačkoli odpovídající údaje o mRNA nebyly k dispozici (obr. Galaxie). Souhrnně tyto analýzy napříč 3 297 myší geny prokázaly první rozsáhlou korelaci přítomnosti uORF se sníženými hladinami proteinu.

obr. 2.

proteinová exprese genů obsahujících uORF. (A–D) kumulativní distribuce exprese proteinu pro myší geny obsahující uORFs (červená křivka) nebo postrádající uORFs (šedá křivka) v každé ze 4 nezávislých studií MS / MS (12-15). N označuje počet jedinečných genů v každé sadě. (E) medián redukce exprese proteinu a mRNA pro geny obsahující uORFs ve srovnání s geny postrádajícími uORFs, s hodnotami P (v závorkách) vypočtenými empirickým permutačním testováním.

abychom zjistili, zda uorf hrají kauzální roli při snižování hladin proteinů a přesněji kvantifikovali jejich velikost účinku, provedli jsme řadu experimentů na 15 genech obsahujících uORF pomocí reporterových konstrukcí s duální luciferázou (viz materiály a metody). Pět genů bylo vybráno náhodně ze sady všech myších transkriptů obsahujících jednotlivé uORFs a kde Pro technickou snadnost Délka 5′ UTR přesáhla 100 nt (obr. 3 B A F). Dalších 10 bylo vybráno z naší mitochondriální studie (14), kde MS / MS a údaje o zachování navrhly funkčnost (obr. 3 C A G). Klonovali jsme 5 ‚ UTR každého vybraného genu před reportérem luciferázy (obr. 3A). Buňky HEK 293A byly poté transfektovány konstrukty luciferázy obsahující uorf nebo kontrolními konstrukty, kde byl počáteční kodon UORF (ATG) mutován na TTG. Po 48 hodinách byly buňky testovány na hladiny transkriptu luciferázy kvantitativní PCR a na aktivitu luciferázy luminometrií. Tyto experimenty ukázaly, že uorfs v průměru způsobují 58% pokles hladin bílkovin (obr. 3 B A C) a 5% snížení hladiny přepisu (obr. 3 F A G). Všechny individuální proteinové rozdíly a 4 rozdíly mRNA byly statisticky významné (obr. 3) a všechny rozdíly v poměru protein/mRNA byly statisticky významné s výjimkou genu Hsdl2 (tabulka S2). Konstrukce s náhodně vybranými uORFs vykazovaly vyšší hladiny proteinu ve srovnání s uorfs vybranými s důkazem funkčnosti (P = 1e-5 na základě t testu). Podobné výsledky byly získány za použití buněk HEK 293T. Společně rozsáhlé korelace a validační experimenty ukazují, že uORFs způsobují tupou proteinovou expresi navazujících kódujících sekvencí.

obr. 3.

Luciferázové testy vlivu uORF na hladiny bílkovin a mRNA. (A) experimentální návrh reportérových konstrukcí s uORFs i bez nich je ukázán například Mrpl11. (B–I) normalizovaná luciferázová aktivita (B-E) a exprese mRNA (F-I) jsou zobrazeny pro reporterové konstrukce, které obsahují uORF (červený) nebo postrádají uORF (šedý) kvůli mutaci, která narušuje uorf start kodon. Konstrukce obsahují 5 ‚ UTRs z: 5 myších genů vybraných náhodně (B A F), 10 myších genů s proteomickými a konzervačními podpisy funkčních uORFs (C A G), 5 lidských genů s polymorfními uORFs (D A H) a 5 genů lidských chorob s mutacemi měnícími uORF detekovanými u pacientů (E A I). Chybové sloupce představují ±se ≥6 biologických replik (B–E) a ≥4 technických replik (F–I). Hvězdičky označují významný rozdíl (P < 0,01).

vliv uORF kontextu, pozice, a zachování.

dále jsme zkoumali, zda specifické vlastnosti uORF byly spojeny se silnější translační inhibicí. Analyzovali jsme uORF délku, počet, konzervaci, polohu vzhledem k čepici, polohu vzhledem k CDS a kontext uAUG (nazývaný také „Kozakova sekvence“) (viz materiály a metody). Kvantifikovali jsme uorf efekty pomocí statistiky Kolmogorov-Smirnov (KS) D v rámci největšího datového souboru (játra), který nabídl statistickou sílu pro tyto analýzy. Všechny testované podskupiny uORFs vykazovaly snížené hladiny proteinů ve srovnání s geny bez uORF (P < 0.05), i když některé vlastnosti upravily velikost efektu (obr. S5). Jak předpovídaly Kozakovy klasické experimenty (1, 20, 24-26), zvýšená inhibice korelovala se silným versus slabým kontextem uAUG (P = 0,04), dlouhou versus krátkou vzdáleností cap-to-uORF (P = 0,009 až 4e–4), přítomností více uorf v 5′ UTR (P = 8e−6) a zvýšenou ochranou (P = 1e−6) (obr. S5). Překvapivě jsme nezaznamenali žádný významný rozdíl mezi uorfs plně upstream versus překrývajícími se CD (P = 0.9), mezi uORFs s různou blízkostí CD (P = 0.6 až 0.5) nebo mezi uorfy různých délek (P = 0,3). Tato srovnání se stovkami jaterních genů naznačují, že ačkoli všechny typy uorf mohou snížit expresi proteinů, vlastnosti 4 uORF jsou spojeny s větší inhibicí: silný kontext uAUG, evoluční ochrana,zvýšená vzdálenost od cap, a více uorf v 5 ‚ UTR.

polymorfní uorfy u lidí.

vzhledem k tomu, že uORFs snižují expresi proteinů, polymorfismy, které vytvářejí nebo odstraňují uORFs, by mohly ovlivnit lidské fenotypy. Proto jsme hledali varianty změny uORF v rámci 12 milionů SNP v lidské databázi dbSNP (18). Termín polymorfní uORF (puORF) označujeme uORF, který je vytvořen nebo odstraněn polymorfismem. Identifikovali jsme puORFs v 509 jedinečných genech (tabulka S3), z nichž 366 genů mělo více uORFs a 143 genů mělo jednotlivé uORFs(Tabulka 1). Pomocí konstruktů buněčného reportéru popsaných výše jsme testovali funkčnost 5 puORFs. Ve všech případech konstrukty s uORFs produkovaly o 30-60% méně bílkovin než ty s variantou SNP bez uORF, s průměrným 3% snížením hladin mRNA (obr. 3 D A H). Všechny jednotlivé redukce proteinů a proteinů/mRNA byly statisticky významné (tabulka S2). Dopad puorf byl srovnatelný se všemi ostatními uorf, které byly experimentálně testovány (obr. 3). Přirozeně se vyskytující polymorfismy měnící uORF tedy pravděpodobně změní buněčnou expresi navazujícího proteinu.

zobrazit tuto tabulku:

  • Zobrazit inline
  • zobrazit vyskakovací okno
Tabulka 1.

pozoruhodné lidské varianty, které vytvářejí polymorfní uorfy

puORF-zprostředkované rozdíly v hladinách proteinu faktoru XII.

jeden z lidských SNP (rs1801020) byl dříve spojován s rozdíly v cirkulujících plazmatických hladinách koagulačního faktoru XII (FXII) v 5 nezávislých studiích (27-31) (obr. 4). Tento SNP představuje běžný T / C polymorfismus s prevalencí alely T odhadovanou na 20% u kavkazských a 70% u asijských populací (27-31). Kanaji a jeho kolegové prokázali, že alela T snižuje hladiny bílkovin, a navrhli, že mechanismus by mohl být způsoben narušením konsensuální sekvence Kozak nebo zavedením uORF, i když tyto hypotézy nebyly testovány (30). Abychom experimentálně otestovali hypotézu uORF, vytvořili jsme 8 reportérových konstrukcí, které zahrnovaly všechny 4 možné varianty nukleotidů v místě SNP, 3 umělé mutace generující uORF a 1 mutaci vytvářející alternativní počáteční místo v rámci (obr. 4A). Všechny 4 konstrukty UTR obsahující uORF vykazovaly >50% snížení hladin bílkovin (P < 2e-6), zatímco 4 konstrukty postrádající uORFs nevykazovaly silné rozdíly v hladinách bílkovin (obr. 4B). hladiny mRNA byly změněny o <30% (tabulka S2). Tyto výsledky silně naznačují, že přítomnost puORF je zodpovědná za pozorovanou změnu hladin proteinu lidského faktoru XII.

obr. 4.

polymorfní uORF mění expresi FXII proteinu. (A) 5 ‚ UTR sekvence FXII zobrazeno s 2 SNP varianty, kde t alela vytváří uORF (červený text). Níže je 8 konstruktů se zavedenými mutacemi (podtržený text), kde barevný text označuje uORF (červený) nebo in-frame alternativní start (zelený). B) Luciferázová aktivita z reporterových konstrukcí uvedených v a. chybové pruhy představují ±SD ≥6 biologických replikátů. C) metaanalýza plazmatických hladin aktivity FXII měřených 5 nezávislými studiemi stratifikovanými podle genotypu SNP rs1801020.

uORF-měnící se mutace související s lidským onemocněním.

kromě běžných puorf mohou vzácné mutace, které mění uorf, způsobovat onemocnění, jak bylo prokázáno u 3 genů (Tabulka 2). Abychom systematicky identifikovali další případy, prohledali jsme databázi lidských genových mutací (19) pro mutace, které zavádějí nebo eliminují uORFs. Zjistili jsme 11 dalších mutací (Tabulka 2), které byly detekovány resekvenováním ve známých genech souvisejících s onemocněním u postižených pacientů (32-42). Tyto mutace modifikující uORF nebyly přítomny v populačních kontrolách (32-42) a byly buď jedinou mutací detekovanou v sekvenovaných exonech, nebo byly složené heterozygotní s mutací missense/nonsense (Tabulka 2). Prezentace pacienta byla v souladu s recesivním fenotypem ve 3 ze 4 sloučenin heterozygotních případů (37, 38, 42, 43), a ve zbývajícím případě byl nejednoznačný (36). Pokud je nám známo, mechanistické spojení mezi genovou mutací a uORFs nebylo dříve navrženo pro SRY (32), IRF6 (33) nebo GCH1 (34).

zobrazit tuto tabulku:

  • Zobrazit inline
  • zobrazit vyskakovací okno
Tabulka 2.

uORF-měnící se mutace spojené s onemocněním

k posouzení, zda mutace modifikující uORF ovlivnily expresi proteinů, jsme použili luciferase reporter konstrukty k testování mutací pacientů v 5 genech (HBB, PRKAR1A, IRF6, SRY a SPINK1). Mutace modifikující uORF v těchto genech snížily hladiny mRNA luciferázy o <20% a hladiny aktivity luciferázy o 70-100% (obr. 3 E a I). Tyto účinky na hladiny proteinu byly vysoce významné (P < 2e-12) a byly větší než u ostatních experimentálně testovaných uorf (P = 4e−4). Tyto mutace, které mění uORF, tedy v našich reportérských testech způsobují dramaticky snížené hladiny bílkovin, což naznačuje, že mohou být skutečně odpovědné za pozorované fenotypy onemocnění.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.