wyniki

Uorfa w Transkryptach ssaków.

definiujemy uORF jako utworzony przez kodon startowy w obrębie 5 ’ UTR, kodon zatrzymania w ramce poprzedzający koniec głównej sekwencji kodowania (CDS), o długości co najmniej 9 nt włącznie z kodonem zatrzymania. Jak pokazano na Fig. 1A, definicja ta obejmuje uorf zarówno w pełni poprzedzające, jak i nakładające się na CDS, ponieważ oba typy są przewidywane jako funkcjonalne (20). Szukaliśmy uorfów we wszystkich ludzkich i mysich transkryptach RefSeq z adnotacją 5 ’ UTRs >10 nt. Zgodnie z wcześniejszymi szacunkami (9, 10), stwierdzamy, że 49% transkryptów ludzkich i 44% mysich zawiera co najmniej 1 uORF (rys. 1B). Co ciekawe, kodony startowe uorfa ludzkiego i myszy (uAUGs) są najbardziej zachowanymi trinukleotydami 5′ UTR wśród kręgowców (Fig. S1), zgodnie z powszechną rolą funkcjonalną.

wpływ uorfa na poziom białek komórkowych.

jeśli uorf powodują powszechne zmniejszenie ekspresji białka, zgodnie z przewidywaniami modeli skanowania rybosomów, spodziewalibyśmy się, że transkrypty zawierające uORF korelują z niższymi poziomami białka w porównaniu z transkryptami bez uorfa. Aby przetestować tę hipotezę, przeanalizowaliśmy łącznie 11 649 dopasowanych pomiarów liczebności mRNA i białka z 4 opublikowanych badań w różnych tkankach myszy i stadiach rozwojowych. Należą do nich: 2484 geny ekspresji w wątrobie (12), 722 geny ekspresji w 6 stadiach rozwoju płuc (13), 487 zlokalizowanych w mitochondriach produktów genowych ekspresji w 14 tkankach (14) i 925 genów ekspresji w 6 tkankach (15) (szczegóły w tekście SI). Białka wykryto za pomocą tandemowej spektrometrii masowej (MS/MS), a liczebność oszacowano za pomocą standardowych metod z wykorzystaniem znormalizowanej liczby (12, 13, 15) lub całkowitej powierzchni piku (14) pasujących widm MS. obfitość mRNA w tych warunkach mierzono za pomocą mikromacierzy (21, 22). Chociaż żadna technologia nie zapewnia absolutnej ilości, te duże zbiory danych mogą ujawnić trendy w tysiącach genów. Ponieważ technologia MS / MS nie potrafi wiarygodnie odróżnić wariantów splicingu, przeanalizowaliśmy ekspresję na poziomie genu i wzięliśmy pod uwagę tylko te geny, których warianty splicingu zbiorczego albo zawierają, albo nie zawierają uorfów. Zgodnie z poprzednimi doniesieniami (23), zaobserwowaliśmy, że 10% najbardziej silnie wyrażonych transkryptów opartych na atlasach tkanek mikromacierzy (21) ma tendencję do braku uorf (rys. S2 i tekst SI), a zatem zachowawczo wykluczyliśmy te geny, aby uniknąć przeszacowania efektów uorfa.

pomimo różnic w metodologii eksperymentalnej, wszystkie 4 niezależne zbiory danych wykazały zmniejszoną dystrybucję poziomów białka dla genów zawierających w porównaniu z brakującymi uorf (Fig. 2 A-D). Mediana stężenia białka zmniejszyła się odpowiednio o 39% (P = 1e−5), 29% (P = 0, 007), 34% (P = 0, 008) i 13% (P = 0, 36), gdzie znaczenie zostało określone w empirycznym badaniu permutacji. stężenia mRNA były zmniejszone w mniejszym stopniu, a jedynie zbiór danych dotyczących wątroby (12) wykazywał statystycznie istotne zmniejszenie mediany (Fig. 2E i Rys. S3). Co ważne, stosunek białka do mRNA został znacząco zmniejszony dla genów zawierających uORF w 3 z 4 zestawów danych (Fig. 2E i Rys. S3), co sugeruje, że obecność uorfa prawdopodobnie hamuje translację głównej sekwencji kodującej. Obserwowaliśmy te same trendy, kiedy zmieniliśmy definicję uORF poprzez zmianę kryteriów długości i pokrywania się, i kiedy uwzględniliśmy 10% najbardziej silnie wyrażonych genów (rys. S4). Analiza 2 dodatkowych badań MS / MS na mysich komórkach adipocytów (16) i różnicujących embrionalnych komórkach macierzystych (17) również wykazała obniżony poziom białka dla genów zawierających uORF, chociaż dopasowane DANE mRNA nie były dostępne (Fig. S3). Łącznie te analizy na 3297 genach myszy wykazały pierwszą na dużą skalę korelację obecności uorfa ze zmniejszonym poziomem białka.

2.

ekspresja białek genów zawierających uORF. (A–D) skumulowana Dystrybucja ekspresji białka dla genów myszy zawierających uorf (czerwona krzywa) lub pozbawionych uorf (szara krzywa) w każdym z 4 niezależnych badań MS / MS (12-15). N oznacza liczbę unikalnych genów w każdym zestawie. E) Mediana redukcji ekspresji białka i mRNA dla genów zawierających uorf w porównaniu z genami pozbawionymi uorf, z wartościami P (w nawiasach) obliczonymi przez empiryczne badanie permutacji.

aby określić, czy uorf odgrywają przyczynową rolę w obniżaniu poziomu białka, oraz aby dokładniej określić wielkość ich efektu, przeprowadziliśmy serię eksperymentów na 15 genach zawierających uORF, wykorzystując konstrukty reporterowe podwójnej lucyferazy (patrz materiały i metody). Z zestawu wszystkich transkryptów myszy zawierających pojedyncze uorf wybrano losowo pięć genów, w których dla ułatwienia technicznego długość 5 ’ UTR przekroczyła 100 nt (Fig. 3 B I F). Dodatkowe 10 wybrano z naszego badania mitochondrialnego (14), w którym MS/MS i dane konserwacyjne sugerowały funkcjonalność (rys. 3 C i G). Sklonowaliśmy 5 ’ UTR każdego wybranego genu przed reporterem lucyferazy (rys. 3A). Komórki HEK 293a transfekowano następnie konstruktami lucyferazy zawierającymi uorf lub konstruktami kontrolnymi, w których kodon startowy uorfa (ATG) zmutowano do TTG. Po 48 godzinach komórki oceniano na poziomy transkrypcji lucyferazy za pomocą ilościowego PCR i aktywności lucyferazy za pomocą luminometrii. Eksperymenty te wykazały, że uorf powodują średnio 58% spadek poziomu białka (rys. 3 B I C) oraz zmniejszenie o 5% poziomu transkrypcji (rys. 3 F I G). Wszystkie różnice poszczególnych białek i 4 różnice mRNA były istotne statystycznie (Fig. 3), a wszystkie różnice w stosunku białko/mRNA były statystycznie istotne z wyjątkiem genu Hsdl2 (tabela S2). Konstrukcje z losowo wybranymi uorf−ami wykazały wyższy poziom białka w porównaniu z uorf-ami wybranymi z dowodami funkcjonalności (P = 1e-5 na podstawie testu t). Podobne wyniki uzyskano stosując komórki HEK 293t. Łącznie, wielkoskalowe korelacje i eksperymenty walidacyjne pokazują, że uorf powodują tępą ekspresję białek późniejszych sekwencji kodujących.

3.

badanie Lucyferazy wpływu uorfa na poziom białka i mRNA. A) pokazano eksperymentalne projektowanie konstruktów reporterowych z i bez uorfów, na przykład Mrpl11. (B–I) znormalizowana aktywność lucyferazy (B–E) i ekspresja mRNA (F–i) są pokazane dla konstruktów reporterowych, które zawierają uORF (czerwony) lub nie mają uORF (szary) z powodu mutacji, która zakłóca kodon początkowy uORF. Konstrukcje zawierają 5 ’ UTRs z: 5 genów myszy wybranych losowo (B I F), 10 genów myszy z proteomicznymi i zachowawczymi podpisami funkcjonalnych uorf (C i G), 5 genów ludzkich z polimorficznymi uorf (D I H) I 5 genów ludzkich chorób z mutacjami zmieniającymi uORF wykrytymi u pacjentów (E I I). Paski błędów reprezentują ±SE ≥6 replikatów biologicznych (B-E) i ≥4 replikatów technicznych (F-I). Gwiazdki wskazują na znaczącą różnicę (P < 0,01).

wpływ Uorfa kontekstu, pozycji i ochrony.

następnie zbadaliśmy, czy specyficzne właściwości uorfa były związane z silniejszym hamowaniem translacyjnym. Analizowaliśmy długość uorfa, liczbę, zachowanie, położenie względem czapki, położenie względem CDS i kontekst uAUG (zwany także „sekwencją Kozaka”) (patrz materiały i metody). Obliczyliśmy efekty uorfa za pomocą statystyki Kolmogorov-Smirnov (KS) D w ramach największego zbioru danych (liver), który oferował moc statystyczną dla tych analiz. Wszystkie badane podgrupy uorfów wykazały obniżony poziom białka w porównaniu z genami bez uorfów (P < 0.05), chociaż niektóre właściwości modyfikowały wielkość efektu (rys. S5). Jak przewidywały Klasyczne eksperymenty Kozaka (1, 20, 24-26), zwiększone hamowanie skorelowane z silnym i słabym kontekstem uAUG (P = 0,04), długa i krótka odległość cap-to-uORF (P = 0,009 do 4E–4), obecność wielu uorfów w 5′ UTR (P = 8E−6) i zwiększona ochrona (P = 1e−6) (Fig. S5). Co zaskakujące, nie zaobserwowaliśmy znaczącej różnicy między uorfami w pełni poprzedzającymi CDS a nakładającymi się na siebie CDS (P = 0,9), między uorfami o różnej bliskości do CDS (P = 0,6 do 0.5) lub pomiędzy uorfami o różnej długości (P = 0,3). Te porównania setek genów wątroby wskazują, że chociaż wszystkie typy uorf mogą zmniejszać ekspresję białka, 4 właściwości uORF są związane z większym hamowaniem: silny kontekst uAUG, konserwacja ewolucyjna, zwiększona odległość od cap i wiele uorf w 5′ UTR.

polimorficzne uorfy u ludzi.

biorąc pod uwagę, że uorfy zmniejszają ekspresję białka, polimorfizmy, które tworzą lub usuwają uorfy, mogą wpływać na ludzkie fenotypy. W związku z tym szukaliśmy wariantów zmieniających uorfa w obrębie 12 milionów SNPs w ludzkiej bazie danych dbSNP (18). Termin polimorficzny uORF (puORF) oznaczamy uorfem powstałym lub usuniętym przez polimorfizm. Zidentyfikowaliśmy puorfy w 509 unikalnych genach (tabela S3), z czego 366 genów miało wiele uorf, a 143 geny miały pojedyncze uorf (Tabela 1). Korzystając z opisanych powyżej konstrukcji reportera komórkowego, przetestowaliśmy funkcjonalność 5 puorfów. We wszystkich przypadkach konstrukty z uorf wytwarzały o 30-60% mniej białka niż te z wariantem SNP bez uORF, przy średnim spadku poziomu mRNA o 3% (rys. 3 D I H). Wszystkie indywidualne redukcje białka i białka / mRNA były istotne statystycznie(tabela S2). Wpływ puorfów był porównywalny ze wszystkimi innymi uorfami, które zostały przetestowane eksperymentalnie (rys. 3). Tak więc, naturalnie występujące polimorfizmy modyfikujące uorfa prawdopodobnie zmieniają ekspresję komórkową dolnego białka.

zobacz tę tabelę:

  • Zobacz inline
  • Zobacz popup
Tabela 1.

godne uwagi warianty ludzkie, które tworzą polimorficzne uorfy

różnice w poziomie białka czynnika XII w zależności od puorfa.

w 5 niezależnych badaniach (27-31) (rys. 4). Ten SNP reprezentuje powszechny polimorfizm T / C z częstością występowania allelu t szacowaną na 20% w populacjach kaukaskich i 70% w populacjach azjatyckich (27-31). Kanaji i współpracownicy wykazali, że allel T obniża poziom białka i zaproponowali, że mechanizm ten może być spowodowany zakłóceniem sekwencji konsensusu Kozaka lub wprowadzeniem uorfa, chociaż hipotezy te nie zostały przetestowane (30). Aby eksperymentalnie przetestować hipotezę uorfa, stworzyliśmy 8 konstruktów reporterowych, które obejmowały wszystkie 4 możliwe warianty nukleotydów w miejscu SNP, 3 sztuczne mutacje generujące uorf i 1 mutację tworzącą alternatywne miejsce startu w ramce (rys. 4a). Wszystkie 4 konstrukty UTR zawierające uORF wykazały >50% zmniejszenie poziomu białka (P < 2e-6), podczas gdy 4 konstrukty pozbawione uorf nie wykazały silnych różnic w poziomie białka (Fig. 4B). poziomy mRNA zostały zmienione o <30% (tabela S2). Wyniki te silnie sugerują, że obecność puorfa jest odpowiedzialna za obserwowaną zmienność poziomu białka ludzkiego czynnika XII.

4.

polimorficzny uORF zmienia ekspresję białka FXII. A) 5 ’ UTR Sekwencja FXII pokazana z 2 wariantami SNP, gdzie allel T tworzy uORF (tekst czerwony). Poniżej znajduje się 8 konstrukcji z wprowadzonymi mutacjami (podkreślony tekst), gdzie kolorowy tekst oznacza uORF (czerwony) lub in-frame alternative start (zielony). B) aktywność Lucyferazy z konstruktów reporterowych wymienionych w A. paski błędów reprezentują ±SD ≥6 replikatów biologicznych. C) metaanaliza poziomów aktywności fxii w osoczu mierzonych w 5 niezależnych badaniach, stratyfikowanych według genotypu SNP RS1801020.

uORF-mutacje związane z chorobą człowieka.

oprócz typowych puorf, rzadkie mutacje, które zmieniają uorf mogą powodować choroby, jak wykazano w przypadku 3 genów (Tabela 2). Aby systematycznie identyfikować dodatkowe przypadki, przeszukaliśmy bazę danych mutacji ludzkich genów (19) w poszukiwaniu mutacji, które wprowadzają lub eliminują uorf. Znaleźliśmy 11 dodatkowych mutacji (Tabela 2), które zostały wykryte przez resekwencjonowanie znanych genów związanych z chorobą u chorych pacjentów (32-42). Te mutacje zmieniające uorfa nie były obecne w kontrolach populacji (32-42) i były albo jedyną mutacją wykrytą w sekwencjonowanych eksonach, albo były heterozygotycznymi związkami z mutacją missense/nonsense (Tabela 2). Postać pacjenta była zgodna z recesywnym fenotypem w 3 z 4 złożonych przypadków heterozygotycznych(37, 38, 42, 43), i był niejednoznaczny w pozostałym przypadku (36). Według naszej wiedzy mechanistyczny związek między mutacją genu a uorf nie został wcześniej zaproponowany dla SRY (32), IRF6 (33) lub GCH1 (34).

zobacz tę tabelę:

  • Zobacz inline
  • Zobacz popup
Tabela 2.

uORF – mutacje związane z chorobą

aby ocenić, czy mutacje modyfikujące uorfa wpłynęły na ekspresję białka, użyliśmy konstruktów reporterowych lucyferazy do badania mutacji pacjentów w 5 genach (HBB, PRKAR1A, IRF6, SRY i SPINK1). Mutacje modyfikujące uorfa w tych genach zmniejszały poziom mRNA lucyferazy o <20%, a aktywność lucyferazy o 70-100% (Fig. 3 E I I). Wpływ ten na poziom białka był bardzo znaczący (P < 2e−12) i był większy niż w innych badanych doświadczalnie uorf (P = 4e-4). Tak więc te mutacje uorfa powodują dramatycznie obniżony poziom białka w naszych testach reporterowych, co sugeruje, że mogą one rzeczywiście być odpowiedzialne za obserwowane fenotypy choroby.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.