Ergebnisse

uORF-Prävalenz in Säugetier-Transkripten.

Wir definieren ein uORF als gebildet durch ein Startcodon innerhalb einer 5’UTR, ein In-Frame-Stoppcodon vor dem Ende der Hauptcodiersequenz (CDS) und eine Länge von mindestens 9 nt einschließlich des Stoppcodons. Wie in Fig. 1A umfasst diese Definition UORF sowohl vollständig stromaufwärts als auch überlappend zu den CDS, da beide Typen als funktionsfähig vorhergesagt werden (20). Wir suchten nach UORF in allen menschlichen und Maus-RefSeq-Transkripten mit annotierten 5’UTRs > 10 nt. In Übereinstimmung mit früheren Schätzungen (9, 10) stellen wir fest, dass 49% der menschlichen und 44% der Maus-Transkripte mindestens 1 uORF enthalten (Abb. 1B). Interessanterweise sind menschliche und Maus-UAUGS-Codons (uAUGs) das am besten konservierte 5’UTR-Trinukleotid bei Wirbeltierarten (Abb. S1), im Einklang mit einer weit verbreiteten funktionalen Rolle.

uORF Auswirkungen auf zelluläre Proteinspiegel.

Wenn UORF eine weit verbreitete Reduktion der Proteinexpression verursachen, wie von Ribosomen-Scanning-Modellen vorhergesagt, würden wir erwarten, dass uORF-haltige Transkripte im Vergleich zu uORF-weniger Transkripten mit niedrigeren Proteinspiegeln korrelieren. Um diese Hypothese zu testen, analysierten wir insgesamt 11.649 übereinstimmende mRNA- und Proteinabundanzmessungen aus 4 veröffentlichten Studien über eine Vielzahl von Mausgeweben und Entwicklungsstadien. Dazu gehörten: 2.484 Gene, die in der Leber exprimiert werden (12), 722 Gene, die in 6 Stadien der Lungenentwicklung exprimiert werden (13), 487 Mitochondrien-lokalisierte Genprodukte, die in 14 Geweben exprimiert werden (14), und 925 Gene, die in 6 Geweben exprimiert werden (15) (siehe SI-Text für Details). Proteine wurden mittels Tandem-Massenspektrometrie (MS / MS) nachgewiesen, und die Häufigkeit wurde mit Standardmethoden unter Verwendung der normalisierten Anzahl (12, 13, 15) oder der Gesamtpeakfläche (14) passender MS-Spektren geschätzt. Die mRNA-Häufigkeit unter diesen Bedingungen wurde durch Microarrays gemessen (21, 22). Obwohl keine der beiden Technologien eine absolute Quantifizierung ermöglicht, können diese groß angelegten Datensätze Trends über Tausende von Genen hinweg aufdecken. Da die MS / MS-Technologie Spleißvarianten nicht zuverlässig unterscheiden kann, analysierten wir die Expression auf Genebene und betrachteten nur diejenigen Gene, deren kollektive Spleißvarianten entweder alle uORFs enthalten oder allen fehlen. In Übereinstimmung mit früheren Berichten (23) beobachteten wir, dass die 10% der am stärksten exprimierten Transkripte basierend auf Mikroarray-Gewebeatlanten (21) tendenziell keine UORF aufweisen (Abb. S2 und SI3), und deshalb haben wir diese Gene konservativ ausgeschlossen, um eine Überschätzung der uORF-Effekte zu vermeiden.

Trotz Unterschieden in der experimentellen Methodik zeigten alle 4 unabhängigen Datensätze eine reduzierte Verteilung der Proteinspiegel für Gene, die UORF enthielten, im Vergleich zu Genen ohne UORF (Abb. 2 A-D). Die mittleren Proteinspiegel wurden jeweils um 39% (P = 1e−5), 29% (P = 0,007), 34% (P = 0,008) und 13% (P = 0,36) reduziert, wobei die Signifikanz durch empirische Permutationstests bestimmt wurde. Die mRNA-Spiegel waren in geringerem Maße reduziert, wobei nur der Leberdatensatz (12) eine statistisch signifikante mediane Reduktion zeigte (Abb. 2E und Fig. S3). Wichtig ist, dass das Verhältnis von Protein zu mRNA für uORF-haltige Gene in 3 von 4 Datensätzen signifikant reduziert war (Abb. 2E und Fig. S3), was darauf hindeutet, dass das Vorhandensein von uORF wahrscheinlich die Translation der Hauptcodiersequenz hemmt. Wir beobachteten die gleichen Trends, wenn wir die Definition eines uORF durch Änderung der Längen- und Überlappungskriterien modifizierten und wenn wir die 10% der am stärksten exprimierten Gene einschlossen (Abb. S4). Die Analyse von 2 zusätzlichen MS / MS-Studien an Adipozytenzellen der Maus (16) und differenzierenden embryonalen Stammzellen (17) zeigte ebenfalls reduzierte Proteinspiegel für uORF-haltige Gene, obwohl keine übereinstimmenden mRNA-Daten verfügbar waren (Abb. S3). Insgesamt zeigten diese Analysen über 3.297 Mausgene die erste groß angelegte Korrelation der uORF-Präsenz mit reduzierten Proteinspiegeln.

Abb. 2.

Proteinexpression von uORF-haltigen Genen. (A–D) Kumulative Verteilung der Proteinexpression für Mausgene mit UORF (rote Kurve) oder ohne UORF (graue Kurve) in jeder von 4 unabhängigen MS / MS-Studien (12-15). N gibt die Anzahl der eindeutigen Gene in jedem Satz an. (E) Mediane Reduktion der Protein- und mRNA-Expression für Gene, die UORF enthalten, im Vergleich zu Genen ohne UORF, wobei die P-Werte (in Klammern) durch empirische Permutationstests berechnet wurden.

Um festzustellen, ob UORF eine kausale Rolle bei der Verringerung der Proteinspiegel spielen, und um ihre Effektgröße genauer zu quantifizieren, führten wir eine Reihe von Experimenten an 15 uORF-haltigen Genen unter Verwendung von Dual-Luciferase-Reporterkonstrukten durch (siehe Materialien und Methoden). Fünf Gene wurden zufällig aus dem Satz aller Mäusetranskripte ausgewählt, die einzelne UORF enthielten und bei denen die 5’UTR-Länge aus technischen Gründen 100 nt überschritt (Abb. 3 B und F). Weitere 10 wurden aus unserer Mitochondrienstudie (14) ausgewählt, in der MS / MS- und Konservierungsdaten die Funktionalität nahelegten (Abb. 3C und G). Wir klonierten die 5′ UTR jedes ausgewählten Gens stromaufwärts eines Luciferase-Reporters (Abb. 3A). HEK 293A-Zellen wurden dann mit uORF-haltigen Luciferase-Konstrukten oder Kontrollkonstrukten transfiziert, wobei das Startcodon (ATG) des uORF zu TTG mutiert war. Nach 48 h wurden die Zellen mittels quantitativer PCR auf Luziferase-Transkriptspiegel und luminometrisch auf Luziferase-Aktivität untersucht. Diese Experimente zeigten, dass UORF im Durchschnitt eine Abnahme der Proteinspiegel um 58% verursachen (Abb. 3B und C) und eine 5%ige Abnahme der Transkriptspiegel (Abb. 3 F und G). Alle individuellen Proteinunterschiede und 4 mRNA-Unterschiede waren statistisch signifikant (Abb. 3), und alle Protein / mRNA-Verhältnisunterschiede waren mit Ausnahme des Gens Hsdl2 statistisch signifikant (Tabelle S2). Die Konstrukte mit zufällig ausgewählten UORF zeigten höhere Proteinspiegel im Vergleich zu den mit Nachweis der Funktionalität ausgewählten UORF (P = 1e−5 basierend auf t-Test). Ähnliche Ergebnisse wurden mit HEK 293T-Zellen erhalten. Zusammen zeigen die groß angelegten Korrelationen und Validierungsexperimente, dass UORF eine abgestumpfte Proteinexpression nachgeschalteter kodierender Sequenzen verursachen.

Abb. 3.

Luciferase-Assays von uORF-Effekten auf Protein- und mRNA-Spiegel. (A) Experimentelles Design von Reporterkonstrukten mit und ohne uORFs ist zum Beispiel Mrpl11 gezeigt. (B–I) Normalisierte Luciferaseaktivität (B–E) und mRNA–Expression (F-I) werden für Reporterkonstrukte gezeigt, die aufgrund einer Mutation, die das uORF-Startcodon stört, ein uORF (rot) enthalten oder kein uORF (grau) haben. Die Konstrukte enthalten 5’UTRs von: 5 zufällig ausgewählte Mausgene (B und F), 10 Mausgene mit proteomischen und konservatorischen Signaturen funktioneller uORFs (C und G), 5 menschliche Gene mit polymorphen uORFs (D und H) und 5 menschliche Krankheitsgene mit uORF-verändernden Mutationen, die bei Patienten nachgewiesen wurden (E und I). Fehlerbalken repräsentieren ±SE von ≥6 biologischen Replikaten (B–E) und ≥4 technischen Replikaten (F–I). Sternchen weisen auf einen signifikanten Unterschied hin (P < 0,01).

Einfluss von uORF Kontext, Position und Erhaltung.

Als nächstes untersuchten wir, ob spezifische uORF-Eigenschaften mit einer stärkeren Translationshemmung assoziiert waren. Wir analysierten uORF-Länge, Anzahl, Konservierung, Position relativ zur Kappe, Position relativ zu den CDS und uAUG-Kontext (auch „Kozak-Sequenz“ genannt) (siehe Materialien und Methoden). Wir quantifizierten uORF-Effekte mit der Kolmogorov-Smirnov (KS) D-Statistik innerhalb des größten Datensatzes (Leber), der statistische Aussagekraft für diese Analysen bot. Alle getesteten Untergruppen von UORF zeigten reduzierte Proteinspiegel im Vergleich zu uORF-less-Genen (P < 0.05), obwohl bestimmte Eigenschaften die Effektgröße modifizierten (Abb. S5). Wie von Kozaks klassischen Experimenten (1, 20, 24-26) vorhergesagt, korrelierte eine erhöhte Hemmung mit einem starken versus einem schwachen uAUG-Kontext (P = 0,04), einem langen versus einem kurzen Cap-zu–uORF−Abstand (P = 0,009 bis 4e−4), dem Vorhandensein mehrerer UORF in der 5’UTR (P = 8e-6) und einer erhöhten Konservierung (P = 1e-6) (Abb. S5). Überraschenderweise beobachteten wir keinen signifikanten Unterschied zwischen UORF vollständig stromaufwärts im Vergleich zur Überlappung der CDS (P = 0.9), zwischen UORF unterschiedlicher Nähe zu den CDS (P = 0.6 zu 0.5) oder zwischen uORFs unterschiedlicher Länge (P = 0,3). Diese Vergleiche über Hunderte von Lebergenen zeigen, dass, obwohl alle Arten von UORF die Proteinexpression reduzieren können, 4 uORF-Eigenschaften mit einer größeren Hemmung verbunden sind: starker uAUG-Kontext, evolutionäre Konservierung, erhöhter Abstand von der Kappe und mehrere UORF in der 5’UTR.

Polymorphe UORF beim Menschen.

Da UORF die Proteinexpression reduzieren, könnten Polymorphismen, die UORF erzeugen oder löschen, menschliche Phänotypen beeinflussen. Daher suchten wir nach uORF-verändernden Varianten innerhalb der 12 Millionen SNPs in der menschlichen dbSNP-Datenbank (18). Wir verwenden den Begriff polymorphes uORF (puORF), um ein uORF anzuzeigen, das durch einen Polymorphismus erstellt oder gelöscht wird. Wir identifizierten PUORF in 509 einzigartigen Genen (Tabelle S3), von denen 366 Gene mehrere UORF und 143 Gene einzelne UORF aufwiesen (Tabelle 1). Mit den oben beschriebenen zellulären Reporterkonstrukten haben wir die Funktionalität von 5 PUORF getestet. In allen Fällen produzierten die Konstrukte mit UORF 30-60% weniger Protein als diejenigen mit der SNP-Variante ohne uORF, wobei die mRNA-Spiegel durchschnittlich um 3% abnahmen (Abb. 3 D und H). Alle Einzelprotein- und Protein/mRNA-Reduktionen waren statistisch signifikant (Tabelle S2). Die Wirkung der puORFs war vergleichbar mit allen anderen experimentell getesteten uORFs (Abb. 3). Daher verändern natürlich vorkommende uORF-verändernde Polymorphismen wahrscheinlich die zelluläre Expression des Downstream-Proteins.

Diese Tabelle ansehen:

  • Inline anzeigen
  • Popup anzeigen
Tabelle 1.

Bemerkenswerte menschliche Varianten, die polymorphe UORF erzeugen

puORF-vermittelte Unterschiede in den Faktor-XII-Proteinspiegeln.

Eines der humanen uORF-verändernden SNPs (rs1801020) wurde zuvor in 5 unabhängigen Studien (27-31) mit Unterschieden in den zirkulierenden Plasmaspiegeln des Gerinnungsfaktors XII (FXII) in Verbindung gebracht (Abb. 4). Dieses SNP repräsentiert einen gemeinsamen T / C-Polymorphismus mit einer Prävalenz des T-Allels, die auf 20% in kaukasischen und 70% in asiatischen Populationen geschätzt wird (27-31). Kanaji und Kollegen zeigten, dass das T-Allel den Proteinspiegel senkt, und schlugen vor, dass der Mechanismus auf eine Störung der Kozak-Konsensussequenz oder auf die Einführung eines uORF zurückzuführen sein könnte, obwohl diese Hypothesen nicht getestet wurden (30). Um die uORF-Hypothese experimentell zu testen, erstellten wir 8 Reporterkonstrukte, die alle 4 möglichen Nukleotidvarianten an der SNP-Stelle, 3 künstliche uORF-erzeugende Mutationen und 1 Mutation enthielten, die eine alternative In-Frame-Startstelle erzeugten (Abb. 4A). Alle 4 uORF-haltigen UTR-Konstrukte zeigten > 50% ige Reduktion der Proteinspiegel (P < 2e-6), während die 4 Konstrukte ohne UORF keine starken Unterschiede in den Proteinspiegeln zeigten (Abb. 4B). mRNA-Spiegel wurden um <30% verändert (Tabelle S2). Diese Ergebnisse deuten stark darauf hin, dass das Vorhandensein eines puORF für die beobachtete Variation der humanen Faktor-XII-Proteinspiegel verantwortlich ist.

Abb. 4.

Polymorphes uORF verändert die FXII-Proteinexpression. (A) 5′ UTR-Sequenz von FXII mit 2 SNP-Varianten, wobei das T-Allel ein uORF erzeugt (roter Text). Im Folgenden finden Sie 8 Konstrukte mit eingeführten Mutationen (unterstrichener Text), wobei farbiger Text einen UAV (rot) oder einen alternativen Start im Rahmen (grün) anzeigt. (B) Luciferaseaktivität aus Reporterkonstrukten, die in A aufgeführt sind. Fehlerbalken repräsentieren ±SD von ≥6 biologischen Replikaten. (C) Metaanalyse der Plasma-FXII-Aktivitätsniveaus, gemessen in 5 unabhängigen Studien, stratifiziert nach Genotyp von SNP rs1801020.

uORF-verändernde Mutationen im Zusammenhang mit menschlichen Krankheiten.

Zusätzlich zu den üblichen puORFs können seltene Mutationen, die uORFs verändern, Krankheiten verursachen, wie für 3 Gene gezeigt wurde (Tabelle 2). Um weitere Fälle systematisch zu identifizieren, durchsuchten wir die humane Genmutationsdatenbank (19) nach Mutationen, die UORF einführen oder eliminieren. Wir fanden 11 zusätzliche Mutationen (Tabelle 2), die durch Resequenzierung in bekannten krankheitsbezogenen Genen bei betroffenen Patienten nachgewiesen wurden (32-42). Diese uORF-verändernden Mutationen waren in Populationskontrollen (32-42) nicht vorhanden und waren entweder die einzige Mutation, die in den sequenzierten Exons nachgewiesen wurde, oder waren entweder heterozygot mit einer Missense / Nonsense-Mutation (Tabelle 2). Die Patientenpräsentation stimmte in 3 der 4 heterozygoten Fälle mit einem rezessiven Phänotyp überein (37, 38, 42, 43), und war im übrigen mehrdeutig (36). Unseres Wissens war die mechanistische Verbindung zwischen der Genmutation und uORFs bisher nicht für SRY (32), IRF6 (33) oder GCH1 (34) vorgeschlagen worden.

Diese Tabelle ansehen:

  • Inline anzeigen
  • Popup anzeigen
Tabelle 2.

uORF-verändernde Mutationen im Zusammenhang mit Krankheiten

Um zu beurteilen, ob die uORF-verändernden Mutationen die Proteinexpression beeinflussten, verwendeten wir Luciferase-Reporterkonstrukte, um Patientenmutationen in 5 Genen (HBB, PRKAR1A, IRF6, SRY und SPINK1) zu testen. Die uORF-verändernden Mutationen in diesen Genen reduzierten die Luziferase-mRNA-Spiegel um < 20% und die Luziferase-Aktivität um 70-100% (Abb. 3E und I). Diese Effekte auf die Proteinspiegel waren hoch signifikant (P < 2e−12) und größer als in den anderen experimentell getesteten UORF (P = 4e−4). Daher verursachen diese uORF-verändernden Mutationen dramatisch reduzierte Proteinspiegel in unseren Reporterassays, was darauf hindeutet, dass sie tatsächlich für die beobachteten Krankheitsphänotypen verantwortlich sein können.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.