結果

哺乳類の転写産物内のuORF有病率。<2 1 1 7><2 5 6 8>UORFは、5’UTR内の開始コドン、主符号化配列(CDS)の末端に先行するインフレームの停止コドン、および停止コドンを含む少なくとも9ntの長さによ 図に示すように。 図1Aを参照すると、この定義は、両方のタイプが機能的であると予測されるので、完全に上流のUORFとCDSと重複するUORFとの両方を含む(2 0)。 我々は、注釈付き5’Utr>10ntとすべてのヒトおよびマウスRefSeq転写産物内のuORFsを検索しました。 以前の推定値(9、1 0)と一致して、本発明者らは、ヒトの4 9%およびマウス転写物の4 4%が少なくとも1つのUORFを含有することを見出した(図9、1 0)。 1B)。 興味深いことに、ヒトおよびマウスのUORF開始コドン(UAUG)は、脊椎動物種全体で最も保存された5’UTRトリヌクレオチドである(図1 0A)。 S1)、広範な機能的役割と一致しています。

細胞タンパク質レベルへのuORFの影響。

リボソームスキャンモデルによって予測されるように、uorfがタンパク質発現の広範な減少を引き起こす場合、uORFを含む転写産物は、uORFを含まない転写産物と比較して、より低いタンパク質レベルと相関することが期待される。 この仮説をテストするために、我々は11,649マッチしたmRNAとタンパク質の豊富さの測定の合計を分析した4マウス組織と発達段階の様々な公開された研究 これらは含まれています: 肝臓で発現する2,484個の遺伝子(12)、肺発生の6段階で発現する722個の遺伝子(13)、14組織で発現する487個のミトコンドリア局在遺伝子産物(14)、および6組織で発現する925個の遺伝子(15)(詳細はSIテキストを参照)。 タンパク質は、タンデム質量分析(MS/MS)を介して検出され、存在量は、正規化された数(12、13、15)または一致するMSスペクトルの総ピーク面積(14)を使用して標準的 これらの条件におけるmRNA存在量をマイクロアレイによって測定した(2 1、2 2)。 どちらの技術も絶対的な定量化を提供しませんが、これらの大規模なデータセットは、何千もの遺伝子にわたる傾向を明らかにすることができます。 MS/MS技術は確実にスプライス変異体を区別することはできませんので、我々は遺伝子レベルで発現を分析し、その集団スプライス変異体のいずれか 以前の報告(2 3)と一致して、本発明者らは、マイクロアレイ組織アトラス(2 1)に基づく1 0%の最も高度に発現された転写物がUORFを欠く傾向があることを観察 S2およびSIテキスト)、したがって、我々は保守的にuORF効果を過大評価することを避けるために、これらの遺伝子を除外しました。

実験方法の違いにもかかわらず、4つの独立したデータセットはすべて、uORFsを含む遺伝子と欠けている遺伝子のタンパク質レベルの分布が減少してい 2A-D)。 タンパク質レベルの中央値は、それぞれ、39%(P=1e−5)、29%(P=0.007)、34%(P=0.008)、および13%(P=0.36)減少し、ここで、有意性は経験的順列試験によって決定された。 mRNAレベルは、肝臓データセット(12)のみが統計的に有意な中央値の減少を示したことにより、より少ない程度まで減少した(図12)。 図2eおよび図2Bを参照。 S3)。 重要なことに、4つのデータセットのうち3つのuORF含有遺伝子について、mRNAに対するタンパク質の比率が有意に減少した(図10B)。 図2eおよび図2Bを参照。 S3)、uORFの存在はおそらく主コード配列の翻訳を阻害することを示唆している。 長さおよび重複基準を変更することによってUORFの定義を変更したとき、および1 0%の最も高度に発現された遺伝子を含めたとき(図1 0A)、UORFの定義を S4)。 マウス脂肪細胞(1 6)および分化胚性幹細胞(1 7)の2つの追加のMS/MS研究の分析はまた、UORF含有遺伝子のタンパク質レベルの低下を示したが、一致したmRNAデー S3)。 総称して、3,297マウス遺伝子全体でこれらの分析は、減少したタンパク質レベルとuORFの存在の最初の大規模な相関を示した。

2.

uORF含有遺伝子のタンパク質発現。 (A〜D)4つの独立したMS/MS試験の各々におけるUORFを含むマウス遺伝子(赤色の曲線)またはUORFを欠くマウス遺伝子(灰色の曲線)のタンパク質発現の累積分布(1 2〜1 5)。 Nは、各セット内のユニークな遺伝子の数を示します。 (E)uorfを含有する遺伝子のタンパク質およびmRNA発現の中央値の減少は、uorfを欠く遺伝子と比較し、p値(括弧内)は、経験的置換試験によって計算される。

uORFsは、タンパク質レベルを低下させることに因果的な役割を果たしているかどうかを決定し、より正確にその効果の大きさを定量化するために、我々は 単一のUORFを含有する全てのマウス転写物のセットから5つの遺伝子を無作為に選択し、ここで、技術的に容易にするために、5’UTR長が1 0 0ntを超えた(図5)。 3BおよびF)。 MS/MSおよび保存データが機能性を示唆した我々のミトコンドリア研究(1 4)から、追加の1 0を選択した(図1 4)。 3CおよびG)。 本発明者らは、ルシフェラーゼレポーターの上流の各選択された遺伝子の5’UTRをクローニングした(図1 0A)。 3A)。 次いで、HEK2 9 3A細胞を、UORF含有ルシフェラーゼ構築物またはuorfの開始コドン(ATG)をTTGに変異させた対照構築物でトランスフェクトした。 48時間後、細胞は、定量的PCRによってルシフェラーゼ転写レベルとルミノメトリーによってルシフェラーゼ活性のためにアッセイしました。 これらの実験は、平均して、UORFは、タンパク質レベルの5 8%の低下を引き起こすことを示した(図1 0A)。 転写物レベルの5%の低下(図3bおよびC)および転写物レベルの5%の低下(図3BおよびC)を含む。 3FおよびG)。 すべての個々のタンパク質差および4つのmRNA差は統計学的に有意であった(図1 0A)。 遺伝子H Sdl2を除いて、すべてのタンパク質/mRNA比の差は統計的に有意であった(表S2)。 ランダムに選択されたuORFsを有する構築物は、機能性の証拠で選択されたuORFsと比較して高いタンパク質レベルを示した(p=1e−5tテストに基づいて)。 同様の結果が、HEK2 9 3t細胞を用いて得られた。 一緒に、大規模な相関と検証実験は、uorfsは、下流のコード配列の鈍化したタンパク質発現を引き起こすことを示しています。

3.

タンパク質およびmRNAレベルに対するuORF効果のルシフェラーゼアッセイ。 (A)UORFの有無にかかわらずレポーター構築物の実験的設計を、例えばMrpl1 1に示す。 (B−i)正規化されたルシフェラーゼ活性(B−E)およびmRNA発現(F−i)は、UORF開始コドンを破壊する突然変異のためにUORF(赤)を含むか、またはUORF(灰色)を欠くレポーター構築物に 構造はからの5’UTRsを含んでいます: ランダムに選択された5つのマウス遺伝子(BおよびF)、機能的uORFsのプロテオミクスおよび保存シグネチャを持つ10個のマウス遺伝子(CおよびG)、多型uORFsを持つ5つのヒト遺伝子(DおよびH)、および患者で検出されたuORF改変変異を持つ5つのヒト疾患遺伝子(EおよびI)。 誤差バーは、≧6の生物学的複製物(B−E)および≧4の技術的複製物(F−i)の±SEを表す。 アスタリスクは有意差を示す(P<0.01)。

uORFの文脈、位置、および保全の影響。

我々は次に、特定のuORF特性がより強い翻訳阻害と関連していたかどうかを調べた。 我々は、UORFの長さ、数、保存、キャップに対する位置、CDSに対する位置、およびUAUG文脈(「Kozak配列」とも呼ばれる)を分析した(材料および方法を参照)。 最大のデータセット(肝臓)内のKolmogorov–Smirnov(KS)D統計量を使用してuORF効果を定量化し、これらの分析の統計的検出力を提供しました。 Uorfのすべてのテストされたサブセットは、uORFレス遺伝子と比較して減少したタンパク質レベルを示した(P<0。05)、ある特性が効果のサイズを変更したが(図。 S5)。 Kozakの古典的な実験(1、20、24〜26)によって予測されるように、阻害の増加は、強い対弱いuAUG文脈(P=0.04)、長い対短いcap-to-uORF距離(p=0.009〜4e–4)、5’UTR中の複数のUORFの存在(P=8e−6)、および保存の増加(p=1e−6)と相関していた(図4)。 S5)。 驚くべきことに、我々は完全に上流のuORFsとCDSに異なる近接のuORFsの間でcds(P=0.9)を重複する対の間に有意な差は観察されなかった(P=0.6から0。5)または異なる長さのuORFs間(P=0.3)。 肝臓遺伝子の何百ものこれらの比較は、uORFsのすべてのタイプは、タンパク質発現を減少させることができるが、4uORFプロパティは、より大きな阻害に関連していることを示しています:強いuAUGコンテキスト、進化的保存、キャップからの距離の増加、および5’UTRの複数のuORFs。

ヒトにおける多型uORFs。

uORFsがタンパク質発現を減少させることを考えると、uORFsを作成または削除する多型は、人間の表現型に影響を与える可能性があります。 したがって、我々は、ヒトdbSNPデータベース(12万Snp内のuORF改変変異体を検索した18)。 多態性によって作成または削除されたuORFを示すために、多態性uORF(puORF)という用語をコインします。 本発明者らは、5 0 9個のユニークな遺伝子(表S3)においてpUORFを同定し、そのうちの3 6 6個の遺伝子は複数のUORFを有し、1 4 3個の遺伝子は単一のUORFを有していた(表1)。 上記の細胞レポーター構築物を使用して、我々は5puORFsの機能性をテストしました。 全ての場合において、UORFを有する構築物は、UORFを含まないSNP変異体を有するものよりも3 0〜6 0%少ないタンパク質を産生し、mRNAレベルの平均3%減少を伴った(図 3DおよびH)。 全ての個々のタンパク質およびタンパク質/mRNAの減少は統計的に有意であった(表S2)。 PUORFの影響は、実験的に試験された他の全てのUORFと同等であった(図1 0A)。 3). 従って、天然に存在するUORF改変多型は、下流タンパク質の細胞発現を変化させる可能性がある。

この表を見る:

  • インライン表示
  • ポップアップ表示
表1.

多型uORFsを作成する注目すべき人間の変異体

第XII因子タンパク質レベルにおけるpuORF媒介の違い。

ヒトuORF改変Snpの1つ(rs1801020)は、5つの独立した研究(27-31)における凝固第XII因子(FXII)の循環血漿レベルの違いと以前に関連していた(図27-31)。 4). このSNPは、白人では2 0%、アジア集団では7 0%と推定されるT対立遺伝子の有病率を有する共通のT/C多型を表す(2 7〜3 1)。 Kanajiたちは、T対立遺伝子がタンパク質レベルを低下させることを実証し、これらの仮説は試験されていないが、Kozakコンセンサス配列の破壊またはuORFの導入に起因する可能性があると提案した(30)。 実験的にuORF仮説をテストするために、我々は、SNPサイトですべての4つの可能なヌクレオチド変異体、3つの人工uORF生成変異、および代替のインフレーム開始 4A)。 全ての4つのUORF含有UTR構築物は、タンパク質レベルの<9 9 5 6>5 0%の減少を示した(P<6 1 9 1>2e−6)が、一方、UORFを欠く4つの構築物は、タンパク質レベルに強い 4B)。 mRNAレベルは、<6 1 9 1>3 0%変化させた(表S2)。 これらの結果は,puorfの存在がヒト第xii因子蛋白質レベルの観察された変化に関与していることを強く示唆している。

4.

多型uORFはFXIIタンパク質発現を変化させる。 (A)T対立遺伝子がUORF(赤色のテキスト)を生成する2つのSNP変異体で示されるFXIIの5’UTR配列。 以下は、導入された突然変異(下線付きのテキスト)を有する8つの構築物であり、色付きのテキストはuORF(赤)またはフレーム内の代替開始(緑)を示す。 (B)A.エラーバーに記載されているレポーター構築物からのルシフェラーゼ活性は、≥6生物学的複製物の±SDを表す。 (C)SNP rs1 8 0 1 0 2 0の遺伝子型によって階層化された5つの独立した研究によって測定された血漿FXII活性レベルのメタアナリシス。

ヒトの疾患に関連するuORF改変変異。

一般的なpuORFsに加えて、uORFsを変化させるまれな突然変異は、3つの遺伝子について示されているように、疾患を引き起こす可能性がある(表2)。 系統的に追加のケースを識別するために、我々はuORFsを導入または排除する変異のためのヒト遺伝子変異データベース(19)を検索しました。 我々は、影響を受けた患者(32-42)における既知の疾患関連遺伝子における再配列によって検出された11の追加の変異(表2)を発見した。 これらのuORF改変変異は、集団コントロール(32-42)に存在しなかった、と配列されたエクソンで検出された唯一の変異のいずれかであった、またはミスセンス/ナンセンス変異(表2)と化合物ヘテロ接合であった。 患者のプレゼンテーションは、3の4化合物ヘテロ接合例における劣性表現型と一致していた(37, 38, 42, 43), そして、残りのケースではあいまいでした(36)。 我々の知る限りでは、遺伝子変異とuORFsの間のメカニズム的リンクは、以前にSRY(32)、IRF6(33)、またはGCH1(34)のために提案されていなかった。

この表を見る:

  • インライン表示
  • ポップアップ表示
表2.

疾患に関連するuORF改変変異

UORF改変突然変異がタンパク質発現に影響を及ぼすかどうかを評価するために、我々は、5つの遺伝子(HBB、PRKAR1A、IRF6、SRY、およびSPINK1)の患者突然変異を試験するた これらの遺伝子におけるUORF改変突然変異は、ルシフェラーゼm RNAレベルを<6 1 9 1>2 0%減少させ、ルシフェラーゼ活性レベルを7 0〜1 0 0%減少させた(図1B)。 3EおよびI)。 タンパク質レベルに対するこれらの効果は非常に有意であった(P<2e−12)と実験的にテストされた他のuORFs(P=4e−4)よりも大きかった。 したがって、これらのuORF改変変異は、彼らが実際に観察された疾患表現型の原因である可能性があることを示唆し、我々のレポーターアッセイで劇的に減少

コメントを残す

メールアドレスが公開されることはありません。