معلومة

كيف تتعرف على الجينات التي تقترن بها المعززات البعيدة؟

كيف تتعرف على الجينات التي تقترن بها المعززات البعيدة؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أكتب مقترح مشروع ويجب أن أتحدث عن هذه المشكلة: كيفية التعرف على الجينات التي تقترن بها المعززات البعيدة?

أنا جديد حقًا في هذا الموضوع ولا أعرف ما يدور حوله. لقد كنت أبحث في الأدب ولكني لم أجد أي شيء مفيد. هل يستطيع أحد أن يشرح لي ما هو كل شيء؟ ربما تقترح علي بعض الأوراق.


تحقق من هذه التقنية المسماة التقاط تشابه الكروموسوم (3C). توجد متغيراته مثل 4C و Hi-C وما إلى ذلك.

أساسًا ، يعتمد مبدأ هذه التقنية على التفاعل المادي بين المُحسِّن والمُحفِّز الذي يتم تجسيره بواسطة مُعدِّل نسخ (بروتين).

  1. الكروماتين متشابك
  2. يتم قطع الحمض النووي
  3. يتم سحب البروتين للأسفل (اختياري)
  4. يتم ربط شظايا المروج والمحسن معًا ثم يتم إجراء التسلسل / qRTPCR.

يمكن استخدام التسلسل (صبيب منخفض) لتحديد معززات محفز معين. يمكن استخدام qRTPCR لتحديد قوة الارتباط.

ما قلته للتو ليس تقنية عالية الإنتاجية. Hi-C هو متغير إنتاجية عالية 3C. انظر البروتوكول هنا.


  • يمكن أن توجد المعززات في الجزء العلوي من الجين ، أو داخل منطقة ترميز الجين ، أو في اتجاه مجرى الجين ، أو بعيدًا عن آلاف النيوكليوتيدات.
  • عندما يرتبط بروتين ثني الحمض النووي بالمُحسِّن ، يتغير شكل الحمض النووي ، مما يسمح بحدوث تفاعلات بين المنشطات وعوامل النسخ.
  • تستجيب المثبطات للمنبهات الخارجية لمنع ارتباط عوامل النسخ المنشطة.
  • يمكن للمضغوطات قمع بدء النسخ عن طريق تجنيد هيستون ديسيتيلاز.
  • يزيد إلغاء تنشيط الهيستون من الشحنة الموجبة على الهيستونات ، مما يقوي التفاعل بين الهيستونات والحمض النووي ، مما يجعل الوصول إلى الحمض النووي أقل سهولة في النسخ.
  • محسن: منطقة قصيرة من الحمض النووي يمكنها زيادة نسخ الجينات
  • كاظمة: أي بروتين يرتبط بالحمض النووي وبالتالي ينظم التعبير الجيني عن طريق تقليل معدل النسخ
  • المنشط: أي مادة كيميائية أو عامل ينظم جينًا أو أكثر من خلال زيادة معدل النسخ

82 لائحة جينات النسخ حقيقية النواة

بنهاية هذا القسم ، ستكون قادرًا على القيام بما يلي:

  • ناقش دور عوامل النسخ في تنظيم الجينات
  • اشرح كيف تقوم المعززات والمثبطات بتنظيم التعبير الجيني

مثل الخلايا بدائية النواة ، يتطلب نسخ الجينات في حقيقيات النوى عمل بوليميريز الحمض النووي الريبي لربط تسلسل الحمض النووي المنبع من الجين من أجل بدء النسخ. ومع ذلك ، على عكس الخلايا بدائية النواة ، فإن بوليميراز الحمض النووي الريبي حقيقي النواة يتطلب بروتينات أخرى ، أو عوامل نسخ ، لتسهيل بدء النسخ. لا يمكن لبوليميراز الحمض النووي الريبي في حد ذاته بدء النسخ في الخلايا حقيقية النواة. هناك نوعان من عوامل النسخ التي تنظم النسخ حقيقية النواة: عوامل النسخ العامة (أو القاعدية) ترتبط بمنطقة المروج الأساسية للمساعدة في ربط بوليميراز الحمض النووي الريبي. عوامل النسخ المحددة ترتبط بمناطق مختلفة خارج منطقة المروج الأساسية وتتفاعل مع البروتينات في المروج الأساسي لتعزيز أو قمع نشاط البوليميراز.

اعرض عملية النسخ - صنع الحمض النووي الريبي من قالب الحمض النووي.

المروج وآلة النسخ

يتم تنظيم الجينات لجعل التحكم في التعبير الجيني أسهل. منطقة المروج هي المنبع مباشرة لتسلسل الترميز. يمكن أن تكون هذه المنطقة قصيرة (فقط عدد قليل من النيوكليوتيدات في الطول) أو طويلة جدًا (مئات النيوكليوتيدات طويلة). كلما طالت مدة المحفز ، زادت المساحة المتاحة لربط البروتينات. يضيف هذا أيضًا مزيدًا من التحكم في عملية النسخ. طول المحفز خاص بالجينات ويمكن أن يختلف بشكل كبير بين الجينات. وبالتالي ، يمكن أن يختلف مستوى التحكم في التعبير الجيني أيضًا بشكل كبير بين الجينات. الغرض من المروج هو ربط عوامل النسخ التي تتحكم في بدء النسخ.

داخل منطقة المروج الأساسية ، يوجد 25 إلى 35 قاعدة في المنبع من موقع بدء النسخ ، في مربع TATA. يحتوي صندوق TATA على تسلسل إجماعي لـ 5’-TATAAA-3 '. صندوق TATA هو موقع الارتباط لمركب بروتين يسمى TFIID ، والذي يحتوي على بروتين رابط لـ TATA. يؤدي ربط TFIID إلى تجنيد عوامل النسخ الأخرى ، بما في ذلك TFIIB و TFIIE و TFIIF و TFIIH. تساعد بعض عوامل النسخ هذه على ربط بوليميريز الحمض النووي الريبي بالمحفز ، بينما يساعد البعض الآخر في تنشيط مجمع بدء النسخ.

بالإضافة إلى مربع TATA ، توجد مواقع ربط أخرى في بعض المروجين. يفضل بعض علماء الأحياء قصر نطاق محفز حقيقيات النوى على المروج الأساسي ، أو موقع ربط البوليميراز ، والإشارة إلى هذه المواقع الإضافية كعناصر مروج قريبة ، لأنها توجد عادةً ضمن بضع مئات من الأزواج الأساسية في الجزء العلوي من موقع بدء النسخ . أمثلة على هذه العناصر هي مربع CAAT ، مع تسلسل الإجماع 5’-CCAAT-3 "ومربع GC ، مع التسلسل الإجماعي 5’-GGGCGG-3". يمكن لعوامل النسخ المحددة أن ترتبط بهذه العناصر القريبة من المروج لتنظيم نسخ الجينات. قد يكون لجين معين توليفة خاصة به من مواقع ارتباط عامل النسخ المحددة هذه. هناك المئات من عوامل النسخ في الخلية ، كل منها يرتبط على وجه التحديد بعنصر معين لتسلسل الحمض النووي. عندما ترتبط عوامل النسخ بالمحفز فقط في بداية الجين المشفر ، يشار إليه على أنه عنصر مؤثر في رابطة الدول المستقلة ، لأنه موجود على نفس الكروموسوم بجوار الجين مباشرة. تستجيب عوامل النسخ للمنبهات البيئية التي تجعل البروتينات تجد مواقع الارتباط الخاصة بها وتبدأ نسخ الجين المطلوب.

المعززات والنسخ

في بعض الجينات حقيقية النواة ، توجد مناطق إضافية تساعد في زيادة أو تحسين النسخ. هذه المناطق ، التي تسمى المعززات ، ليست بالضرورة قريبة من الجينات التي تعززها. يمكن أن توجد في الجزء العلوي من الجين ، داخل منطقة ترميز الجين ، أو في اتجاه مجرى الجين ، أو قد تكون على بعد آلاف النيوكليوتيدات.

مناطق المحسن هي سلاسل ملزمة ، أو مواقع ، لعوامل نسخ محددة. عندما يرتبط عامل نسخ البروتين بتسلسل المُحسِّن ، يتغير شكل البروتين ، مما يسمح له بالتفاعل مع البروتينات في موقع المُحسِّن. ومع ذلك ، نظرًا لأن منطقة المحسن قد تكون بعيدة عن المحفز ، يجب أن ينحني الحمض النووي للسماح للبروتينات الموجودة في الموقعين بالتلامس. تساعد بروتينات الانحناء في الحمض النووي على ثني الحمض النووي وجلب مناطق المحسن والمحفز معًا ((الشكل)). يسمح هذا التغيير في الشكل بتفاعل بروتينات المنشط المحددة المرتبطة بالمعززات مع عوامل النسخ العامة المرتبطة بمنطقة المروج وبوليميراز الحمض النووي الريبي.


إيقاف تشغيل الجينات: مكابس النسخ

مثل الخلايا بدائية النواة ، تمتلك الخلايا حقيقية النواة أيضًا آليات لمنع النسخ. يمكن لمثبطات النسخ الارتباط بمناطق المحفز أو المحسن ومنع النسخ. مثل المنشطات النسخية ، تستجيب المثبطات للمحفزات الخارجية لمنع ارتباط عوامل النسخ المنشطة.

ملخص القسم

لبدء النسخ ، يجب أن ترتبط عوامل النسخ العامة ، مثل TFIID و TFIIB وغيرها ، أولاً بصندوق TATA وتوظف بوليميريز RNA في هذا الموقع. قد ترتبط عوامل النسخ الإضافية أيضًا بالعناصر التنظيمية الأخرى في المروج لزيادة أو منع النسخ. بالإضافة إلى تسلسل المحفز ، تساعد مناطق المحسن في زيادة النسخ. يمكن أن تكون المعززات في المنبع ، أو في اتجاه مجرى النهر ، أو داخل الجين نفسه ، أو على كروموسومات أخرى. قد تؤدي عوامل النسخ المحددة المرتبطة بمناطق المحسن إلى زيادة أو منع النسخ.

راجع الأسئلة

يلزم ربط ________ لبدء النسخ.

ماذا سينتج عن ارتباط عامل النسخ بمنطقة مُحسِّن؟

  1. نقص نسخ الجين المجاور
  2. زيادة نسخ الجين البعيد
  3. تغيير ترجمة الجين المجاور
  4. الشروع في توظيف بوليميراز الحمض النووي الريبي

عالم يقارن مناطق المحفز لجينين. يشتمل المروج الأساسي لـ Gene A بالإضافة إلى عناصر المروج القريبة 70 نقطة أساس. يشتمل المروج الأساسي للجين B بالإضافة إلى عناصر المروج القريبة على 250 نقطة أساس. أي من فرضيات العالم من المرجح أن تكون صحيحة؟

  1. سيتم إجراء المزيد من النصوص من جين ب.
  2. يتضمن نسخ الجين أ عددًا أقل من عوامل النسخ.
  3. تتحكم المعززات في نسخ الجين ب.
  4. يتم التحكم في نسخ الجين أ أكثر من نسخ الجين ب.

أسئلة التفكير النقدي

يمكن للطفرة داخل منطقة المروج أن تغير نسخ الجين. صف كيف يمكن أن يحدث هذا.

يمكن لطفرة في منطقة المروج تغيير موقع الربط لعامل النسخ الذي يرتبط عادة بزيادة النسخ. يمكن للطفرة إما أن تقلل من قدرة عامل النسخ على الارتباط ، وبالتالي تقليل النسخ ، أو يمكن أن تزيد من قدرة عامل النسخ على الارتباط ، وبالتالي زيادة النسخ.

ماذا يمكن أن يحدث إذا كانت الخلية تحتوي على الكثير من عامل النسخ المنشط؟

إذا كان هناك الكثير من عامل النسخ المنشط ، فسيتم زيادة النسخ في الخلية. هذا يمكن أن يؤدي إلى تغييرات جذرية في وظيفة الخلية.

يحدد أحد العلماء موقعًا محتملاً لتنظيم النسخ 300 نقطة أساس في اتجاه مجرى الجين ويفترض أنه مثبط. ما التجربة (مع النتائج) التي يمكنه إجراؤها لدعم هذه الفرضية؟

أسهل طريقة لاختبار فرضيته هي تغيير الموقع في الخلية ، ومراقبة مستويات نسخة mRNA المصنوعة من الجين. إذا زادت مستويات النسخ في الخلية المتحورة ، فهذا يعني أن الموقع يمنع النسخ.

قائمة المصطلحات


تحديد المعززات المنقولة عن طريق تسلسل الترسيب المناعي للكروماتين على نطاق الجينوم

أظهر العمل الأخير أن النسخ بوساطة RNA polymerase II في العناصر التنظيمية البعيدة لـ cis بمثابة علامة على معززات نشطة للغاية. يرتبط إنتاج الحمض النووي الريبي غير المشفر في المعززات ، المسماة eRNAs ، بالتعبير العالي عن الجينات التي يتفاعل معها المحسن ، وبالتالي توفر eRNAs أداة جديدة لنمذجة نشاط الجينات في الأنسجة السليمة والمرضية. علاوة على ذلك ، فإن هذه الفئة الفريدة من الحمض النووي الريبي غير المشفر لها أدوار متنوعة في تنظيم النسخ. يمكن التعرف على المعززات المنسوخة من خلال توقيع مشترك للعلامات اللاجينية من خلال تراكب سلسلة من مجموعات بيانات الترسيب المناعي للكروماتين على مستوى الجينوم ومجموعات بيانات تسلسل الحمض النووي الريبي. يعد النهج الحسابي لتصفية العناصر غير المحسِّنة والفئات الأخرى من الحمض النووي الريبي غير المشفر أمرًا ضروريًا لعدم سحابة التحليل المصب. نقدم هنا بروتوكولًا يجمع بين أساليب المقعد الرطب والجاف لتحديد المعززات المكتوبة بدقة على مستوى الجينوم بالإضافة إلى إجراء تجريبي للتحقق من صحة مجموعات البيانات هذه.

الكلمات الدالة: تسلسل الترسيب المناعي للكروماتين يعمل ENCODE Global على تسلسل محسن الحمض النووي الريبي غير المشفر eRNA.

الأرقام

مخطط انسيابي لبروتوكول المقعد الرطب ...

مخطط انسيابي لبروتوكول المقعد الرطب لإنشاء مكتبة ChIP-Seq. * يشير إلى ...

ما يقرب من 20 مليون فأر جنيني ...

تم إصلاح ما يقرب من 20 مليون خلية جذعية جنينية لفأر لمدة 5 دقائق باستخدام ...

تظهر ChIP-QPCR إثراء ...

تُظهر ChIP-qPCR إثراء علامة التنشيط هيستون H3K27Ac عند تعدد القدرات المرتبطة ...

تمثيل تخطيطي لسير العمل ...

تمثيل تخطيطي لسير العمل للكشف عن المحسن. يتم استدعاء القمم بواسطة MACS ...


معلومات الكاتب

الانتماءات

لين أ. بيناتشيو يعمل في قسم علم الجينوم ، طريق وان سيكلوترون ، MS 84–171 ، مختبر لورانس بيركلي الوطني ، بيركلي ، كاليفورنيا 94720 ، الولايات المتحدة الأمريكية.

تعمل ويندي بيكمور في وحدة الجينات البشرية في مركز البحوث الطبية ، IGMM ، جامعة إدنبرة ، طريق كرو ، إدنبرة EH4 2XU ، المملكة المتحدة.

تعمل آن دين في مختبر البيولوجيا الخلوية والتنموية ، المعهد الوطني للسكري وأمراض الجهاز الهضمي والكلى ، المعاهد الوطنية للصحة ، 50 ساوث درايف ، MSC 8028 ، بيثيسدا ، ماريلاند 20892 ، الولايات المتحدة الأمريكية.

مارسيلو أ. نوبريجا يعمل في قسم علم الوراثة البشرية ، جامعة شيكاغو ، شيكاغو ، إلينوي 60637 ، الولايات المتحدة الأمريكية.

يعمل جيل بيجيرانو في علم الأحياء التطوري وعلوم الكمبيوتر ، جامعة ستانفورد ، مركز بيكمان B-300 ، 279 Campus Drive West (MC 5329) ، ستانفورد ، كاليفورنيا 94305-5329 ، الولايات المتحدة الأمريكية.


نتائج

تحديد معززات النسخ المحيطة بـ Sox2

لقد توقعنا سابقًا 10 معززات (pEnh) المحيطة Sox2، اثنان منها يتداخلان مع SRR1 و SRR2 (الشكل 1A Chen et al. 2012a). استخدمنا هنا نظام مراسل لوسيفيراز لتحديد أي من المعززات الثمانية الإضافية المتوقعة التي قد تنظم نسخ Sox2 في الخلايا الجذعية الجنينية. تم تضخيم المعززات المتوقعة واستنساخها في اتجاه مجرى النهر من جين لوسيفيراز اليراع ، وتم تقييم نشاطها المعزز في خلايا ES و MEFs (الخلايا الليفية الجنينية للفأر). قارنا جميع المناطق التي تعرض نشاطًا مُحسِّنًا مع SRR1 و SRR2 ، والتي تكون قادرة على دفع التعبير الجيني في الخلايا الجذعية الجنينية وكذلك الخلايا العصبية السلفية متعددة القدرات في المنطقة البطينية للدماغ الجنيني (Zappone et al. 2000 Tomioka et al. 2002 Miyagi et al. آل. 2004). حددنا ثلاثة معززات وظيفية جديدة أطلقنا عليها اسم SRR18 و SRR107 و SRR111 بناءً على مواقعها (SRR18 و SRR107 و SRR111 هي على التوالي 18 و 107 و 111 كيلو بايت في اتجاه المصب من Sox2 TSS). كانت كل منطقة من هذه المناطق قادرة على تعزيز نسخ المراسل عند إدخالها إما في الاتجاه الأمامي أو العكسي في الخلايا الجذعية الجنينية ولكن ليس في MEFs (الشكل 1 ب). ومن المثير للاهتمام ، أن هذه المعززات البعيدة كانت أكثر قوة من معززات SRR1 و SRR2 المحددة سابقًا. لتحديد ما إذا كان SRR107 و SRR111 يعملان بشكل تآزري في مجموعة المحسن البعيدة ، قمنا باستنساخ المنطقة بأكملها من 105 إلى 112 كيلو بايت في اتجاه المصب من Sox2 في ناقل المراسل وأجرى فحوصات لوسيفيراز لاحقًا. أظهرت هذه المنطقة نشاطًا متزايدًا بشكل ملحوظ كان مضافًا مقارنةً بـ SRR107 أو SRR111 فقط ، ولذلك أطلقنا على هذه المنطقة اسم SCR (الشكل 1C). قمنا بفحص الخلايا ES المتاحة ChIP-seq (الترسيب المناعي للكروماتين [ChIP] جنبًا إلى جنب مع التسلسل العميق) التي تم تجميعها في CODEX ، وهي قاعدة بيانات لتجربة التسلسل من الجيل التالي ، وقررنا أن معززات SCR مرتبطة بعوامل نسخ متعددة ، بما في ذلك OCT4 ، SOX2 ، NANOG و SMAD1 و ESRRB و KLF4 و NR5A2 و TCFCP2L1 و STAT3 و E2F1 ، في حين أن المزيد من معززات الجينات القريبة (SRR1 و SRR2 و SRR18) غير ملزمة بـ KLF4 أو NR5A2 أو STAT3 أو E2F1 (الجدول 1D) S1 Sanchez-Castillo et al. 2014). وجدنا أيضًا أن المنشط NCOA3 ، والبروتين المرتبط بالكويسين STAG2 ، وعامل استطالة النسخ SUPT5 كانا مرتبطين في معززات SCR ولكن ليس معززات الجينات القريبة (الجدول التكميلي S1). استنادًا إلى اختبار المراسل ، قمنا بتضييق نطاق تحقيقنا إلى خمس مناطق ذات نشاط مُحسِّن مستقل ، اثنتان منها تقعان في SCR البعيدة ومرتبطة بالعديد من منشطات النسخ المعبر عنها بخلايا ES.

معززات البعيدة المصب من Sox2 نشطة في الخلايا الجذعية الجنينية. (أ) المنطقة المحيطة بعامل النسخ 130 كيلو بايت Sox2. تظهر قمم ChIP-seq لـ p300 في خلايا ES-Bruce4 من ENCODE / LICR باللون الأزرق. تظهر أمبليكون المحسن المتوقع (pEnh) باللون الأحمر. (ب) نشاط Luciferase مدفوعًا بالمعززات المتوقعة المحيطة Sox2. تم تقييم اتجاهات المحسن إلى الأمام والعكس في كل من الخلايا ES و MEFs ، يتوافق ناقل pGL4.23 الفارغ (E) وأرقام المنطقة الصحراوية (D) مع تدوينات المحسن في أ. تم تطبيع نسب نشاط اليراع / الرينيلا لوسيفيراز إلى E. القيم هي ما لا يقل عن ثلاث تجارب بيولوجية مكررة ، مع إجراء كل تجربة في ثلاث نسخ. تمثل أشرطة الخطأ SEM. تتم الإشارة إلى نشاط أعلى بشكل ملحوظ فوق المتجه الفارغ بعلامات نجمية مزدوجة (ص & lt 0.01) أو ثلاث علامات نجمية (ص & lt 0.001). يشار إلى الاختلافات الكبيرة بين الخلايا الجذعية الجنينية و MEFs لكل مُحسِّن بواسطة مثلث واحد (ص & lt 0.05) ، مثلثات مزدوجة (ص & lt 0.01) ، أو مثلثات ثلاثية (ص & lt 0.001). (ج) تم تقييم توجهات المحسن الأمامي في الخلايا الجذعية الجنينية من أجل SCR (105-112) و SRR107 و SRR111 والمنطقة الصحراوية. تم تطبيع نسب نشاط اليراع / رينيلا لوسيفيراز إلى ناقل pGL4.23 الفارغ. يتم تمثيل القيم كنسبة مئوية من قيمة SCR ومتوسط ​​ثلاث تجارب مستقلة على الأقل ، مع إجراء كل تجربة في ثلاث نسخ. تمثل أشرطة الخطأ SEM. يدفع SCR نشاطًا أعلى بكثير من SRR111 و SRR107 (ص & lt 0.001) وكذلك المنطقة الصحراوية. (د) تُعرض المُحسِنات التي تم التحقق من صحتها داخل SCR باللون الأحمر في University of California at Santa Cruz Genome Browser (mm10). يتم عرض المناطق المرتبطة بعامل النسخ من تسلسل ChIP المترجمة في قاعدة بيانات المخطوطة أدناه.

يتصل SCR بجين Sox2 في الخلايا الجذعية الجنينية

قمنا بعد ذلك بالتحقيق في الآليات التي من خلالها تحيط المحسنات البعيدة والقريبة Sox2 قد تشارك في التنظيم Sox2 النسخ في الخلايا الجذعية الجنينية. لقد ثبت أن المعززات البعيدة تنظم التعبير الجيني من خلال الاتصال الجسدي بالمحفز القريب للجين المنظم عن طريق تكوين حلقات الكروماتين (كارتر وآخرون ، 2002 Tolhuis وآخرون ، 2002). في الآونة الأخيرة ، التفاعل بين Sox2 تم تسجيل المروج و SCR بواسطة 5C (نسخة الكربون الملتقطة لتشكيل الكروموسوم) و ChIA-PET (تحليل تفاعل الكروماتين مع تسلسل علامات النهاية المزدوجة) في خلايا ES الماوس (Kieffer-Kwon et al. 2013 Phillips-Cremins et al. 2013). لتأكيد هذه التفاعلات وتحسينها ، أجرينا تحليل 3C (التقاط التشكل الكروموسومي) في الخلايا الجذعية الجنينية و MEFs (Dekker et al.2002). وجدنا حلقات الكروماتين الخاصة بخلايا ES بين SCR و Sox2- المنطقة التقريبية (الشكل 2 أ الشكل التكميلي S1). تجلب هذه الحلقة معززات SCR البعيدة SRR107 و SRR111 في اتصال مع معززات الجينات القريبة SRR1 و SRR2 و SRR18 في الخلايا ES ولكن ليس في MEFs ، مما يشير إلى أن SCR يمكن أن يكون مهمًا في التنظيم Sox2 النسخ في الخلايا الجذعية الجنينية. ثبت أن ارتباط CTCF مرتبط بحلقة الكروماتين ، ومن خلال فحص بيانات ENCODE (بيرنشتاين وآخرون. 2012 Stamatoyannopoulos وآخرون. 2012) ، لاحظنا وجود مناطق مرتبطة بـ CTCF المخصب بخلايا ES داخل pEnh109 SCR مثل وكذلك مزيد من المصب من SCR (الشكل التكميلي 2B الشكل التكميلي S2). إن خصوصية نوع الخلية لربط CTCF غير عادية ، حيث أن غالبية ارتباط CTCF في جميع أنحاء الجينوم ليس خاصًا بنوع الخلية (Chen et al. 2012b) ، بما في ذلك المناطق الإضافية المرتبطة بـ CTCF في الجزء العلوي من Sox2 المروج الموجود في العديد من أنواع الخلايا الأخرى (الشكل التكميلي S2). بالإضافة إلى عوامل النسخ العديدة المقيدة في القريب والبعد Sox2 يتم إثراء المعززات وأعضاء الوسيط ومجمعات cohesin بالإضافة إلى عامل تحميل cohesin NIPBL في هذه المناطق ، مما قد يدعم تكوين وصيانة حلقة الكروماتين (الشكل التكميلي S1 الجدول التكميلي S1).

يتصل SCR بـ Sox2 المحفز والمعززات القريبة في الخلايا الجذعية الجنينية. (أتم إجراء 3C على خلايا الفئران ES و MEFs. تم تطبيع تواتر التفاعل بين SCR (جزء المرساة) والمناطق المحيطة إلى ذلك بين الأجزاء المجاورة في الأكتين الأبهري (α- قانون) المكان. يمثل الشريط الأسود جزء المرساة ، وتمثل الأشرطة الرمادية الأجزاء المتفاعلة. القيم هي متوسط ​​ما لا يقل عن ثلاث تجارب بيولوجية مكررة ، مع إجراء كل تجربة في ثلاث نسخ. تمثل أشرطة الخطأ الانحراف المعياري. يشار إلى وجود فرق كبير بين الخلايا الجذعية الجنينية و MEFs بعلامة النجمة المفردة (ص & lt 0.05) أو علامات النجمة المزدوجة (ص & لتر 0.01). (ب) قمم ChIP-seq لـ CTCF هي من خلايا ENCODE / LICR ES-Bruce4 تظهر باللون الأزرق ، وتظهر MEFs باللون الأخضر.

مطلوب SCR لنسخ Sox2 في الخلايا الجذعية الجنينية

لتحديد ما إذا كان SCR مطلوبًا أم لا Sox2 النسخ في خلايا ES ، استخدمنا نظام CRISPR / Cas9 (Ding et al. 2013 Mali et al. 2013) لحذف المنطقة 7.3 كيلو بايت التي تحتوي على معززات SRR107 و SRR111. أجرينا هذا الحذف أولاً في الماوس F1 (موس العضلات 129 × المصحف الكاستانيوس) الخلايا الجذعية الجنينية ، مما يسمح بفحص الحذف الخاص بالأليل وتحليل التعبير الجيني (Mlynarczyk-Evans et al.2006). استخدمنا اثنين من الحمض النووي الريبي التوجيهي (جرنا 104 و جرنا 112) لتوليد الحذف الكبير (الشكل 3). وجود SNP في تسلسل PAM لـ gRNA 112 على M. castaneus أليل (Cast) (C / G إلى T / A) تسبب في حذف تفضيلي لـ SCR على 129 أليل (ΔSCR 129) (الشكل التكميلي 3B / C). كتعبير من واحد Sox2 الأليل كافٍ للحفاظ على تعدد القدرات في الخلايا الجذعية الجنينية (Avilion et al. 2003) ، وتوقعنا الحصول على مستعمرات الخلايا الجذعية الجنينية حتى في حالة عدم وجود Sox2 التعبير من 129 أليل. راقبنا التعبير عن Sox2 بواسطة النسخ العكسي النوعي للأليل PCR الكمي في الوقت الحقيقي (RT-qPCR) بسبب وجود SNPs داخل Sox2 نسخة (الشكل التكميلي ثلاثي الأبعاد الشكل التكميلي S3A). في استنساخ ΔSCR 129 ، لاحظنا انخفاضًا كبيرًا ثمانية أضعاف بمقدار 129 Sox2 مرنا (متوسط ​​ثمانية ΔSCR 129 استنساخ ص = 2.16 × 10 5) ، مما يكشف أن SCR يساهم في Sox2 النسخ في الخلايا الجذعية الجنينية (الشكل ثلاثي الأبعاد). بشكل غير متوقع ، احتوى اثنان من النسخ المستنسخة التي تم فحصها على حذف داخل SCR على أليل Cast (ΔSCR Cast). أظهرت استنساخ ΔSCR Cast انخفاضًا كبيرًا في كمية المصبوب Sox2 مرنا (الشكل 3D). كما هو متوقع ، مستويات أكتوبر 4 تم الحفاظ على mRNA في كل من استنساخ المصبوب ΔSCR 129 و SCR (الشكل التكميلي S3) ، وحافظت هذه الخلايا على مورفولوجيا مستعمرة الخلايا ES عبر عدة مقاطع في الثقافة. ومن المثير للاهتمام ، أننا لاحظنا زيادة كبيرة مضاعفة (متوسط ​​ثمانية ΔSCR 129 استنساخ ص = 0.00036) في Cast Sox2 مرنا في استنساخ ΔSCR 129 وزيادة مماثلة في 129 Sox2 مرنا في استنساخ المصبوب ΔSCR ، مما يشير إلى وجود آلية تغذية مرتدة لتعويض فقدان Sox2 تعبير من أليل واحد يخفي تأثيرات حذف واحد في الخلايا الجذعية الجنينية المشتقة من سلالة فأر واحدة فقط.

مطلوب SCR ل Sox2 النسخ في الخلايا الجذعية الجنينية. (أ) مناطق ربط جرنا 104 و 112 كيلو بايت في اتجاه مجرى النهر Sox2 تظهر باللون الأحمر. يتم عرض الاشعال المستخدمة لتضخيم المنطقة المحذوفة باللون الأسود. يشار إلى مواقع SNPs بين 129 و Cast في الاشعال أو PAM المجاورة لـ gRNA112 بعلامة النجمة. تظهر بيانات ES-Bruce4 ChIP-seq لـ p300 و CTCF من ENCODE / LICR باللون الأزرق. (ب) تضخيم PCR للمنطقة المستهدفة بواسطة gRNA104 و gRNA112 في F1 ES (F1) و ΔSCR 129 / Cast clone 1 (1) و ΔSCR 129 clone 15 (15). تم استخدام مواد أولية خاصة بالأليل 129 (5′104F1_129 / 3′112R1) أو المصبوب (5′104F1_Cast / 3′112R1) لتضخيم كل أليل. (ج) تم الحصول على التسلسلات من 129 نسخة محذوفة مختارة ، ويشار إلى رقم الاستنساخ في اليسار، تشير الأشرطة السميكة إلى وجود التسلسل ، وتشير الخطوط الرفيعة إلى تسلسلات مفقودة. يتم تمييز تسلسل جرناس 104 و 112 كيلو بايت باللون الأحمر ، وتظهر مواقع تسلسل PAM بواسطة مربع أحمر ، ويشار إلى Cast SNP في PAM المجاورة لـ gRNA112 بعلامة النجمة. (د) يؤدي حذف SCR إلى تقليل التعبير المرتبط بشكل كبير Sox2 أليل. تم الكشف عن الاشعال الخاصة بأليل Sox2 129 mRNA أو Sox2 صب mRNA في RT-qPCR من F1 ES و SCR 129 و ΔSCR Cast. يظهر التعبير بالنسبة إلى المستويات الموجودة في خلايا F1 ES. تمثل أشرطة الخطأ الانحراف المعياري.

مطلوب SCR لإمكانية تمايز الخلايا ES

من استهداف خلية F1 ES الأولي ، حصلنا على استنساخ ES واحد مع حذف SCR على كل من الأليلات 129 و Cast (ΔSCR 129 / Cast). في هذه النسخة ، Sox2 تم تقليل التعبير من كلا الأليلين بشكل كبير بأكثر من ستة أضعاف (الشكل 4 أ). علاوة على ذلك ، على الرغم من الحفاظ على هذه الخلايا في وسط ES يحتوي على LIF و 2i ، فقد لاحظنا فقدان ميزات مستعمرة ES بمرور الوقت في الثقافة والتقدم نحو النمط الظاهري الشبيه بالأديم الظاهر (الشكل 4 ب). وصفنا تعبيرًا عن علامة خلية الأديم الظاهر قرص مضغوط 2 ووجدت أنه يتم تنظيمه في استنساخ ΔSCR 129 / Cast (الشكل 4C التكميلي الشكل S3). ومع ذلك ، مع مرور الوقت في الثقافة (الفقرات 2-9) ، والتعبير عن قرص مضغوط 2 تم تقليله في ΔSCR 129 / Cast ، مما يشير إلى أن هذه الخلايا لا تحافظ على التعبير الجيني المستقر للأرومة الغاذية ، وقد يرجع ذلك جزئيًا إلى صيانتها في وسط ES بدلاً من وسط جذع الأرومة الغاذية (TS). لدعم هذا الاحتمال ، لاحظنا زيادة في قرص مضغوط 2 التعبير عند الحفاظ على استنساخ ΔSCR 129 / Cast في أي من الوسط ES بدون مثبطات 2i أو وسط TS (الشكل التكميلي S3). أكد تحليل التألق المناعي والتحليل المناعي انخفاضًا كبيرًا في مستويات بروتين SOX2 في ΔSCR 129 / Cast ، وهو ما يتوافق مع متطلبات SCR لـ Sox2 النسخ (الشكل 4 د).

مطلوب SCR لصيانة النمط الظاهري لخلية ES. (أ) الحذف المتماثل لاضطرابات SCR Sox2 التعبير من كلا الأليلين. تكتشف البادئات الخاصة بالأليل Sox2 129 mRNA أو Sox2 Cast mRNA في RT-qPCR من F1 ES و ΔSCR 129 / Cast (استنساخ 1 مقاطع 2 و 5 و 9) و ΔSCR - / - في خلايا E14 ES (استنساخ 25 و 42). تمثل أشرطة الخطأ الانحراف المعياري. (ب) ال اليسار تعرض اللوحة صورًا ساطعة للمجال لـ F1 ES و SCR Cast (استنساخ 11) ، والتي شكلت مستعمرات شبيهة بـ ES عبر عدة مقاطع في الثقافة ، مقارنةً بخلايا ΔSCR 129 / Cast (استنساخ 1) ، والتي أظهرت ميزات تتفق مع التمايز إلى الأديم الظاهر. تشبه خلايا النمط الظاهري وخلايا F1 TS. تشير رؤوس الأسهم إلى ميزات مماثلة في خلايا ΔSCR 129 / Cast و TS. ال حق تعرض اللوحة SOX2 و CDX2 المناعي في خلايا F1 ES و SCR Cast (استنساخ 11) و ΔSCR 129 / Cast (استنساخ 1) وخلايا F1 TS. شريط ، 10 ميكرومتر. (ج) التعبير عن علامة التمايز قرص مضغوط 2 يظهر بالنسبة إلى المستويات الموجودة في خلايا F1 ES. تمثل أشرطة الخطأ الانحراف المعياري. (د) مستويات بروتين SOX2 في خلايا F1 ES وخلايا TS و ΔSCR 129 (استنساخ 15) و ΔSCR Cast (استنساخ 11) و ΔSCR 129 / Cast (استنساخ 1) في المقاطع 5 و 9 (P5 و P9) و ΔSCR - / - في خلايا E14 ES (استنساخ 25 و 42). تكشف مستويات GAPDH عن تحميل بروتين متساوٍ نسبيًا في جميع العينات.

لتأكيد أهمية SCR في الحفاظ Sox2 التعبير في الخلايا الجذعية الجنينية ، كررنا الحذف بوساطة Cas9 في خلايا E14TG2a (E14) ES ، حيث توقعنا أن يتم استهداف كلا الأليلين بالتساوي. لقد حصلنا على نسختين إضافيتين محذوفتين من SCR متجانسة (ΔSCR - / -) والتي أظهرت نمطًا ظاهريًا شبيهًا بالأديم الظاهر وزيادة في قرص مضغوط 2 التعبير (الشكل 4 التكميلي S4). هذه الزيادة في قرص مضغوط 2 كان التعبير أقل من ذلك الذي لوحظ في F1 ΔSCR 129 / استنساخ المصبوب في المقطع 2 وأكثر تشابهًا مع مستويات قرص مضغوط 2 لوحظ في استنساخ F1 ΔSCR 129 / Cast في مقاطع لاحقة. كما ذكرنا سابقًا ، قد يرجع ذلك جزئيًا إلى الظروف المتوسطة ES (التي لم يتم تصميمها للصيانة المستقرة لـ قرص مضغوط 2 التعبير) ولكن يمكن أن يشير أيضًا إلى أن الخلايا المحذوفة من SCR ليست خلايا الأديم الظاهر الطبيعي. في كلا النسختين E14 التي تفتقر إلى SCR ، Sox2 تم تخفيض مستويات mRNA والبروتين بشكل كبير ، على غرار استنساخ ΔSCR 129 / Cast الذي تم الحصول عليه من خلايا F1 ES (الشكل 4). معًا ، توضح هذه البيانات أن SCR يقع من 104 إلى 112 كيلو بايت في اتجاه مجرى النهر Sox2 مطلوب للمحافظة عليه Sox2 التعبير في الخلايا الجذعية الجنينية وأن فقدان هذه المنطقة يغير النمط الظاهري للخلايا الجذعية الجنينية.

ومن المثير للاهتمام ، أنه في الحيوانات المستنسخة التي تحتوي على حذف مزدوج لـ SCR ، فإن مستويات الرنا المرسال لعامل تعدد القدرات أكتوبر 4 لم تتأثر بالانخفاض الكبير في بروتين SOX2 (الشكل التكميلي S3). كان هذا غير متوقع ، حيث أظهرت دراسات أخرى ذلك Sox2 الضربة القاضية أو الحذف يؤدي إلى انخفاض في أكتوبر 4 التعبير (Masui وآخرون 2007 Adachi وآخرون 2013). في المقابل ، وجدنا ذلك أكتوبر 4 يتم الحفاظ على مستويات mRNA على الرغم من الانخفاض الكبير في مستويات بروتين SOX2. لا يبدو أن هذا الاختلاف يرجع إلى وجود مثبطات 2i في وسيطنا ES ، حيث لم تؤثر صيانة ΔSCR 129 / Cast في وسط ES بدون هذه المثبطات أكتوبر 4 مستويات النص (البيانات غير معروضة). درسنا بعد ذلك مستويات بروتين OCT4 ووجدنا أنه ، على غرار مستويات mRNA ، تم الحفاظ على مستويات بروتين OCT4 في الحيوانات المستنسخة التي تحتوي على حذف متماثل الزيجوت من SCR (الشكل التكميلي S4).

لتقييم ما إذا كان حذف SCR يؤثر على إمكانات التمايز لخلايا F1 ES ، قمنا بمراقبة التعبير عن جينات تعدد القدرات والأديم الظاهر والأديم المتوسط ​​والأديم الباطن التي تزيد عن 12 د من تكوين الجسم الجنيني (EB) (الشكل 5). في ΔSCR 129 / Cast EBs ، لاحظنا أن المستويات المنخفضة من Sox2 استمرت لمدة 12 د ، بينما في F1 EBs ، كانت مستويات Sox2 انخفض تدريجيا حتى اليوم 9. ومن المثير للاهتمام ، على الرغم من التعبير عن أكتوبر 4 و نانوج تم الحفاظ عليها في ΔSCR 129 / الخلايا المصبوبة المستزرعة في LIF / 2i ، انخفض التعبير عن كلاهما بسرعة أكبر أثناء تكوين EB مقارنةً بـ F1 EBs. Sox2 لقد ثبت أن الإفراط في التعبير في الخلايا الجذعية الجنينية يعزز التمايز بين خلايا الجلد العصبية (Kopp et al. 2008 Thomson et al. 2011). تمشيا مع هذا ، لاحظنا انخفاض التعبير عن علامات الأديم الظاهر والأديم الظاهر العصبي باكس 6, نيستين, Otx2, Foxd3، و Fgf5 في ΔSCR 129 / Cast EBs مقارنة مع F1 EBs. يشير هذا إلى أن الخلايا المحذوفة من SCR ضعيفة في قدرتها على تكوين الأديم الظاهر (الشكل 5 التكميلي الشكل S5). Sox2 لقد ثبت أنه يثبط التمايز عن الأديم المتوسط ​​، بينما أكتوبر 4 يعزز تكوين الأديم المتوسط ​​(Thomson et al. 2011 Wang et al. 2012 Radzisheuskaya et al. 2013). بما يتفق مع التعبير المستمر عن أكتوبر 4 والمستويات المنخفضة بشكل كبير من Sox2 في خلايا ΔSCR 129 / Cast ES ، لاحظنا أن هذه الخلايا متحيزة نحو تكوين الأديم المتوسط ​​عند التمايز. على وجه التحديد ، أظهر ΔSCR 129 / Cast EBs تعبيرًا مرتفعًا عن علامات الأديم المتوسط ​​المبكرة Eomes, Brachyury, TBx6، و بمب 4 في اليوم 2 مقارنةً بـ F1 EBs حيث تزيد هذه العلامات فقط من التعبير بعد اليوم 4 (الشكل 5 الشكل التكميلي S5). أدى ذلك إلى زيادة تحريض علامات الأديم المتوسط ​​المتأخرة ، بما في ذلك الحلزون 2, يد 1, اكتا 2، و تويست 2 في ΔSCR 129 / Cast EBs. علامات الأديم الباطني جاتا 4, جاتا 6, سوكس 17، و سوكس 7 أظهر نمطًا مشابهًا لعلامات الأديم المتوسط ​​المبكرة ، مع زيادة سابقة في التعبير لوحظ في ΔSCR 129 / Cast EBs مقارنة بـ F1 EBs (الشكل التكميلي S5). مجتمعة ، تكشف هذه البيانات أن الخلايا المحذوفة من SCR قد أضعفت تكوين الأديم الظاهر وانحيازًا نحو تمايز الأديم المتوسط.

يكشف تكوين EB عن ضعف التمايز للأديم الظاهر العصبي وزيادة تكوين الأديم المتوسط ​​في SCR 129 / الخلايا المصبوبة. تم إحداث تكوين EB بواسطة طريقة الإسقاط المعلق ، وتمت مراقبة التغييرات في التعبير الجيني على مدى 12 يومًا بواسطة RT-qPCR. ال ص-يظهر المحور مستويات النص بالنسبة إلى جابده. الحلزون 2 و يد 1 يتم عرضها في السجل10 مقياس. ال X- يظهر المحور أيام تكوين EB. تمثل أشرطة الخطأ الانحراف المعياري.

SRR1 و SRR2 و SRR18 غير مطلوبة لنسخ Sox2 في الخلايا الجذعية الجنينية

لتحديد ما إذا كانت هناك حاجة إلى أي من المعززات الأقرب أم لا Sox2 النسخ في خلايا ES ، قمنا بعد ذلك بحذف SRR1 أو SRR2 أو SRR18 ومراقبة التأثير على Sox2 النسخ. لكل عملية حذف ، استخدمنا جرناين لإنشاء عمليات الحذف الكبيرة (الشكل 6 أ). كشفت دراسات سابقة أن SRR1 يمكن الاستغناء عنه Sox2 النسخ في الخلايا الجذعية الجنينية ، على الرغم من وجود دليل على أن SRR1 مطلوب في الخلايا العصبية (Ferri et al.2004). وجدنا أن حذف SRR1 لم يؤثر على نسخ الارتباط Sox2 الأليل في الخلايا الجذعية الجنينية (الشكل 6 ب). هذا يتفق مع الحد الأدنى من نشاط المحسن المعروض في الخلايا الجذعية الجنينية في مقايسة مراسل لوسيفيراز (الشكل 1 ب). وجدنا أيضًا أن الحذف متغاير الزيجوت ومتماثل اللواقح لـ SRR2 أو SRR18 لم يؤثر على نسخ المحتوى المرتبط. Sox2 أليل (الشكل التكميلي 6 ب الشكل التكميلي S6). كان هذا أكثر إثارة للدهشة ، حيث أظهرت كلتا المنطقتين نشاطًا مُحسِّنًا أكثر قوة من SRR1 في اختبار المراسل. لاستبعاد احتمال أن يكون للمُحسِنات القريبة من الجينات وظائف زائدة عن الحاجة ، قمنا بحذف المنطقة بأكملها من 5 من SRR2 إلى 3 ′ من SRR18 باستخدام gRNA2 (5 ′) و gRNA18 (3 ′) في استنساخ ΔSRR1 Cast وتوليد a محسن متغاير الزيجوت استنساخ ثلاثي الضربة القاضية (ΔSRR1 / 2/18 Cast). في هذا الاستنساخ ، ما زلنا لا نلاحظ أي تأثير كبير على Sox2 النسخ (الشكل 6 ب). مجتمعة ، يكشف تحليل الحذف هذا فقط عن متطلبات معززات SCR في الحفاظ على قوتها Sox2 النسخ في الخلايا الجذعية الجنينية.

معززات الجينات القريبة ليست مطلوبة من أجل Sox2 النسخ في الخلايا الجذعية الجنينية. (أ) تم حذف كل من SRR1 و SRR2 و SRR18 في خلايا F1 ES باستخدام اثنين من جرنا. ΔSRR1 / 2/18 تم إنشاء Cast باستخدام gRNA2 (5 ′) مع gRNA18 (3 ′) في استنساخ ΔSRR1 Cast. (ب) كشف RT-qPCR الخاص بأليل أن SRR1 و SRR2 و SRR18 كلها يمكن الاستغناء عنها Sox2 التعبير في الخلايا الجذعية الجنينية. ال Sox2 مستويات mRNA الموضحة تتعلق بالمستويات الموجودة في خلايا F1 ES. تمثل أشرطة الخطأ الانحراف المعياري بين ثلاث مكررات تقنية على الأقل لكل نسخة محذوفة.

يكشف تحليل تسلسل الحمض النووي الريبي (RNA-seq) أن SCR محدد لتنظيم Sox2

As enhancers can influence genes located at megabase distances away in the genome, we conducted RNA-seq to determine whether any additional genes are affected by deletion of the SCR. Initially, we investigated gene expression changes by RNA-seq in ΔSCR 129/Cast . As expected, this clone displayed a dramatic reduction in total Sox2 transcript, consistent with the RT-qPCR results described above (Fig. 7A). We next investigated allele-specific effects in three heterozygous SCR-deleted clones (ΔSCR 129 clones 15 and 37 and ΔSCR Cast clone 11) Sox2 expression was affected only on the allele linked to the SCR deletion in these clones (Fig. 7A). As SOX2 protein levels are dramatically reduced in the ΔSCR 129/Cast clone and as cells display a differentiated trophectoderm-like phenotype, we expected to observe genome-wide changes in gene expression in these cells. في حين Sox2 is the most dramatically down-regulated gene in the ΔSCR 129/Cast clone, additional genes changed expression, consistent with the transition to the trophoblast lineage. For example, the TS cell-expressed genes قرص مضغوط 2, Gata2, H19, Peg10, Krt18, Krt8، و إيغف 2 all displayed increased expression in ΔSCR 129/Cast (Fig. 7B Supplemental Table S2). Whereas there was a significant correlation between genes with increased (ص < 1.032 × 10 −39 ) or decreased (ص < 2.704 × 10 −211 ) expression in ΔSCR 129/Cast and TS cells compared with those in ES cells, the transcriptome of ΔSCR 129/Cast cells was more similar to that of ES cells than of TS cells, consistent with our earlier observation that the ΔSCR 129/Cast clone does not stably maintain trophectoderm marker gene expression (Fig. 7B). Furthermore, we noted that of the major regulatory transcription factors expressed in ES cells (أكتوبر 4, Sox2, Sall4, Nanog, Klf4, Esrrb، و Tbx3), only Sox2 was significantly decreased in ΔSCR 129/Cast . We did note in the RNA-seq data that Nanog transcripts were reduced 3.8-fold in ΔSCR 129/Cast compared with F1 cells, and although this was not significant in the RNA-seq data, it may be biologically relevant. To investigate this possibility further, we examined NANOG protein levels in SCR-deleted clones and found that the levels of NANOG protein appeared reduced in clones containing a homozygous deletion of the SCR (Supplemental Fig. S4).

RNA-seq analysis of SCR-deleted clones. (أ) RNA-seq reads mapped to Sox2 in ΔSCR clones. Total reads are displayed in black, 129 reads are displayed in gray, and Cast reads are displayed in blue. Cast SNP identity is shown at the قاع. (ب) Scatter plots reveal differences in transcript abundance between F1 ES cells, ΔSCR clones, and F1 TS cells. Transcript levels are log2 transformed. Sox2 is indicated in green, ES cell-expressed transcription factors are indicated in red, and TS cell-expressed genes are indicated in blue.

If the SCR is regulating additional genes on chromosome 3, we would expect to see an enrichment of genes with decreased expression in ΔSCR 129/Cast on chromosome 3 (Supplemental Table S2). We did not observe an enrichment of genes on chromosome 3 however, we did note a striking enrichment of genes on the X chromosome in the set of genes with decreased expression in ΔSCR 129/Cast . The F1 ES cells are female cells that may undergo X inactivation upon differentiation induced by SCR deletion. In support of this, we noted increased expression of the X-inactive-specific transcript (زيست) on both alleles in ΔSCR 129/Cast at passage 5 (Supplemental Fig. S7). هذه الزيادة في زيست expression was transient and not maintained to passage 9, whereas the decrease in gene expression on the X chromosome was most prominent at passage 9 and skewed toward inactivation of the 129 X chromosome. This observation was expected, as F1 ES cells display a bias toward inactivation of the 129 X chromosome over the Cast X chromosome upon differentiation (Ogawa and Lee 2003 Mlynarczyk-Evans et al. 2006).

We next investigated allele-specific effects in the three heterozygous SCR-deleted clones. As expected, these clones did not display the same changes in gene expression observed in the ΔSCR 129/Cast clone, consistent with maintenance of the pluripotent phenotype in these cells (Fig. 7B). We hypothesized that if the SCR is responsible for regulating any additional genes on chromosome 3, we would observe a decrease in expression on the linked allele for those genes in all three heterozygous SCR-deleted clones. We found that the only gene in the genome that showed a significant (ص < 0.05 with Benjamini and Hochberg multiple testing correction) decrease in expression on the linked allele in all three heterozygous clones was in fact Sox2. بالإضافة إلى، Sox2 is the only gene on chromosome 3 that decreases expression greater than twofold in all three heterozygous clones and the ΔSCR 129/Cast clone, indicating that the SCR is specifically required in ES cells to regulate Sox2 النسخ.


الطرق والنتائج

To integrate the orthogonal data contained in TCGA and Cistrome DB, TCGA RNA-seq profiles were reclustered into 29 reannotated cancer types (Supplementary Figs. S1 and S2 Supplementary Table S1). Cistrome Cancer has two main functional modules: enhancer and target prediction (Fig. 1B), and TF target prediction (Fig. 1C). Details for the two modules are described below as well as in the Supplementary Material.

Differentially expressed genes in cancers can be driven by unknown TFs bound to distal enhancers, so genome-wide رابطة الدول المستقلة-regulatory profiles imputed from public H3K27ac ChIP-seq can be useful for understanding cancer-specific gene expression regulation. To this end, we first identified upregulated genes by comparing the RNA-seq data of tumor over normal samples for each of the 15 cancer types that have over 15 normal samples. For each H3K27ac ChIP-seq profile in the Cistrome DB, the regulatory potential, which is defined as the ChIP-seq signal weighted by the distance to the transcription start site, was calculated for each gene, indicating the level of gene expression reflected from H3K27ac. As a quantitative gene-centric approach, the regulatory potential defined in MARGE is more informative to identify target genes of “super-enhancers” (8). We applied the logistic regression function in MARGE to over 1,200 H3K27ac profiles and retrieved 10 relevant H3K27ac profiles that best model the upregulated genes in each cancer type. The selected H3K27ac profiles in combination can better model cancer-specific genes than any single H3K27ac ChIP-seq dataset from an individual cancer cell line (Fig. 1B). Next, we adopted the semisupervised learning approach in MARGE to weigh the selected H3K27ac profiles and used the union DNaseI hypersensitive sites ranked by the weighted integration of H3K27ac signal as the predicted profile of the enhancers regulating these genes. The cancer-upregulated genes, predicted رابطة الدول المستقلة-regulatory (enhancer) profile, as well as the “super-enhancer” targets quantified by MARGE-integrated regulatory potential for each cancer type can be downloaded for downstream analysis or visualized on genome browsers.

TF targets in a given cancer type can be predicted. If a TF is active in a given cancer type, its expression is correlated with its targets across tumor samples, and its ChIP-seq profiles provide evidence of strong binding this information can be used to predict potential targets of this TF. In addition, TF regulation of target genes could be continuous from weak to strong in a context-specific manner, rather than a strict binary mode of regulation. Therefore, we chose a loose cutoff and provided users detailed information on TF expression, TF and target gene expression correlation, and TF binding evidence, so users interested in specific TFs could set stricter cutoffs for in-depth study in a specific cancer type. We consider a TF to be active in a cancer type if a sufficient percentage of tumors express the TF above a TF-dependent baseline (Supplementary Fig. S3A). We identified putative targets of an active TF as those genes that are correlated with the TF in the tumor samples to a significantly higher level than random gene pairs in the same cancer type (Supplementary Fig. S3B). We then examined all the ChIP-seq datasets of this TF and used logistic regression to select a small subset of ChIP-seq datasets whose regulatory potentials best model the targets identified in the correlation analysis. In addition, we used the likelihood ratio test to ensure that the selected TF ChIP-seq profiles have a better signal than the best matching chromatin input for the putative targets. Altogether, we predicted target genes for 575 TFs and made them available on the Cistrome Cancer website, with an example of androgen receptor targets shown in Supplementary Fig. S4. For each TF, users can see the TF expression reads per kilobase per million, percentage of tumors expressing the TF above baseline, and ChIP-seq regression likelihood ratio for each cancer type. In the Cistrome Cancer web interface, each putative target gene for each TF in each cancer is represented by a square, where the color and size indicate supporting evidence from gene expression correlation and ChIP-seq binding, respectively (Fig. 1C).

We demonstrate the utility of Cistrome Cancer through analyses of selected TFs. We found that FOXM1 is consistently overexpressed in most cancer types (Supplementary Fig. S5A) and that luminal breast cancer patients with high FOXM1 expression have poor clinical outcomes (ص = 0.018, Supplementary Fig. S5B). Comparing FOXM1 target genes with targets of other TFs identified in Cistrome Cancer, we found target genes of MYBL2, EZH2, E2F1, E2F2, E2F8, CBX3, TTF2, BRCA1, NCAPG, SSRP1, and LIN9 to have the largest overlap with those of FOXM1 (Supplementary Fig. S5C). Analysis of ChIP-seq data for these TFs reveals a high degree of binding overlap between FOXM1, E2F1, and MYBL2 (Supplementary Fig. S5D), suggesting that these three factors form a regulatory module in cancer. These Cistrome Cancer results are consistent with previous studies of FOXM1 showing its elevated expression and role in cancer-related biological processes, including cell proliferation, cell-cycle progression, and DNA damage repair (9, 10). The target genes of FOXM1 inferred from Cistrome Cancer, including cell-cycle regulators cyclin B1 and CENP-A, have also been reported as FOXM1 targets in many cancer types (11).

As a second example, we found that STAT4 is significantly overexpressed in kidney renal clear cell carcinoma (KIRC) relative to normal kidney (Supplementary Fig. S6A) and that high STAT4 expression is associated with poor survival (Supplementary Fig. S6B). STAT4 ChIP-seq target genes have overall higher expression in KIRC (Supplementary Fig. S6C) and, consistent with known immune-related functions of STAT4 (12), target genes are enriched in immune-related functions, such as T-cell activation, leukocyte activation, and immune response. Like STAT4, IRF4 is known to have immune cell–specific activity (13). However, IRF4 and its target genes are downregulated in colon and rectal adenocarcinomas (COAD-READ Supplementary Fig. S6D–S6F), and higher IRF4 expression is associated with better prognosis (Supplementary Fig. S6E). We used TIMER (14), a systematic computational approach for analyzing tumor immune infiltrations, to estimate the abundance of tumor-infiltrating lymphocytes and found CD8 T-cell levels to be higher in KIRC tumors and lower in COAD-READ tumors, relative to their respective normal tissues (Supplementary Fig. S6G). Interestingly, CD8 T-cell abundance is positively correlated with both STAT4 in KIRC (Supplementary Fig. S6H) and IRF4 in COAD-READ (Supplementary Fig. S6I). This suggests that the transcriptional activity of STAT4 in KIRC and IRF4 in COAD-READ tumors might reflect the level of infiltrating immune cells instead of regulation in the tumor cells themselves.


INTRODUCTION

Gene transcription is a complex process involving the orchestration of diverse elements such as promoters, enhancers and insulators ensuring that gene expression is under accurate control. A recent genome-wide study showed that distal enhancers play more important roles than proximal promoters in controlling cell type-specific gene expression ( 1). Mutations in these distal elements may cause diseases, as seen in the case of β-thalassaemia. Expression of an intact β-globin (HBB) gene may be inactivated by deletion of the locus control region (LCR) ( 2). The LCR is a collection of DREs that control cell type-specific and temporal expression of the genes in the HBB gene cluster ( 3). Identification of such gene regulatory elements is therefore important for the understanding of gene transcriptional regulation and disease pathology.

Active regulatory elements are often associated with DNaseI hypersensitive sites (DHS), which are enriched by marks of open chromatin structure and locus accessibility such as histone 3 lysine 4 mono-methylation (H3K4me1) and H3K27 acetylation (H3K27Ac), and contain clusters of transcription factor binding sites (TFBS) ( 4, 5). These features provide clues for identifying regulatory elements, which can be located up to megabases away from the target gene ( 6, 7), thus making their discovery challenging.

Based on the widely accepted chromatin looping model, where a loop is formed by the DNA segment between a distal enhancer and its target gene promoter thus bringing the two elements in spatial proximity ( 8, 9), such enhancer-promoter interactions can be revealed by chromosome conformation capture (3C) ( 10). 3C provides a powerful tool to search for regulatory elements by identifying distal regions that interact with the gene of interest. This has been demonstrated successfully by Ghedof وآخرون. in searching regulatory elements of the CFTR gene ( 11). Here, we use a similar approach to identify distal regulatory elements of the human neuroglobin (NGB) الجين. To date, no regulatory element of the human NGB gene is known except for the recent characterization of the promoter ( 12). It is thus relevant to identify the regulatory elements because mutations of NGB have been associated with higher risk of Alzheimer's disease (AD) ( 13). Potentially the risk is also associated with mutations in the regulatory elements of NGB الجين. فهم NGB gene regulation may provide (i) a novel diagnostic approach for the risk of AD on individuals and (ii) a new target of therapy or preventive measures against the disease.

NGB is a neuro-protective protein which may protect neuronal cells from hypoxia, ischemia, stroke, oxidative stress, mechanical injuries and AD ( 14– 19). It is predominantly expressed in neurons ( 20) and some endocrine tissues ( 21), but the highest expression level is found in retina ( 22). Besides this spatial specificity, expression of the NGB gene also shows temporal changes in human and rodent during development and aging. In the neonatal mouse brain, NGB level increases throughout development and reaches its maximum at day 14 after birth ( 23), whilst in the adult rat brain NGB level declines with age ( 24). The latter finding is in line with a postmortem study performed on adult human brain in which NGB level was found to be negatively correlated with age ( 13). Interestingly, the same study found that two AD risk factors, age and female sex, were associated with lower NGB levels. However, the mechanisms of spatial and temporal transcriptional regulation of the NGB gene are unknown.

We previously identified the binding sites of Sp1 and Sp3 on two functional GC-boxes in the promoter region of the NGB gene and showed that DNA methylation was associated with cell type-specific expression ( 12). Others subsequently reported the presence of binding sites of the early growth response protein 1 (Egr1), nuclear factor κ-light-chain-enhancer of activated B cells (Nf-κb) ( 25), cyclic AMP responsive element binding protein (CREB) ( 26) and hypoxia-inducible factor-1 (Hif-1) on the promoter of the mouse Ngb gene ( 27). However, these ubiquitous and stimuli-activated TFs may not explain the cell type-specific expression of NGB in full. We hypothesized that there are DREs governing the binding of these factors or cooperating with them to control NGB التعبير الجيني.

In this study, a combination of the 3C technique and in silico analysis was employed to locate potential DREs of the human NGB الجين. A 300 kb region covering the NGB gene was analyzed in both neuronal and non-neuronal cell lines. Two novel regions that interact with the NGB gene were located at −70 kb upstream and at +100 kb downstream. Interestingly, the interaction frequency between the upstream region and NGB is significantly higher in a neuronal cell line whilst the downstream element showed similar interaction frequencies across cell lines. In addition, a segment of the upstream region showed cell-type specific activating function on the NGB promoter in luciferase reporter assays. CRISPR-mediated deletion further supported the notion that this segment is a حسن النية distal regulatory element for the NGB gene and that it may be a key regulator for the spatial and temporal expression of the NGB الجين.


شكر وتقدير

We thank Alexandra Fish, Emily Hodges, and Corinne Simonti for helpful discussions and comments on the manuscript.

التمويل

LLC was supported by the National Institutes of Health [T32GM080178]. JAC was supported by the National Institutes of Health [1R01GM115836], a March of Dimes Innovation Catalyst award, and institutional funds from Vanderbilt University.

Availability of data and materials

The data and scripts used in this study are available within the article, its additional files, and a GitHub repository (https://github.com/colbrall/drm_enhancer_manuscript).


المواد والأساليب

Enhancer Identification and Testing.

Prospective enhancers were identified near genes of interest using a combination of ChIP-chip data [provided for various maternal, gap, and pair rule genes by the Berkeley ذبابة الفاكهة Transcription Network Project (11)] and sequence-based binding-site cluster analysis. The cluster analysis was performed using the software ClusterDraw2 (41). The program and binding motif models used are available on-line at http://line.bioinfolab.net/webgate/submit.cgi.

Candidate regions (listed in Table S1) were tested in vivo using traditional lacZ reporter assays combined with targeted phiC31 transgenesis as adapted for use in ذبابة الفاكهة (25, 26). An nE2G backbone with insulators (42) modified for targeted integration was used to test potential enhancers by placing them upstream of an eve-lacZ fusion gene. The same construct was used for the one vs. two enhancer experiments for Kr و kni the second enhancer for the two enhancer constructs was added into a BstBI restriction site downstream of lacZ ∼5-kb away from the first enhancer. The landing site 51D (26), Bloomington Stock Center number 24483, was used for lacZ assays.

الاثنان hb enhancer-lacZ constructs were crossed into a 4× or 6× maternal Bicoid copy number background using the BB9+16 fly line (19).

Recombineering and Transgenesis.

Recombineering was performed as described previously in ref. 3 (see also refs. 23, 24, 43, and 44). ال أصفر reporter (used to detect sites of nascent transcript by using an intronic in situ probe) was integrated as a yellow-kanamycin fusion that left the native hb UTRs intact. ال bcd binding-site clusters and surrounding regions of the primary or shadow enhancers were removed via replacement with an ampicillin resistance cassette taken from pBlueScript. Primers used for construct building and recombineering are listed in Table S1. BAC CH322-55J23 (24) was the basis for all subsequent modifications. All BACs were integrated into landing site VK37 on chromosome 2 (23), Bloomington Stock Center number 24872.

Whole-Mount in Situ Hybridization.

Embryos were fixed using standard methods. Fluorescent or colormetric in situ hybridization was performed as described in refs. 3 and 45. Probes were generated with the primers listed in Table S1 and in vitro transcription. Reporter genes were labeled with digoxigenin-tagged antisense probes, sheep anti-dig primary antibodies (Roche), and donkey anti-sheep Alexa 555 secondary antibodies (Invitrogen). Endogenous genes hb, Kr، و kni were labeled with biotin-tagged probes, mouse anti-bio primary antibodies (Roche), and donkey anti-mouse Alexa 488 secondaries (Invitrogen). Nuclei were counterstained with DRAQ5 (Biostatus Ltd.).


شاهد الفيديو: ما الجينات (أغسطس 2022).