معلومة

ما الذي يستلزمه التحليل الشرطي لـ SNP في دراسة GWA؟

ما الذي يستلزمه التحليل الشرطي لـ SNP في دراسة GWA؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا على دراية باستخدام علامات النيوكلوتايد في دراسات الارتباط على مستوى الجينوم لتحديد مواقع الجينات المشاركة في السمات المعقدة ، لكنني ما زلت أرى مصطلح "التحليل الشرطي" المستخدم دون أي تفسير. هل هو نوع من التلاعب الرياضي الذي يتم فيه تقليل أهمية علامة SNP إلى الصفر ، لمعرفة ما إذا كانت SNPs الأخرى مرتبطة ارتباطًا مباشرًا بالنمط الظاهري المعني؟


في دراسات GWA ، تميل إلى تحليل تعدد الأشكال "الرصاص" الخاص بك في المناطق التي ترتبط فيها الأنماط الجينية (المعروفة باسم عدم توازن الارتباط).

إذا وجدت ارتباطًا بين SNP آخر والنتيجة ، وكان SNP هذا مرتبطًا بالمتغير الأصلي ، فيمكنك إجراء الشرط التحليل حيث تقوم بضبط SNP الأصلي في النموذج. هذا لاختبار ما إذا كان الارتباط بين SNP الثاني مستقلًا عن الأول ، أو ما إذا كان ذلك لمجرد أنهما مترابطان (في LD).

لذا فإن إجراء تحليل شرطي هو مجرد معرفة ما إذا كان الارتباط الذي لوحظ هو إشارة مستقلة.

على الأقل هذه هي الطريقة التي فسرتها بها سابقاً!


على سبيل المثال تم العثور على SNP-A مرتبطًا بزيادة خطر الإصابة بمرض السكري من النوع 2 (T2D).

تم العثور لاحقًا على أن SNP-B مرتبط بمخاطر T2D أيضًا.

ترتبط SNP-A و SNP-B.

لمعرفة ما إذا كان الارتباط بين SNP-B و T2D مستقلًا عن الارتباط الأول ، يمكنك ضبط SNP-B في النموذج (أ الشرط التحليلات).

النموذج الأول: lm (T2D ~ SNP-A + confounders) النموذج الثاني: lm (T2D ~ SNP-A + confounders + SNP-B)

إذا كان الارتباط بين SNP-A (و / أو SNP-B) و T2D لا يزال مهمًا ، فإن لهما بعض التأثير المستقل على مخاطر T2D. إذا اختفى الارتباط ، فهما مرتبطان فقط لأنهما مرتبطان في الأفراد.


MAGMA: تحليل مجموعة الجينات المعمم لبيانات GWAS

قسم الانتماءات في علم الوراثة المعقدة للسمات ، مركز علم الوراثة العصبية والأبحاث المعرفية ، جامعة VU أمستردام ، أمستردام ، هولندا ، معهد علوم الحوسبة والمعلومات ، جامعة رادبود نيميغن ، نيميغن ، هولندا

معهد انتساب المعلوماتية ، جامعة أمستردام ، أمستردام ، هولندا

معهد الانتساب لعلوم الحوسبة والمعلومات ، جامعة رادبود نيميغن ، نيميغن ، هولندا

قسم الانتماءات الوراثة المعقدة للسمات ، مركز علم الوراثة العصبية والبحوث المعرفية ، جامعة VU أمستردام ، أمستردام ، هولندا ، قسم علم الوراثة السريرية ، المركز الطبي بجامعة VU بأمستردام ، حرم العلوم العصبية أمستردام ، هولندا


تحليل ميتا لدراسات GWA

على الرغم من أن نهج GWA كان مفيدًا للعديد من الدراسات منذ تلك التي تم الإبلاغ عنها لأول مرة في منتصف العقد الأول من القرن الحادي والعشرين (Welter وآخرون. يُقدر أن متغيرات المخاطر المحددة تمثل 15٪ & # x0201365٪ من الجزء الجيني من AMD (Manolio et al.2009). لقد نمت مناهج تعزيز اكتشاف التباين الجيني المرتبط بالمرض إلى ما هو أبعد من نهج GWA التقليدي وتشمل احتساب المتغيرات باستخدام المعلومات الجينية المعروفة لعينة مرجعية ، وإجراء التحليلات الشرطية ، وتنفيذ تحليلات المسار.

تعد زيادة حجم عينة الدراسات أمرًا بالغ الأهمية ، حيث تعمل أحجام العينات الكبيرة من الحالات والضوابط على تسريع تحديد التباين الجيني المرتبط بالمرض محل الاهتمام. بالإضافة إلى زيادة عدد العينات المختبرة ، أصبحت زيادة عدد المتغيرات المختبرة هدفًا أكثر قابلية للتحقيق من خلال إجراء التضمين على بيانات GWA. الاقتطاع هو تقنية تزيد بشكل كبير من عدد المتغيرات المختبرة بخلاف تلك التي تم استجوابها في دراسة GWA من خلال استنتاج الأنماط الجينية لـ SNPs غير المصنفة. الجمع بين الأنماط الجينية المعروفة في النيوكلوتايد التي تم استجوابها بواسطة GWA مع تسلسل الحمض النووي من لوحة مرجعية ، يمكن بعد ذلك استنتاج الأنماط الجينية في العديد من SNPs بدرجات متفاوتة من الثقة والدقة. لا يؤدي الاقتراض إلى زيادة قوة دراسات GWA فقط عن طريق زيادة عدد تعدد الأشكال التي يمكن اختبارها ، بل يمكن أن يؤدي أيضًا إلى تحديد أكثر كفاءة للمتغيرات السببية و / أو تعدد الأشكال في اختلال التوازن عالي الارتباط مع متغير سببي (Marchini and Howie 2010 Li وآخرون 2009). تم تنفيذ الاقتطاع في العديد من دراسات AMD لتعزيز القدرة على اكتشاف المتغيرات المرتبطة (Fritsche et al. 2013 Helgason et al. 2013 Seddon et al. 2013).

الدراسات التي تجمع التقنيات الموصوفة تزيد بشكل كبير من قيمة بيانات GWA. في أحدث إصدار من AMD Gene Consortium (Fritsche et al. 2013) ، تم اكتشاف سبعة متغيرات جديدة باستخدام بيانات GWA خارج الأساليب التقليدية المنفذة. باستخدام بيانات GWA من 7650 حالة متقدمة من AMD و 51844 عنصر تحكم ونسب إلى مجموعة البيانات المرجعية للتغيرات البشرية HapMap II (Frazer et al. 2007) ، قام الكونسورتيوم بتقييم ما يقرب من 2.5 مليون تعدد الأشكال الكلي. من بين هؤلاء ، تم تقييم 32 مرة أخرى في 9531 حالة إضافية و 8230 مراقبة. كشف التحليل المشترك عن 19 موقعًا إجماليًا يحقق أهمية على مستوى الجينوم في ص & # x0003c 5 & # x000d7 10 & # x022128. تضمنت المواقع المهمة 12 متغيرًا تم تحديده مسبقًا في ARMS2-HTRA1 و CFH و C2-CFB و C3 و TIMP3 و APOE و CETP و VEGFA و TNFRSF10A و LIPC و CFI و و COL10A1، بنسب رجحان تتراوح من 1.13 (COL10A1) إلى 2.71 (ARMS2-HTRA1). سبعة متغيرات إضافية في COL8A1-FILIP1L ، IER3-DDR1 ، SLC16A8 ، TGFBR1 ، RAD51B ، ADAMTS9 ، و B3GALTL حقق أهمية على مستوى الجينوم لأول مرة ، حيث تتراوح نسب الأرجحية من 1.11 (RAD51B) إلى 1.28 (COL8A10-FILIP1L) (فريتش وآخرون 2013).

تجاوزت هذه الدراسة أيضًا أساليب GWA التقليدية من خلال استكشاف التقسيم الطبقي حسب النوع الفرعي AMD والجنس والنسب. ذات أهمية خاصة، CFH أليلات الخطر مرتبطة بشكل تفضيلي بمخاطر الضمور الجغرافي عند مقارنتها بتكوين الأوعية الدموية المشيمية ، وكان لها دليل أقوى على الارتباط في الأوروبيين مقارنة مع الآسيويين. تحليلات التفاعل ، التي استكشفت ما إذا كانت أزواج أليلات الخطر التي تحدث معًا تمنح مخاطر أعلى من الأليلات التي تحدث وحدها ، وسلطت الضوء على تفاعل واحد بين SNPs بالقرب من CFH و C2-CFB حيث كانت ناقلات أليلات الخطر في كلا الموقعين معرضة لخطر الإصابة بـ AMD أعلى قليلاً مما هو متوقع في العادة. أكدت هذه النتائج أيضًا على أهمية النظام التكميلي في AMD وقدمت أفضل التقديرات الإجمالية لأحجام التأثير لكل من المتغيرات المتضمنة حتى الآن.

تُستخدم تحليلات إثراء المسار لتحديد العلاقات البيولوجية بين الإشارات الجينية المرتبطة بيولوجيًا والمسارات ذات الأهمية في مرض معين. يتم تنفيذ ذلك من خلال تقييم نتائج GWA لـ SNPs لتقييم التمثيل الزائد في مسارات بيولوجية معينة والعمل على تقييم الإشارات التي يمكن أن تكون ذات مغزى بيولوجيًا ولكن يتم تجاهلها وسط العديد من النتائج الإيجابية الخاطئة المحتملة (Yaspan et al. 2011). وبالتالي ، توفر تحليلات المسار نظرة ثاقبة للجوانب الوظيفية للمرض من خلال تقييم نتائج GWA بطريقة أوسع من تحليلات SNP الفردية ، ويمكنها تحديد العلاقات ذات المغزى المحتمل لـ SNPs بخلاف تلك التي تحقق قطعًا محددًا لقيمة p. قد تسلط هذه النتائج الضوء على تأثيرات إضافية صغيرة و / أو تفاعلية مهمة للتقييم بالإضافة إلى نتائج GWA الإجمالية وفي سياقها. أفاد أحدث إصدار من AMD Gene Consortium عن تنفيذ تحليل مسار INRICH (أداة تحليل الإثراء القائمة على الفترات لدراسات رابطة الجينوم الواسعة) (Lee et al. 2012) لتقييم النتائج الإجمالية (Fritsche et al. 2013). أثناء تأكيد مسارات AMD المتورطة سابقًا ، سلط هذا التحليل أيضًا الضوء على مسارات إضافية ذات أهمية بين المواقع السبعة الجديدة ، وكان هناك إثراء للجينات التي تشفر البروتينات في المسارات التكميلية وتصلب الشرايين بالإضافة إلى الجينات التي تشفر الكولاجين وبروتينات المنطقة خارج الخلية ، وشلالات التكميل والتخثر ، استقلاب البروتين الدهني وتنظيم موت الخلايا المبرمج (Fritsche et al. 2013).


نتائج

كما ذكرنا سابقًا ، فإن طريقتنا مفيدة بشكل خاص في دراسات علم الوراثة السكانية حيث لا يوجد بداهة المعرفة البيولوجية حول الارتباط ، والأنماط الفردانية ، أو حيث لا يمكن استنتاج هذه المعلومات. لإظهار أهمية SNP2GO في مثل هذه الدراسات ، قمنا بتحليل SNPs المحددة من المقارنة بين التجربة الأساسية والوسطى في Orozco-Terwengel وآخرون. (2012). في هذه الدراسة ، وجد المؤلفون 2000 مرشح SNPs (1.6 مليون) يحتمل أن يشاركوا في التكيف الحراري لـ D. melanogaster وأراد العثور على المسارات البيولوجية التي يحتمل أن تكون متورطة في هذه العملية. قمنا بتشغيل SNP2GO على هذه البيانات ووجدنا 135 مصطلحًا مهمًا لـ GO (معدل الاكتشاف الخاطئ & lt0.05) ، مع ما لا يقل عن 10 جينات مرتبطة بكل من هذه المصطلحات (المعلومات الداعمة ، الجدول S1). عادة ، يمكن للمرء أن يستنتج أن هذه العمليات الخلوية والوظائف الجزيئية متورطة في التكيف الحراري في ذبابة الفاكهة. ومع ذلك ، وجد SNP2GO أن عدد المناطق الجينومية في مصطلحات GO المقابلة التي تساهم في أهمية 120 من 135 مصطلح GO كان أقل من المتوقع عن طريق الصدفة (ص & lt 0.05 ، وفقًا للتوزيع الصفري التجريبي). بعبارة أخرى ، فقط عدد قليل من المناطق الجينومية لكل مصطلح GO تسببت في الأهمية. وبالتالي ، وفقًا لـ SNP2GO ، يجب على المرء أن يكون حذرًا بشأن تفسير أهمية مصطلحات GO هذه ، نظرًا لأن التأثيرات الجينية المحلية ربما تجمع SNPs المرشحة.

لذلك ، درسنا كذلك التوزيع الجينومي لـ SNPs الموجودة في Orozco-Terwengel وآخرون. (2012) وحللت موقع SNPs المرشحة على الكروموسومات. وجدنا أن 1568 من 2000 SNPs مرشح (بمعنى آخر.، 78٪) على ذراع الكروموسومات 3R (المتوقع 23٪ ، حسب حجم ذراع الكروموسومات). بالاتفاق مع هذه الملاحظة ، وجدنا أيضًا أن ذراع الكروموسومات 3R يساهم في المتوسط ​​2.6 أكثر من المتوقع في أهمية شروط GO (الشكل 3). هذا يؤدي إلى تفسير بيولوجي أبسط وغير قابل للتكيف لأهمية مصطلحات GO هذه. ال ذبابة الفاكهة السكان التي Orozco-Terwengel وآخرون. (2012) درس فصل الانقلاب العالمي ln (3R) باين، والتي تغطي مساحة 8 ميجا بايت على ذراع الكروموسومات 3R. منذ قمع إعادة التركيب يتوسع خارج منطقة الانقلاب (Evans وآخرون. 2007) ، من المتوقع أن يؤثر LD على أكثر من ثلث ذراع الكروموسومات هذا ، موضحًا المساهمة الفريدة للجينات الموجودة في هذه المنطقة الجينية ، كما ذكرت SNP2GO. وقد أكد توبلر هذه الملاحظة مؤخرًا وآخرون. (2013).

عدد الجينات المرصودة / المتوقعة التي تساهم في أهمية مصطلحات GO. 3R ، ذراع جسمي 3R بقية ، كروموسومات أخرى.


شكر وتقدير

نعترف بـ CSC (مركز تكنولوجيا المعلومات للعلوم) والمركز التكنولوجي لمعهد الطب الجزيئي للخدمات الحسابية. تم الاعتراف بوحدة الطب الحيوي عالية الإنتاجية في معهد الطب الجزيئي في فنلندا ، و R. Kovanen و A. Uro بخبراتهم الفنية. يُعرف M. Jauhiainen بمشاركته خبرته في عملية كتابة المخطوطات. تم دعم هذا البحث من خلال تمويل من البرنامج الإطاري السابع للاتحاد الأوروبي (FP7 / 2007-2013) ، اتحاد ENGAGE ، اتفاقية المنحة HEALTH-F4-2007-201413. يكون. تم تمويله جزئيًا من قبل برنامج الدكتوراه بجامعة هلسنكي في الطب الحيوي (DPBM). م. بتمويل من منحة مؤسسة Manpei Suzuki Diabetes Foundation للعلماء الشباب العاملين في الخارج. ا. و A. Mahajan يعترفان بالتمويل من Wellcome Trust بموجب الجوائز WT098017 و WT090532 و WT064890. في لاجو ، إل إم ، إس إتش. و I.P. تم تمويلها جزئيًا من خلال البرنامج الإطاري السابع للاتحاد الأوروبي (FP7 / 2007-2013) ، ومشروع ENGAGE ، واتفاقية المنحة HEALTH-F4-2007- 201413. تمت رعاية LM جزئيًا من خلال مساهمة "5 لكل ألف" المخصصة لجامعة فيرارا ، تقرير ضريبة الدخل لعام 2009 ، وجزئيًا من خلال برنامج ENGAGE Exchange and Mobility لصناديق التدريب ENGAGE. م. حاصل على الزمالة السريرية العليا لمجلس البحوث الطبية في المملكة المتحدة (G0902313). شارع. بدعم من مؤسسة Sigrid Juselius. شبيبة. و C.G. حصلوا على تمويل من منحة من RFBR (المؤسسة الروسية للأبحاث الأساسية) - مجموعة هيلمهولتز للبحوث المشتركة (12-04-91322). سي. حصلوا على تمويل من البرنامج الإطاري السابع للاتحاد الأوروبي (FP7-Health-F5-2012) بموجب اتفاقية المنحة رقم 305280 (MIMOmics). تم دعم M. Perola من قبل البرنامج الإطاري السابع للاتحاد الأوروبي (اتفاقيات المنح 313010 BBMRI-LPC و 305280 MIMOmics و 261433 BioSHaRE-EU) ومنحة الأكاديمية الفنلندية 269517 ومؤسسة Yrjö Jahnsson ومؤسسة Juho Vainio. ن. يشغل كرسيًا ممولًا من مؤسسة القلب البريطانية (BHF) وهو محقق أول في NIHR. سي. تم تمويله من قبل BHF وتم تمويله بشكل ثمين من قبل NIHR Leicester لوحدة أبحاث الطب الحيوي للقلب والأوعية الدموية. تم دعم V. Salomaa من قبل المؤسسة الفنلندية لأبحاث القلب والأوعية الدموية والأكاديمية الفنلندية (منحة 139635). تم دعم إيكونن من قبل أكاديمية فنلندا ومركز التميز في أبحاث الأغشية الحيوية (272130) ، وأكاديمية فنلندا (263841) ومؤسسة Sigrid Juselius. ف. كان مدعومًا بمنحة باحث ما بعد الدكتوراه من جامعة هلسنكي ، ومؤسسة Magnus Ehrnrooth ومؤسسة Kymenlaakso الثقافية. موافق ، J.-P.M. و ف. حصلوا على تمويل من البرنامج الإطاري السابع للاتحاد الأوروبي (FP7 / 2007-2013) بموجب اتفاقية المنحة 258068 EU-FP7-Systems Microscopy Network of Excellence. ريال سعودى. بدعم من أكاديمية فنلندا (251217 و 255847) ، ومركز التميز في علم الوراثة المعقدة للأمراض ، ومشروعات برنامج الإطار السابع للاتحاد الأوروبي ENGAGE (201413) و BioSHaRE (261433) ، والمؤسسة الفنلندية لأبحاث القلب والأوعية الدموية ، و Biocentrum Helsinki و مؤسسة سيغريد جوسيليوس. يتم توفير إقرارات خاصة بالفوج في الملاحظة التكميلية.


أساليب

منهج تصوري

الدراسات غير التجريبية عرضة للارتباك والعكس السببية. يتغلب MR على هذه المشكلات ، باستخدام إطار عمل المتغيرات الآلية ، من خلال استغلال تشكيلة عشوائية من الأليلات ، وتخصيص النمط الجيني عند الحمل ، وتعدد الأشكال (الجينات التي تؤثر على أكثر من سمة واحدة). يؤدي استخدام المتغيرات الجينية بشكل فعال إلى تجنب معظم المصادر البيئية للارتباك ، وتخصيص النمط الجيني عند الحمل يتجنب معظم مصادر السببية العكسية ، لأن الأنماط الجينية تسبق مؤقتًا متغيرات الملاحظة ذات الأهمية.

عيّنتان MR هي نسخة من الإجراء الذي يستخدم إحصائيات موجزة من دراستين على نطاق الجينوم (GWA) 42،43،44،45،46،47. نموذجيًا ، مع نموذج MR المكون من عينتين ، تكون طريقة IVW هي النهج القياسي (الشكل 1 يحتوي على مثال).

رسم توضيحي لعينة MR باستخدام اختبار التأثير السببي لطول التيلومير على خلايا الدم الحمراء (RBC) يعد كمثال. تقديرات ارتباطات طول SNP-telomere ( (< widehat < beta >> _))) في العينة 1 (من دراسة GWA سابقة لطول التيلومير). ثم يتم تقدير الارتباط بين نفس تعداد النيوكلوتايد و كرات الدم الحمراء في العينة 2 ( (< واسع النطاق < بيتا >> _)) (من دراسة GWA لتعداد كرات الدم الحمراء). يتم دمج التقديرات من SNPs الآلية في نسب والد ( (< Widehat < beta >> _= hspace <0.17em> < Widehat < beta >> _/ < واسعة النطاق < بيتا >> _)). إن (< واسع النطاق < بيتا >> _) يتم تحليل تقديرات النسبة تلويًا باستخدام تحليل التباين العكسي الموزون (IVW) ( ( widehat < beta> )) IVW) ، والتي تنتج تقديرًا سببيًا إجماليًا لطول التيلومير على تعداد كرات الدم الحمراء. تُستخدم تقديرات الحساسية للحكم على ما إذا كان التقدير السببي لـ IVW معقولاً (المزيد أدناه).

افتراضات عشوائية مندلية

يعتمد MR على صحة ثلاثة افتراضات 48. في سياق التحليل الحالي ، تكون هذه الافتراضات كما يلي: (1) إن تعدد الأشكال التي تعمل كمتغيرات آلية لطول التيلومير ترتبط ارتباطًا وثيقًا بطول التيلومير (2) تكون تعدد الأشكال المرتبطة بطول التيلومير مستقلة عن عوامل الإرباك لطول التيلومير ونتائج الفائدة و (3) طول التيلومير ترتبط النيوكلوتايد (SNPs) بنتائج الاهتمام فقط من خلال طول التيلومير (لا يوجد تعدد تعدد أفقي ، لا ترتبط SNPs بالنتائج المستقلة عن طول التيلومير 44،48).

بناء الصك

لأدوات طول التيلومير ( (< widehat < بيتا >> _) في الشكل 1) ، تعدد الأشكال المرتبطة بأهمية الجينوم (ص & lt 5 × 10 –8) مع الانحراف المعياري (SD) في طول التيلومير ، والتي تم تجميع إحصاءاتها الموجزة (تقديرات التأثير والأخطاء المعيارية) والإبلاغ عنها بواسطة Haycock et al. تم اختيار 20. كانت دراسة GWA الأصلية بطول التيلومير عبارة عن تحليل تلوي تم إجراؤه عبر ستة مجموعات على 9190 فردًا (رجال ونساء تتراوح أعمارهم بين 18-95) من أصل أوروبي 3. (الأوصاف التفصيلية للمجموعات الست متاحة في أماكن أخرى 49،50،51،52،53،54 ، ولكن لتسهيل الرجوع إليها ، أدرج مانجينو وزملاؤه 3 الأفواج الستة التالية في التحليل التلوي لطول التيلومير: قلب فرامنغهام دراسة ، ودراسة قلب الأسرة ، ودراسة صحة القلب والأوعية الدموية ، ودراسة قلب بوجالوزا ، و HyperGEN ، و TwinsUK). مانجينو وآخرون. 3 تم تعديلها وفقًا للعمر والجنس 2 وتاريخ التدخين وفحصها من أصل غير أوروبي مع تحليل المكونات الرئيسية. من التحليل التلوي ، كان ستة عشر SNPs متاحًا لتحليل MR هذا (الجدول التكميلي 19). تلك التي كانت مستقلة (ليست في حالة اختلال التوازن ، LD ، مع r 2 & lt 0.001 ، على مسافة متكتلة 10000 كيلو قاعدة بالإشارة إلى مشروع الجينوم 1000 (https://www.internationalgenome.org/) تم الاحتفاظ بها وتلك التي لم تتناسب مع هذه المعايير. تم بعد ذلك الحصول على تقديرات التأثير المقابلة والأخطاء المعيارية لـ SNPs المحتجزة من دراسات GWA لسمات الدم ( (< Widehat < beta >> _)) في الشكل 1). تم إجراء دراسات GWA عن سمات الدم بواسطة Astle et al. 21 على عدد سكان

173000 فرد من أصل أوروبي ، معظمهم من المملكة المتحدة (تحليل تلوي لدراسات البنك الحيوي والدراسات الفاصلة في المملكة المتحدة). تم تعديلها وفقًا للمكونات الرئيسية ومركز الدراسة واستبعدت المصابين بسرطان الدم أو اضطرابات الدم الرئيسية.

عندما لم يكن SNP متاحًا في دراسات GWA لسمات الدم ، تم اختيار SNP "وكيل" في LD مع SNP عند r 2 0.80 (تم تقييمه باستخدام 1000 Genomes Project). إذا لم يكن SNP "الوكيل" متاحًا ، فقد تمت إزالة SNP من التحليل. تمت مواءمة ارتباطات التعرض للنيوكليوتيدات SNP ونتائج SNP مع وظيفة "بيانات التنسيق" ضمن حزمة MR-Base "TwoSampleMR" ضمن R 42،55. تم الجمع بين الترابطات المتوافقة مع التعرض للنيوكليوتيدات SNP ونتائج النيوكلوتايد مع طريقة IVW (الشكل 1).

لجميع الاختبارات ، تم تشغيل RadialMR regression 56 لاكتشاف القيم المتطرفة لـ SNP. تمت إزالة SNPs النائية. (تم استخدام عدد مختلف من SNPs بطول التيلومير لسمات الدم المختلفة بسبب إزالة القيم المتطرفة وما إذا كان SNP أو "وكيله" متاحًا في مجموعة بيانات النتائج.) جميع المتغيرات الآلية المدرجة في هذا التحليل لها Cochrane's س-إحصائية ص- القيم التي تشير إلى عدم وجود دليل على عدم التجانس بين تعدد الأشكال 57 (ترد إحصاءات عدم التجانس في الجداول التكميلية 10-18).

تتوافق SNPs المحددة مع المناطق الجينومية المستقلة وتمثل 1 ٪ إلى 2 ٪ من التباين في طول تيلومير الكريات البيض (R 2) ، والذي يتوافق مع F- إحصائيات بين 14 و 17. F- يتم استخدام الإحصائيات لقياس ما إذا كانت نتائج IVW تعاني من انخفاض القدرة الإحصائية لرفض فرضية العدم. يمكن أن يحدث هذا إذا أوضحت أداة طول التيلومير نسبة محدودة من التباين في طول التيلومير في الكريات البيض. F- الإحصائيات و GT 10 تعتبر تقليديًا قابلة للتغير 58،59. ال F- يتم عرض الإحصائيات وقيم R 2 المستخدمة لحسابها في الجدول 1.

بالإضافة الى، أنا 2 إحصاءات مفيدة لتقييم تحيز التوهين المحتمل في أحد مقدرات الحساسية (انحدار MR-Egger) متوفرة (أيضًا في الجدول 1). أنا يمكن أن تشير الإحصائيات 2 & lt 90٪ إلى التخفيف في تقدير MR-Egger ، مما قد يعني أن النتائج من اختبار اعتراض MR-Egger (انظر أدناه) من المحتمل أن تكون غير دقيقة. يوصى باستقراء المحاكاة (SIMEX) ، وهو إجراء تصحيح يضبط تقدير MR-Egger لتخفيف الانحدار المحتمل إلى الصفر ، من أجل أنا 2 إحصاء & 90٪ 60. تم الإبلاغ عن نتائج SIMEX في الجداول التكميلية 10-19.

تحليلات الحساسية

يمكن أن يكون مقدر IVW متحيزًا إذا كان أي من SNPs الآلي ينتهك افتراض MR حول الأداة الجينية التي لا يكون لها تأثير مباشر على النتيجة بغض النظر عن التعرض 61. لتقييم الانتهاكات المحتملة لافتراض MR (3) ، تم تشغيل ثلاثة مقدرات حساسية - الانحدار MR-Egger ، والوسيط المرجح ، وطرق الوضع الموزون - ومقارنة نتائجها مع تلك الخاصة بـ IVW. تضع مقدرات الحساسية افتراضات مختلفة حول الطبيعة الكامنة وراء تعدد الأشكال. وبالتالي ، إذا كانت اتجاهات ومقادير آثارها تتوافق مع تلك الخاصة بـ IVW ، فهذه شاشة نوعية ضد تعدد الأشكال (وبالمثل ، يشير عدم التجانس في آثارها إلى تعدد الأشكال). تعتبر مقارنة IVW ومقدرات الحساسية شكلاً من أشكال التثليث وتوليف المعرفة - أي أن عملية الحكم على ما إذا كانت النتائج متوافقة مع السببية تشبه ما يفعله المحققون عندما يقومون بمراجعة منهجية للدراسات باستخدام طرق وقوى وقيود مختلفة.

تم تغطية التفسيرات المتعمقة لمقدرات MR وافتراضاتهم في مكان آخر 61،63،64. تم الإبلاغ عن نتائج IVW ومقدرات الحساسية في الجدول 1 ، باستثناء نتائج اختبارات اعتراض MR-Egger. يوفر انحدار MR-Egger تقديرًا للتأثير واختبارًا لتعدد الاتجاه (اختبار اعتراض MR-Egger). يتم تفسير اختبار اعتراض MR-Egger لتعدد الأشكال بشكل مختلف عن المقدرات التي توفر اختبارات للارتباطات بين طول التيلومير وصفات خلايا الدم. عندما لا يختلف اعتراض MR-Egger عن الصفر (ص & GT 0.05) ، هذا دليل ضد تعدد الأشكال. تم الإبلاغ عن نتائج اعتراض MR-Egger في الجداول التكميلية 10-18.

عدد الاختبارات

في المجموع ، تم تشغيل تسعة اختبارات MR (يتم توفير الخصائص التفصيلية للنيوكلوتايد النيكوتين الفردي المستخدم في كل نموذج في الجداول التكميلية 1–9). على الرغم من أنها أكثر تحفظًا بسبب الارتباط بين سمات الدم ، لحساب الاختبارات المتعددة عبر التحليلات ، فقد تم استخدام تصحيح Bonferroni لإنشاء ص- عتبة القيمة للأدلة القوية (ص & lt 0.006) (معدل إيجابي كاذب = 0.05 / 9 نتائج).

البرامج الإحصائية

تم إجراء تصحيحات SIMEX في Stata SE / 16.0 65. تم إجراء جميع التحليلات الموصوفة الأخرى في الإصدار 3.5.2 من R مع حزمة "TwoSampleMR" 42.


مناقشة

لطالما استخدمت نماذج القوارض لدراسة التأثيرات الفسيولوجية والجزيئية والسلوكية للكوكايين والميثامفيتامين ، ولكنها ليست مناسبة تمامًا لتحديد المتغيرات السببية في جينات الفصل المتعددة التي تساهم في القابلية لتعاطي المخدرات بسبب القيود المفروضة على أحجام العينات ، والارتباط الواسع. عدم التوازن في العديد من رسم الخرائط ، واعتبارات التكلفة. D. melanogaster تم استخدامه سابقًا لتشريح البنية الجينية لاستهلاك الإيثانول (27) ، وحساسية الكحول (34) ، وسلوك التغذية (35). هنا ، استخدمنا تعيين xQTL في AIP لـ D. melanogaster لتحديد الأليلات الفاصلة بشكل تفاضلي بشكل طبيعي في الأفراد الذين يعانون من ارتفاع استهلاك السكروز المضاف إليه الكوكايين أو الميثامفيتامين. حددنا متغيرات مهمة في حدود 1 كيلو بايت من الجينات المشروحة وأنشأنا شبكة وراثية مرتبطة بزيادة استهلاك الكوكايين والميثامفيتامين. أظهرنا أن RNAi لعينة من الجينات المرشحة من تحليلات GWA أثرت على استهلاك الكوكايين و / أو الميثامفيتامين لـ 77 ٪ من الجينات المختبرة. تتسبب AIPs الخاصة بنا الخاصة بالأليل وظيفيًا في تداخل الجينات وداخل الجينات المرتبطة باستهلاك المخدرات. وجدنا تباينًا جينيًا واسعًا في إزدواج الشكل الجنسي الكامن وراء البنية الجينية لاستهلاك الكوكايين والميثامفيتامين الطوعيين على مستوى جمعيات GWA ، وبنيات RNAi ، و AIPs الخاصة بالأليل ، بما يتماشى مع الدراسات السابقة التي وثقت مثنوية الشكل الجنسية لسمات استهلاك المخدرات في D. melanogaster (20 ، 36) ، القوارض (37 ، 38) ، والبشر (39).

دراسات سابقة عن تأثيرات الكوكايين والميثامفيتامين في ذبابة الفاكهة ركز بشكل أساسي على التأثيرات السلوكية للطفرات أحادية الجين (40 ، 41). في السابق ، قمنا بتقييم التباين الجيني الطبيعي في سمات استهلاك المخدرات في مجموعة فرعية من خطوط DGRP (20). ومع ذلك ، فإن العدد الصغير للخطوط في تلك الدراسة مكّن فقط من اكتشاف المتغيرات الشائعة ذات التأثيرات الكبيرة. يؤدي استخدام خرائط AIP و xQTL إلى زيادة القوة الإحصائية ومكننا من تحديد 1307 متغيرًا في 988 جينًا مرتبطة بزيادة استهلاك الكوكايين أو الميثامفيتامين ، تم تحديد 209 منها في دراستنا السابقة ، بما في ذلك arr, Eip75B, بوم, توسب, مجرفة 1, Mob2، و كوز (20). يتم إثراء هذه الجينات للعمليات البيولوجية المشاركة في تطوير الجهاز العصبي ، بما في ذلك توجيه المحور العصبي ، وتمديد المحور العصبي ، وتشكل التغصنات ، والتعرف على الهدف المتشابك.

سبق للجينات المرتبطة بتطور الجهاز العصبي أن تورطت في سمات استهلاك المخدرات في الذباب (20). يتم إعادة تلخيص تطور الجهاز العصبي في شبكة التفاعل الجيني التي أنشأناها والتي تتكون من 77 جينًا (الشكل 2).ب) ، والذي يُظهر إثراء مسارات الإشارات التنموية ، بما في ذلك Wnt و Notch و Hippo (Dataset S6). في الفئران ، تلعب إشارات Wnt دورًا في المرونة العصبية التي يسببها الكوكايين (42) وينشط الكوكايين إشارات Notch عن طريق تعطيل الحاجز الدموي الدماغي (43). من بين 77 جينًا في هذه الشبكة ، يحتوي 64 جينًا على طبيب تقويم بشري (DIOPT ≥ 3). يمكننا بناء شبكة تفاعل تتكون من أخصائيي تقويم العظام والجينات المعينة حسابيًا (الشكل 2ج) ، مما يشير إلى الحفظ التطوري للعمليات البيولوجية الأساسية التي تكمن وراء الاختلاف في القابلية للتأثر بالمنشطات النفسية.

اخترنا 22 جينًا مرشحًا لتقييم ما إذا كان RNAi سيؤثر على استهلاك الكوكايين أو الميثامفيتامين. وجدنا أن 17 (77٪) من هذه الجينات أظهرت اختلافًا كبيرًا في استهلاك الكوكايين أو الميثامفيتامين بعد ضربة قاضية لـ RNAi باستخدام محرك ضعيف في كل مكان. قد يكون فشل الجينات المرشحة في إظهار تأثير على استهلاك الدواء عند ضربة قاضية RNAi بسبب التكرار الوظيفي ، وعدم كفاية مدى الضربة القاضية (مع ملاحظة أن مدى ضربة قاضية RNAi لا ترتبط خطيًا بتأثير النمط الظاهري) ، أو قد يكون الجين المرشح إيجابية كاذبة.

يتمثل أحد قيود RNAi في أنه يوفر طريقة تحقق تعتمد على الجينات بدلاً من أسلوب التحقق القائم على SNP ولا يمكن استخدامها لتحديد السببية لـ SNPs بين الجينات ، والتي يكون لبعضها تأثيرات نمطية كبيرة. للتحقق من صحة تعدد الأشكال السببية التي تساهم في التباين في استهلاك الكوكايين والميثامفيتامين ، قمنا ببناء AIPs الخاصة بالأليل لعزل الأليلات البديلة من SNPs المرشحة في خلفيات وراثية عشوائية. قدم هذا طريقة فعالة للتحقق من صحة كل من تعدد الأشكال داخل الجينات وبين الجينات. أظهرت جميع الـ AIPs ، باستثناء واحد ، اختلافات كبيرة في الاستهلاك بين الأليلات البديلة في جنس واحد على الأقل. بالنسبة لمعظم أشكال النيوكلوتايد ، استهلك السكان المحتويون على الأليل "عالي الاستهلاك" ("H") مخدرًا أكثر من السكان الذين لديهم أليل "التحكم" ("C") في جنس واحد على الأقل. ومع ذلك ، في إحدى الحالات ، استهلك السكان المحتويون على الأليل H مخدرًا أقل من الأشخاص الذين لديهم أليل C ، والذي قد يُعزى إلى النزف ، وهي سمة بارزة للسمات المعقدة (44 ، 45).

جميع الجينات الأربعة التي قمنا بالتحقق من صحة المتغيرات الأليلية المرتبطة بالتباين في استهلاك الكوكايين لها أخصائيون في تقويم العظام. ال أحادي التفكير (سيم) يقوم الجين بتشفير عامل النسخ الحلزوني - الحلقي - الحلزوني ، والذي تم تحديده كمنظم إيجابي لتشكيل خط الوسط في الجهاز العصبي المركزي الجنيني (46) ويلعب دورًا في توجيه محور عصبي في دماغ اليرقات (47). ديب زيتا يشفر بروتين Dpr المتفاعل. ال ذبابة الفاكهة يحتوي الجينوم على 21 عضوًا من Dpr عائلة الجينات وتسعة نظائر Paralogs التي تشفر Dpr تفاعل البروتينات. تحتوي هذه البروتينات على مجالات الغلوبولين المناعي ، وتعمل مجموعات مقترنة فريدة من DPRs و DIPs كشركاء متشابكين يعززون الاتصال العصبي (48). Src64B يحدد البروتين السيتوبلازمي التيروزين كيناز ، الذي يساهم في نمو جسم الفطر (49). qless يشفر بروتينًا مشاركًا في تخليق السلسلة الجانبية الأيزوبرينويدية من الإنزيم المساعد Q ، وهو أحد مكونات سلسلة نقل الإلكترون في الميتوكوندريا. الخلايا العصبية qless المسوخ يخضع لضغط الميتوكوندريا وموت الخلايا المبرمج المعتمد على كاسباس (50). تدعم هذه الملاحظات الفكرة القائلة بأن المتغيرات الأليلية لهذه الجينات تؤدي إلى تباين في الاتصال والوظيفة العصبية ، مما يعدل ميلها لاستهلاك المنشطات النفسية.

في الختام ، قمنا بتطوير طريقة لتحديد العلاقة السببية بين الجينات وداخل الجينات في السكان المهجرين. باستخدام هذا النهج بالاشتراك مع RNAi ، أظهرنا أن البنية الجينية الكامنة وراء التباين في استهلاك الكوكايين الطوعي والميثامفيتامين هو ثنائي الشكل الجنسي وتهيمن عليه الجينات المرتبطة بتطور الجهاز العصبي. يمكن تطبيق استخدام AIPs المشتق من DGRP الخاص بالأليل بشكل عام لتحديد السببية لـ SNPs مرشح واحد مرتبط بالتباين في السمات المعقدة. استنادًا إلى الحفظ التطوري للمسارات الخلوية الأساسية ، تم الحصول على النتائج من ذبابة الفاكهة يمكن لنموذج اكتشاف الجينات أن يوجه الدراسات حول قابلية تعاطي المخدرات في البشر.


مراجع

WTCCC: دراسة الارتباط على مستوى الجينوم لـ 14000 حالة من سبعة أمراض شائعة و 3000 عنصر تحكم مشترك. طبيعة سجية. 2007 ، 447: 661-678. 10.1038 / Nature05911.

Heidema AG، Boer JM، Nagelkerke N، Mariman EC، van der A DL، Feskens EJ: التحدي الذي يواجه علماء الأوبئة الجينية: كيفية تحليل أعداد كبيرة من SNPs فيما يتعلق بالأمراض المعقدة. بي ام سي جينيت. 2006، 7: 23-10.1186 / 1471-2156-7-23.

Kooperberg C ، Ruczinski I: تحديد تفاعل تعدد الأشكال باستخدام الانحدار المنطقي لمونت كارلو. جينيه إبيديميول. 2005 ، 28: 157-170. 10.1002 / جيبي .20042.

Motsinger AA ، Ritchie MD: تقليل الأبعاد المتعددة العوامل: استراتيجية تحليل لنمذجة واكتشاف التفاعلات الجينية في علم الوراثة البشرية ودراسات الجينوميات الصيدلانية. همهمة جينوميات. 2006 ، 2: 318-328.

Yoon Y و Song J و Hong S و Kim J: تحليل العديد من الأشكال المتعددة للنيوكليوتيدات المفردة للجينات المرشحة ذات الصلة بقابلية الإصابة بأمراض القلب التاجية باستخدام آلات ناقلات الدعم. كلين كيم لاب ميد. 2003 ، 41: 529-534. 10.1515 / CCLM.2003.080.

المكتب A ، Dupuis J ، Falls K ، Lunetta KL ، Hayward B ، Keith TP ، Van Eerdewegh P: تحديد SNPs التنبؤية للنمط الظاهري باستخدام الغابات العشوائية. جينيه إبيديميول. 2005 ، 28: 171-182. 10.1002 / gepi.20041.

Díaz-Uriarte R، de Andrés Alvarez S: اختيار الجينات وتصنيف بيانات المصفوفات الدقيقة باستخدام الغابة العشوائية. المعلوماتية الحيوية BMC. 2006 ، 7: 3-10.1186 / 1471-2105-7-3.

Glaser B، Nikolov I، Chubb D، Hamshere ML، Segurado R، Moskvina V، Holmans P: تحليلات للعلامة الفردية والتأثيرات الزوجية للمواضع المرشحة لالتهاب المفاصل الروماتويدي باستخدام الانحدار اللوجستي والغابات العشوائية. BMC Proc. 2007, 1 (Suppl 1): S54-10.1186/1753-6561-1-s1-s54.

Lunetta KL, Hayward LB, Segal J, Van Eerdewegh P: Screening large-scale association study data: exploiting interactions using random forests. بي ام سي جينيت. 2004, 5: 32-10.1186/1471-2156-5-32.

Meng YA, Yu Y, Cupples LA, Farrer LA, Lunetta KL: Performance of random forest when SNPs are in linkage disequilibrium. المعلوماتية الحيوية BMC. 2009, 10: 78-10.1186/1471-2105-10-78.

Nonyane B, Foulkes A: Application of two machine learning algorithms to genetic association studies in the presence of covariates. BMC Genetics. 2008, 9: 71-10.1186/1471-2156-9-71.

Sun YV, Cai Z, Desai K, Lawrance R, Leff R, Jawaid A, Kardia SL, Yang H: Classification of rheumatoid arthritis status with candidate gene and genome-wide single-nucleotide polymorphisms using random forests. BMC Proc. 2007, 1 (Suppl 1): S62-10.1186/1753-6561-1-s1-s62.

Breiman L: Random Forests. Machine Learning. 2001, 45: 5-32. 10.1023/A:1010933404324.

Breiman L, Friedman J, Olshen R, Stone C: Classification and Regression Trees. 1984, New York: Chapman & Hall

Breiman L: Bagging Predictors. Machine Learning. 1996, 24: 123-140.

Breiman L: Out-Of-Bag Estimation. 1996, Tech. rep., UC Berkeley

Hastie T, Tibshirani R, Friedman J: Elements of Statistical Learning. 2009, New York: Springer, 2

Genuer R, Poggi JM, Tuleau C: Random Forests: some methodological insights. Tech rep, INRIA. 2008, [http://hal.inria.fr/inria-00340725/en/]

Hafler DA, Compston A, Sawcer S, Lander ES, Daly MJ, De Jager PL, de Bakker PI, Gabriel SB, Mirel DB, Ivinson AJ, Pericak-Vance MA, Gregory SG, Rioux JD, McCauley JL, Haines JL, Barcellos LF, Cree B, Oksenberg JR, Hauser SL: Risk alleles for multiple sclerosis identified by a genomewide study. إن إنجل جي ميد. 2007, 357: 851-862. 10.1056/NEJMoa073493.

Browning SR, Browning BL: Rapid and accurate haplotype phasing and missing-data inference for whole-genome association studies by use of localized haplotype clustering. أنا J Hum Genet. 2007, 81: 1084-1097. 10.1086/521987.

Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, Maller J, Sklar P, de Bakker PI, Daly MJ, Sham PC: PLINK: a tool set for whole-genome association and population-based linkage analyses. أنا J Hum Genet. 2007, 81: 559-575. 10.1086/519795.

Liaw A, Wiener M: Classification and regression by randomForest. Rnews. 2002, 2: 18-22.

Svetnik V, Liaw A, Tong C: Variable selection in random forest with application to quantitative structureactivity relationship. Proceedings of the 7th Course on Ensemble Methods for Learning Machines. Edited by: Intrator N, Masulli F. Springer-Verlag

Oksenberg JR, Barcellos LF: Multiple sclerosis genetics: leaving no stone unturned. Genes Immun. 2005, 6: 375-387. 10.1038/sj.gene.6364237.

Strobl C, Boulesteix AL, Zeileis A, Hothorn T: Bias in random forest variable importance measures: illustrations, sources and a solution. المعلوماتية الحيوية BMC. 2007, 8: 25-10.1186/1471-2105-8-25.

Pearson TA, Manolio TA: How to interpret a genome-wide association study. جاما. 2008, 299: 1335-1344. 10.1001/jama.299.11.1335.

Australia, Consortium NZMSG: Genome-wide association study identifies new multiple sclerosis susceptibility loci on chromosomes 12 and 20. Nature Genetics. 2009, 41: 824-828. 10.1038/ng.396.

Ward GR, Franklin SO, Gerald TM, Dempsey KT, Clodfelter DE, Krissinger DJ, Patel KM, Vrana KE, Howlett AC: Glucocorticoids plus opioids up-regulate genes that influence neuronal function. Cell Mol Neurobiol. 2007, 27: 651-660. 10.1007/s10571-007-9151-3.

deJager PL, Jia X, Wang J, deBakker PIQ, Ottoboni L, Aggarwal NT, Piccio L, Raychaudhuri S, Tran D, Aubin C, Briskin R, Romano S, IMSGC : Meta-analysis of genome scans and replication identify CD6, IRF8 and TNFRSF1A as new multiple sclerosis susceptibility loci. علم الوراثة الطبيعي. 2009, 41: 776-782. 10.1038/ng.401.

Morgan AR, Hamilton G, Turic D, Jehu L, Harold D, Abraham R, Hollingworth P, Moskvina V, Brayne C, Rubinsztein DC, Lynch A, Lawlor B, Gill M, O'Donovan M, Powell J, Lovestone S, Williams J, Owen MJ: Association analysis of 528 intra-genic SNPs in a region of chromosome 10 linked to late onset Alzheimer's disease. Am J Med Genet B Neuropsychiatr Genet. 2008, 147B: 727-731. 10.1002/ajmg.b.30670.

Wider C, Lincoln SJ, Heckman MG, Diehl NN, Stone JT, Haugarvoll K, Aasly JO, Gibson JM, Lynch T, Rajput A, Rajput ML, Uitti RJ, Wszolek ZK, Farrer MJ, Ross OA: Phactr2 and Parkinson's disease. نيوروسسي ليت. 2009, 453: 9-11. 10.1016/j.neulet.2009.02.009.

van Roon JA, Lafeber FP: Role of interleukin-7 in degenerative and inflammatory joint diseases. Arthritis Res Ther. 2008, 10: 107-10.1186/ar2395.


المواد والأساليب

Patients and the Clinic Trial

Patients in this study were recruited to the SUCCESS-A trial (ClinicalTrials.gov Identifier: NCT02181101), a randomized Phase III study of response to the treatment of early primary breast cancer with adjuvant therapy after surgical resection (Rack et al., 2014 Widschwendter et al., 2015). All patients initially received three cycles of epirubicin, 5-fluorouracil (5-FU), and cyclophosphamide. Patients were then randomized to either receive three cycles of either gemcitabine in addition to docetaxel or docetaxel alone. A second randomization consisted of zoledronate at the conclusion of treatment for either 2 or 5 years. This trial recruited 3754 patients over 18 months in 251 medical centers in Germany, and accrual ended in March 2007. The main study and all pre-specified translational research projects, including the one reported here, were approved by all of the responsible ethics committees and were conducted in accordance with the Declaration of Helsinki. This study was also reviewed and approved by the Mayo Clinic Institutional Review Board. All patients gave written informed consent.

Case Definition for Neutropenia and GWAS

Cases were defined as patients who had at least one of the following events: leukopenia, neutropenia or febrile neutropenia, during cycles one to three of chemotherapy with epirubicin, 5-fluorouracil (5-FU), and cyclophosphamide. Cases were required to meet the toxicity level of Grade 3 or 4 based on the National Cancer Institute (NCI)’s Common Terminology Criteria for Adverse Events v3.0. A total of 1648 patients fulfilled the criteria for cases. Other patients served as controls for the GWAS analysis. Patient DNA samples were genotyped on the Illumina HumanOmniExpress-12v1 G FFPE array (Illumina, San Diego, CA, United States). After remove of 5 related patients and 9 patients who were non-Caucasian (Asian), a total of 3,252 patients (1,635 controls vs. 1,617 cases) who passed QC for genotyping and whose covariate information (Supplementary Table S1) was available were included in the GWAS analysis. Imputation was performed based on 1000 Genomes Project data (Howie et al., 2012). Genotyped SNPs which had a ص-value < 1.0E-05 in the initial GWAS were used as input SNPs to perform imputation. Genotyping and imputation are described in detail in the Supplementary Methods. Data that were generated in the SUCCESS-A trial, including genotype and clinical phenotype data, as well as a further descriptions of materials can be found in the NCBI database of Genotypes and Phenotypes (dbGaP Study Accession: phs000547.v1.p).

Selection of Pathways, Genes and SNPs

Genes involved in pathways of (1) the pharmacokinetics (PK) and pharmacodynamics (PD) for the chemotherapeutic drugs used in the SUCCESS-A trial, cyclophosphamide, epirubicin and 5-FU were included in this analysis. These candidate genes were identified using the PharmGKB database 1 . Genes involved in the PK/PD of doxorubicin, an analog of epirubicin, were selected because epirubicin is not included in the PharmGKB. (2) Pathways that were shown to be aberrant in breast cancer according to The Cancer Genome Atlas (TCGA) data were included in the analysis (The Cancer Genome Atlas Network, 2012). Those pathways were the PI3K, mTOR, p53, apoptosis, and checkpoint signaling pathways. Genes in these pathways were identified using the Kyoto Encyclopedia of Genes and Genomes (KEGG) database (Kanehisa and Goto, 2000). (3) The PAM50 genes which have been shown to be effective in predicting disease prognosis (Nielsen et al., 2010) were also included. (4) Finally, genes studied in our laboratory shown to be functionally relevant in the AKT/mTOR signaling pathways in chemotherapy response (Pei et al., 2009 Hou et al., 2014 Yu et al., 2017) and toxicity (Ingle et al., 2010) were also added to the analysis.

SNPs within 50 kb up- and down-stream, and across the selected genes as described above were included in this analysis. SNPs that were located > 50 kb away from a gene might also affect gene transcription and function. Those SNPs will be overlooked in this study. Genotyping information for SNPs in those pathway genes in the SUCCESS-A patients was obtained from our GWAS genotyping data. Imputation was performed based on 1000 Genomes Project data (Howie et al., 2012). See Supplementary Methods for details.

Association of SNPs With Neutropenia

The analysis for association of SNPs with neutropenia was based on conditional logistic regression to account for the matched design. SNP genotypes were coded as additive effects on the log OR by coding 0, 1, or 2 for the minor allele count. A likelihood ratio test with one degree of freedom for each SNP was then determined. The primary covariates (Supplementary Table S1) used to match cases and controls were controlled in the conditional logistic regression. Association analyses were performed in R 2 , SAS (SAS Institute Inc.) and PLINK. Logistic regression models were used to calculate Odds ratios (ORs), 95% confidence intervals (CIs), and ص-values, following corrections for multiple testing.

EQTL Analysis

Single-nucleotide polymorphisms of interest that were associated with neutropenia were further subjected to expression quantitative trait loci (eQTL) analysis using our lymphoblastoid cell line (LCL) data sets, which have been described in detail in our previous studies (Li et al., 2008, 2014 Niu et al., 2010 Matimba et al., 2014 Liu et al., 2017). The Human Variation Panel of LCLs from 96 European-American (EA), 95 African-American (AA), and 96 Han Chinese-American (HCA) healthy subjects were obtained from the Coriell Institute. Those LCLs are B-lymphocytes that were immortalized by Epstein Barr Virus (EBV) infection. Genome-wide genotype data and mRNA expression data for these LCLs have been generated in our laboratory by using the Illumina 550K and 510S SNP BeadChips (Illumina, San Diego, CA, United States), and the Affymetrix Human Genome U133 Plus 2.0 GeneChip arrays (Affymetrix, Santa Clara, CA, United States), respectively. Genotype and gene expression data were deposited in the National Center for Biotechnology Information Gene Expression Omnibus (GEO accession: GSE23120). Expression array data were normalized on a log2 scale using GCRMA (Wu et al., 2004). The normalized expression data were then regressed on gender. Partial Pearson correlations were used to quantify the association between SNPs and mRNA expression. Since the LCLs were from multiple races/ethnic groups, before completing the genetic association analysis, population stratification was assessed using the method developed by Price et al. (2006) as described in detail previously (Niu et al., 2010). These partial correlations were tested using a Wald test. False discovery ف-values (Storey and Tibshirani, 2003) were also computed for each test.

Cell Culture and Cytotoxicity Assays

Lymphoblastoid cell lines were cultured in RPMI 1640 media containing 15% fetal bovine serum (FBS). The human promyelocytic leukemia cell line, HL-60, was obtained from the American Type Culture Collection (ATCC, Manassas, VA, United States), and was cultured in RPMI 1640 media containing 10% FBS. Epirubicin (EPI) was purchased from Santa Cruz Biotechnology, Inc. (Santa Cruz, CA, United States). Mafosfamide (MFF) was purchased from Toronto Research Chemicals Inc. (Toronto, Canada). MFF can spontaneously decompose to 4-hydroxy-cyclophosphamide, the active metabolite of cyclophosphamide, when added in culture media (Mazur et al., 2012). Fluorouracil (5-FU) was purchased from Sigma-Aldrich (St. Louis, MO, United States). Cytotoxicity assays with LCLs and HL-60 cells were performed with the CellTiter 96 ® Aqueous Non-Radioactive Cell Proliferation Assay (Promega Corporation, Madison, WI, United States) in 96 well plates (Corning, Corning, NY, United States) at a density of 5 × 10 5 cells/mL (100 μL/well). 10 μL of 5-FU (500𠄰.01 μM), epirubicin (10𠄰.0005 μM), or mafosfamide (100𠄰.005 μM) were added into the wells and incubated at 37ଌ for 72 h. Plates were then added with 20 μL of MTS buffer and read in an Infinite M1000 PRO plate reader (Tecan AG, Switzerland) after incubation for 3 h. Relative cell viability was then plotted against drug concentration to derive a cytotoxicity curve. Experiments were independently repeated at least twice with triplicate wells for each treatment. مستقل ر-test was used to determine statistical significance.

MRNA Quantification

Messenger RNA levels were quantified by quantitative reverse transcription PCR (qRT-PCR) using Power SYBR TM Green RNA-to-CT TM 1-Step Kit (Applied Biosystems Inc., Foster City, CA, United States). Total RNA was extracted from cells by the RNeasy Plus Mini Kit (QIAGEN, Germany). A total of 100 ng of total RNA was used for each reaction. Specific primers for TNFSF13B mRNA were purchased from Integrated DNA Technologies (Coralville, IA, United States). The qRT-PCR reaction was performed using the Stratagene Mx3005P Quantitative Real-Time PCR detection system (Agilent Technologies, Santa Clara, CA, United States). Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) was used as an internal control.

TNFSF13B KD and Ligand Treatment for Cytotoxicity Assays

LCLs and HL-60 cells were incubated at a density of 1 × 10 6 cells/mL in RPMI 1640 with 5% charcoal-stripped FBS for 24 h followed by serum free medium for an additional 24 h. ل TNFSF13B KD, cells were transfected with negative control and TNFSF13B siRNAs (Dharmacon, Lafayette, CO, United States) separately, and incubated in RPMI 1640 with 5% charcoal-stripped FBS overnight before cytotoxicity assay. For TNFSF13B ligand (BAFF) treatment, recombinant human BAFF (Cell Signaling Technology, Danvers, MA, United States) reconstituted in PBS containing 200 μM dithiothreitol (DTT) and 0.02% bovine serum albumin was added to the cell culture media at a final concentration of 1 μg/mL and were incubated for 24 h. Vehicle treatment that included DTT and BSA but without BAFF was performed as control. After KD and BAFF treatment, cytotoxicity assays were performed as describe above. Experiments were repeated independently three times.


Genome-Wide Association Studies and Beyond

From the Georgia Prevention Institute (X.W., H.S.), Department of Pediatrics, Medical College of Georgia, Augusta, Ga Unit of Genetic Epidemiology and Bioinformatics (H.S.), Department of Epidemiology, University Medical Center Groningen, University of Groningen, Groningen, the Netherlands.

From the Georgia Prevention Institute (X.W., H.S.), Department of Pediatrics, Medical College of Georgia, Augusta, Ga Unit of Genetic Epidemiology and Bioinformatics (H.S.), Department of Epidemiology, University Medical Center Groningen, University of Groningen, Groningen, the Netherlands.

أنت تشاهد أحدث نسخة من هذه المقالة. الإصدارات السابقة:

In spite of recent successes for other complex diseases, essential hypertension has been remarkably reluctant to reveal its underlying susceptibility genes through genome-wide association (GWA) studies. Only after shifting attention to the underlying quantitative traits (ie, systolic [SBP] and diastolic blood pressure [DBP]) and application of “brute force” GWA meta-analyses (n>29 000) of multiple population cohorts in the GlobalBPGen and CHARGE consortia was a tiny tip of the iceberg revealed. 1,2 Six loci for SBP and 9 for DBP were discovered, of which 2 overlapped, yielding 13 independent genome-wide significant signals. However, without exception, the most significant single nucleotide polymorphisms (SNPs) representing these loci only explained a very small part of the total BP variance (≤0.11% Figure). Heritability is well established for BP and typically ranges between 30% and 60%, as estimated in twin or family studies. 3 This means that the majority of the BP heritability is still “missing” and remains at large. 4 Expansion of GWA sample size (eg, in the International Consortium on BP-GWAS, a merger of GlobalBPGen and CHARGE) will likely uncover additional BP variants. 5 However, they will have even smaller effect sizes, and a substantial increase in explained heritability of all loci combined is not expected. GWA studies in general experience a number of other inherent limitations, including a predominant focus on common variants (minor allele frequency: >5%) and a tendency for signals to map to noncoding sequence. Finding suitable answers to these challenges will to a large extent determine continued progress in chipping away at the missing BP heritability. The article by Tomaszewski et al 6 in the present issue of ارتفاع ضغط الدم provides some intriguing clues as to the best way forward.

شكل. A, Percentage of variance explained in SBP by the top SNPs of 6 loci identified in 2 large GWA meta-analysis studies. 1,2 B, Percentage of variance explained in DBP by the top SNPs of 9 loci identified in 2 large GWA meta-analysis studies. 1،2

We Should Find the Causal Variants

Tomaszewski et al 6 used a custom-made gene-centric array with >30 000 common and rare SNPs from >2000 candidate loci to genotype 2020 European individuals from 520 nuclear families of the Genetic Regulation of Arterial Pressure of Humans in the Community Study with measures of 24-hour ambulatory BP available. A strong association with 24-hour DBP was found for an SNP (rs13306560) in the MTHFR/CLCN6/NPPB locus and subsequently replicated for clinic DBP in 2 additional cohorts (n>6000). Interestingly, a different SNP in the same locus was identified in the recent GWA studies for clinic BP (Figure). 1,2 However, conditional analysis including both SNPs in the same model suggested that the association with 24-hour DBP is largely driven by the newly identified SNP. Additional bioinformatic analysis indicates a potential direct functional effect of rs13306560 (see also below). This finding illustrates an important limitation of GWA studies: genome-wide significant SNPs often merely tag but do not provide direct information on the causal variants. Fine mapping BP loci through sequencing and/or custom-made chip approaches will be required, not only to get a better estimate of the true (most likely larger) effect on the phenotype, but also to translate those signals to biological function.

We Should No Longer Focus on the Usual Suspects

A total of 105 candidate genes for BP with very good genetic coverage of common variants were present on the array tested by Tomaszewski et al. 6 In spite of this, very little evidence was found for involvement of these most frequently investigated candidate genes for BP, such as those for the sympathetic nervous system and the renin-angiotensin system. These results are in line with those from the recent GWA studies, in which only 2 of the 13 gene loci discovered could have been regarded as candidate gene loci for BP (MTHFR and CYP17A1). 5 Does this mean that we have been betting on the wrong horses for all these years? At least for common variants, the current evidence indeed seems to indicate that we may have more success if we start looking beyond the classic systems of BP regulation. Additional bioinformatic analysis by Tomaszewski et al 6 indicates that signaling pathways that control cell survival may be one promising direction. It may be too early to entirely dismiss our beloved candidate genes, however. Future (meta-analytic) studies with larger sample sizes and exhaustive coverage of both common and more rare variants would be necessary for a more balanced evaluation of the evidence.

Low-Frequency/Rare Variants Are Important

Discoveries of GWA studies are inherently limited to common variants as a result of array design. Rare variants may, therefore, represent an important source of missing heritability. 7 Interestingly, Tomaszewski et al 6 found a significant overrepresentation of rare variants among polymorphisms showing at least nominal association with mean 24-hour BP. These results did not depend on the threshold of rare variant definition (minor allele frequency <5% or minor allele frequency <2%), significance level (ص<0.05 or ص<0.01), or the phenotype (24-hour SBP or DBP). Although these results indicate that a considerable proportion of its heritability may be explained by low-frequency variants, the overrepresented rare variants did not lead to amino acid substitutions pointing to more subtle regulatory mechanisms. Sample size is of the essence for reliable identification of individual rare variants contributing to BP, emphasizing the need for large meta-analyses of exactly the type of custom-made array used in the current study.

We Should Expand the Search From Clinic to Ambulatory BP

Ambulatory BP monitoring offers a number of advantages over clinic BP readings, including the ability to measure BP in real-life settings, track BP at night, and avoid the “white-coat” phenomenon. The added value of ambulatory BP measurements has been illustrated by studies showing that ambulatory BP is a better predictor of target organ damage and cardiovascular morbidity and mortality than BP measured in the clinic. The higher heritability of mean 24-hour compared with clinic BP measurements 6 suggests that 24-hour BP monitoring may be particularly informative for gene discovery. However, we need to realize that different genes or sets of genes may contribute to BP regulation under different conditions. Our recent studies in twins showed that not only daytime and nighttime BP are influenced by partly different genes, 8 the genes underlying mean 24-hour BP also differ from those for clinic BP to a large extent. 9 Only 45% of the 24-hour SBP heritability and 49% of the 24-hour DBP heritability could be attributed to genes that also influenced clinic levels. These findings indicate that, to take full advantage of ambulatory BP recordings in gene-finding studies, they need to be used in both discovery and replication cohorts. In other words, GWA meta-analyses of ambulatory BP cohorts are urgently needed. Such studies will not only elucidate similarities and differences in genetic architecture with clinic BP but will also provide new insights into the mechanisms of BP regulation at night (including nocturnal BP fall) 8 and in real-life settings.

Beyond the DNA Sequence: Epigenetics

Several epidemiological and clinical peculiarities of essential hypertension, such as the incomplete concordance between monozygotic twins (ranging from 38% to 52%), and its late onset and progressive nature are difficult to fully explain with traditional DNA sequence-based approaches. These observations may point to the involvement of epigenetic factors in hypertension development. Although epigenetics refers to all meiotically and mitotically heritable changes in gene expression that are not coded in the DNA sequence, epigenetic profiles are still affected by genetic variants to a certain extent. For example, DNA sequence variations could make certain loci more or less attractive to methylation. A recent study shows that ≈0.16% of SNPs in the human genome are associated with allele-specific methylation changes. 10 The rs13306560 SNP identified in this study is a good example. It maps to a CpG island in the MTHFR/CLCN6 promoter with evidence of operation of selective pressure throughout mammalian evolution. One possible mechanism by which rs13306560 could, therefore, mediate the association with BP is through differential methylation of the MTHFR/CLCN6 promoter in the 2 alleles. Because methylation changes resulting from variations in DNA sequence can be discovered in genetic studies, they cannot be considered a source of missing heritability. In contrast, vertically transmitted DNA-independent epigenetic markers may contribute to the BP heritability that is still missing. Although it is well known that, during gametogenesis epigenetic reprogramming takes place, which consists of the removal of practically all methylation from the cell, some epigenetic signals can escape this process and are transmitted across generations. Recent advances in automated high-throughput array-based measurement have now made genome-wide methylation studies possible. Such studies are urgently needed not only to identify these epigenetic variants that might contribute to the missing heritability but, perhaps even more importantly, those that mediate differential gene expression resulting from environment influences.

The success of GWA studies has revolutionized the genetics of complex traits and diseases. However, the genetic architecture of BP regulation and essential hypertension has proved even more challenging than other complex traits and diseases, with most of the heritability still missing. 4 As illustrated by Tomaszewski et al, 6 future studies in BP genetics need to both build on and move beyond the successes of GWA studies to make continued progress.

الآراء الواردة في هذه المقالة الافتتاحية ليست بالضرورة آراء المحررين أو جمعية القلب الأمريكية.


After this review was written, a GWAS of the maize bacterial phyllosphere was published. Wallace وآخرون. ( 2018 ) sequenced 16S transcripts from 300 maize genotypes grown in a common field environment, and they used these data to estimate dozens of community diversity indices, the relative abundance of hundreds of OTUs, and the representation of thousands of predicted metabolic functions in community metagenomes for each leaf sample. A few percent of the metrics in each of these three categories were heritable, many of which appeared to be driven largely by variation in the abundance of Methylobacteria. Intriguingly, functions related to the metabolism of short-chain carbon molecules were overrepresented, offering the hypothesis that these bacterial metabolic traits may be an important part of the causal link between plant genotype and phyllosphere community composition. However, GWAS identified few significant associations with these traits, and consequently did not reveal which plant genes or traits most strongly influence phyllosphere composition in maize. This study illustrates both the wealth of insight that can be gleaned from GWAS of the phyllosphere, particularly when moving beyond bacterial taxonomy by focusing on metagenomic features, but also the difficulty in uncovering the links between plant genes and phyllosphere community composition in field environments. We eagerly await the future studies that extend the approaches of Horton وآخرون. ( 2014 ) and Wallace وآخرون. ( 2018 ) to larger collections of plant genotypes and additional species, more powerful tools for quantifying the taxonomic and functional composition of microbial communities, and powerful multi-trait GWAS methods in hopes of overcoming this challenge.

الكتاب تعلن أي تضارب في المصالح.

اسم الملف وصف
tpj14170-sup-0001-MethodsS1.docxWord document, 135.1 KB Method S1. Methods used to generate Figure 2 are reported in Methods S1.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


شاهد الفيديو: SNP vs Mutation and Genetic Tests (يونيو 2022).


تعليقات:

  1. Yojora

    بيننا ، طلبوا مني المساعدة من مستخدمي هذا المنتدى.

  2. Beagan

    أنا أعتبر، أنك لست على حق. دعنا نناقش. اكتب لي في PM.

  3. Wadsworth

    وظيفة موثوقة :) ، مفيدة ...

  4. Dorn

    أعتقد أنك سوف تسمح للخطأ. أدخل سنناقش. اكتب لي في PM ، وسوف نتعامل معها.

  5. Tera

    أنا أقبل ذلك بسرور. السؤال مثير للاهتمام ، سأشارك أيضًا في المناقشة.



اكتب رسالة