Method Article
والهدف من هذا البروتوكول هو وضع مرجع للبروتينات المختلفة في مجموعة التي تفتقر إلى معايير متسقة للتسمية والتصنيف. هذا المرجع سوف تيسر تحليل ومناقشة للمجموعة ككل ويمكن استخدامها بالإضافة إلى أسماء ثابتة.
البروتينات ذات الصلة التي درست في مختبرات مختلفة باستخدام الكائنات المختلفة قد تفتقر إلى نظام موحد للتسمية والتصنيف، مما يجعل من الصعب مناقشة المجموعة ككل ووضع تسلسل جديد في السياق المناسب. وضع إشارة أن يعطي الأولوية لميزات تسلسل هامة تتعلق بهيكل و/أو يمكن استخدام النشاط بالإضافة إلى أسماء ثابتة لإضافة بعض الاتساق إلى مجموعة متنوعة من البروتينات. يستخدم هذا الورق سيستين استقرت فوق (CS-αβ) الحلزون ألفا عائلة كمثال لإظهار كيف مرجع الذي تم إنشاؤه في برنامج جدول بيانات يمكن توضيح العلاقات بين البروتينات الموجودة في فوق عائلة، فضلا عن تسهيل الإضافة جديدة تسلسل. ويبين أيضا كيف يمكن أن تساعد الإشارة صقل تسلسل التحالفات التي تم إنشاؤها في برامج شائعة الاستخدام، مما يؤثر في صحة تحليلات النشوء والتطور. استخدام مرجع سيكون مفيداً للغاية للبروتين المجموعات التي تتضمن متواليات متباينة جداً من مجموعة واسعة من الأصناف، مع الميزات التي لم يتم التقاطها بشكل كاف بالتحليلات الجزيئية على الأرجح.
يجب أن تعكس اسم البروتين خصائصها وعلاقتها بغيرها من البروتينات. ولسوء الحظ، يتم تعيين أسماء عموما في وقت اكتشاف، ويستمر البحث، قد تغير فهم السياق الأوسع. وهذا يمكن أن يؤدي إلى أسماء متعددة إذا كان بروتين بشكل مستقل وحددت أكثر من مختبر، والتغييرات في التسمية أو في خصائص الفكر أن تكون نهائية عند تعيين الاسم، واسم التفريق لم يعد بما فيه الكفاية البروتين من الآخرين.
ديفينسينس اللافقاريات تقدم مثالاً جيدا للانحطاط في التسمية والتصنيف. أبلغ defensins اللافقارية أول من الحشرات، واقترح اسم "حشرة ديفينسين" استناداً إلى التماثل المتصورة للثدييات ديفينسينس1،2. ديفينسين الأجل يزال يستخدم، على الرغم من أن من الواضح الآن أن defensins اللافقاريات والثدييات لا نشاطر جد مشترك3،4. تبعاً للأنواع، قد اللافقاريات "ديفينسين" سيستينيس ستة أو ثمانية (التي تشكل ثلاثة أو أربعة سندات ثنائي كبريتيد) ومجموعة متنوعة من الأنشطة المضادة للميكروبات. إلى تعقيد الوضع، البروتينات مع نفس الخصائص كما تسمى "ديفينسينس،" ليس دائماً defensins مثل كريميسينس التي تم تحديدها مؤخرا من ريماني كاينورهابديتيس5. وباﻹضافة إلى ذلك، اللافقاريات ديفينسينس كبيرة من المرجح أن تقحم تتصل بالفقاريات β-ديفينسينس من ديفينسينس اللافقاريات الأخرى6. وبالرغم من ذلك، في بعض الأحيان الباحثين الاعتماد على الاسم "ديفينسين" عند تحديد تسلسلات التي ينبغي أن تدرج في تحليل.
كشفت دراسات الهيكلية التشابه بين ديفينسينس الحشرات و السموم العقرب7، وإضعاف CS αβ أنشئ فيما بعد كسمة مميزة الهيكلي للحشرات ديفينسينس8. إضعاف هذا يعرف العقرب مثل السمية (CS-αβ) فوق عائلة في تصنيف البروتينات الهيكلية (SCOP) قاعدة بيانات9، التي تضم حاليا الأسر الخمس: defensins الحشرات والسموم العقرب سلسلة قصيرة والسموم العقرب سلسلة طويلة، 1 مليون جالون يوميا (من الرخوي)، ومصنع ديفينسينس. هذا فوق عائلة مرادف لوصف مؤخرا رابطة الدول المستقلة-ديفينسينس4 وفوق عائلة 3.30.30.10 في10،11قاعدة بيانات ثلاثية الأبعاد قسطرة/الجينات. دراسات من مجموعة متنوعة من الأنواع اللافقارية والنباتات والفطريات وتظهر أن أسماء البروتينات التي تحتوي على إضعاف هذا لا وضوح تتصل بعدد سيستين أو نمط الترابط، ونشاط مضادات الميكروبات، أو التاريخ التطوري12.
الافتقار إلى الاتساق ومعايير واضحة تجعل من التحدي لتسمية وتصنيف تسلسل المحددة حديثا في هذا فوق عائلة. يشكل عقبة رئيسية أمام مقارنة البروتينات في هذا فوق عائلة هو أن يتم ترقيم سيستينيس فيما يتعلق بكل فردية التسلسل (سيستين الأولى في كل تسلسل C1)، مع عدم وجود طريقة لحساب الدور الهيكلي. وهذا يعني أنه يمكن مقارنة تسلسل فقط مع نفس العدد من سيستينيس. وهناك القليل حفظ تسلسل خلاف سيستينيس تشكيل إضعاف CS αβ، مما يجعل من الصعب التحالفات وتحليلات النشوء والتطور. بوضع نظام ترقيم الذي يعطي الأولوية للسمات الهيكلية، يمكن بسهولة أكثر مقارنة تسلسل فوق عائلة والانحياز. ميزات مصانة، فضلا عن تلك التي تحدد فئات فرعية، يمكن تصور بسرعة، وتسلسل جديد يمكن وضعها بسهولة أكبر في السياق المناسب.
تستخدم هذه الورقة برنامج جدول بيانات (مثل Excel) لتوليد إشارة ترقيم نظام لفوق عائلة CS αβ. ويبين كيف هذا يوضح المقارنات بين متواليات ويطبق على تسلسلات CS-αβ الجديدة المحددة من تارديجراديس. استخدام فوق عائلة αβ CS--على سبيل مثال، كتب في البروتوكول لتوفير التوجيه عند استخدام تسلسل اهتمام؛ ومع ذلك، فليس المقصود على وجه التحديد هذا فوق عائلة أو تسلسلات سيستين الغنية. هذا الأسلوب سيكون على الأرجح الأكثر فائدة لمجموعات من البروتينات التي قد تم بحثها بشكل مستقل في الأنواع المختلفة و/أو لديها القليل من عموما تسلسل التماثل، مع خصائص منفصلة قد لا يسهل التعرف عليه بواسطة برنامج التحليل الجزيئي. يتطلب هذا الأسلوب بعض القرارات مسبقاً فيما يتعلق بالميزات الهامة، حيث أنها ستكون ذات فائدة محدودة إذا تم تحديد لا من السمات الهامة. والهدف الأساسي لإظهار كيف يمكن أن يتحقق تصور بسيط لعلاقات التسلسل. يمكن ثم استخدام هذا لإعلام تسلسل المحاذاة وتحليل، ولكن إذا كانت المحاذاة وتحليل الأهداف الأولية، طريقة باركود سيكون بديل مناسب له قدرة أكبر لأتمتة13. الطريقة الحالية لعرض ميزات كل الببتيد في شكل خطي، حيث أنها لن تكون مفيدة للتصور مباشرة من بنية ثلاثية الأبعاد.
1-تحديد "ملامح تعريف" مجموعة البروتين الفائدة
2. جمع "متواليات ذات الصلة"
3. توليد إشارة في على "جدول البيانات تستند" أهمية الميزات أن حددت
4. استخدم الإشارة إلى "صقل التحالفات من الأحماض الأمينية"
ملاحظة: هناك العديد من البرامج التي يمكن استخدامها للتحالفات تسلسل متعددة، ولكن هذه المظاهرة سوف تستخدم "التحليل علم الوراثة الجزيئي التطورية" (MEGA6) 19 لأنها متوفرة للتحميل مجاناً-
5. مقارنة "الفئات المحددة استخدام" المرجع مع النتائج من "تحليلات النشوء والتطور"
يتم عرض مجموعات من تسلسل في فوق عائلة CS αβ ذكرت في الأدبيات في الشكل 4. وتوحي الازدواجات سيستين تستند إلى الترقيم لكل تسلسل المجموعات الخمس الأساسية (الجدول 1، العمود الأوسط). وقد المجموعة 1 سيستينيس الستة التي من ثنائي كبريتيد ثلاثة سندات ويشمل تسلسل من الحشرات والعناكب والرخويات، والديدان الخيطية والفطريات. لدى المجموعات 2 و 3 و 4 سيستينيس 8 التي تشكل أربعة ثنائي كبريتيد السندات. وتشمل المجموعة 2 عنكبوتى، والحشرات، وتسلسل النبات؛ وتشمل المجموعة 3 عنكب والرخوي وتسلسلات السلكية؛ وتضم المجموعة 4 متواليات من اللاسعات، أننيليدس، والرخويات، والفطريات. وتضم المجموعة 5 ماسينس سيستئين 10. بعض متواليات لا تتناسب تماما مع هذه الأنماط ولكن عموما أقرب إلى مجموعة واحدة من الآخرين.
المجموعات 1 و 2 ويبدو أن حصة السندات هما: C2-C5 و C6-C3؛ ومع ذلك، بداية ترقيم كل تسلسل مع به سيستين الأولى لا تعترف الإطار الهيكلي للسندات. C2-C5 في المجموعة 1 تسلسل أشكال أحدهما سندات في عزر CSH، بينما C2-C5 في تسلسل المجموعة 2 أشكال السندات النهائية اللازمة لتحقيق الاستقرار في حظيرة CS αβ. هو السند مثلى للمجموعة 1 C2-C5 C3 Group2-C6، التي ليس من الواضح من الترقيم. كما ليس من الواضح أن السندات C2-C6 في المجموعة 3، يلعب نفس الدور الهيكلي.
استخدام تسلسلات من الأدب إنشاء مرجع مع مجموعة من عشرة سيستينيس. عزر CSH يتكون من سندات C3 C8 و C4-C9، مع C2-C6 إنجاز حظيرة CS αβ. إعادة ترقيم أزواج سيستين استناداً إلى الأرقام المرجعية يوضح الروابط موجودة في كل تسلسل (الجدول 1، العمود الأيمن). من الواضح الآن أن جميع التسلسلات C2-C6 و C3-C8 C4-C9، مما يعكس إضعاف الهيكلية التي تعرف فوق عائلة. يسمح استخدام مرجع للمقارنة سهلة بين تسلسلات التي لها التسمية لا تتفق ومعايير تصنيف غامضة. يمكن أيضا أن يساعد على تحديد الميزات التي تقوم بتعريف مجموعة فرعية تسلسل. على سبيل المثال، قد تميز بوند C1 C7 ماسينس من أعضاء فوق عائلة أخرى، يجعلها مناسبة لتصنيف تسلسل مع هذه السندات ك "ماسينس" بدلاً من "ديفينسينس" (الجدول 1 و الشكل 4).
وكشف البحث في قواعد البيانات على شبكة الإنترنت العامة أمثال متواليات ستة عشر من تارديجراديس التي لديها وضوح CS-αβ، ثمانية من كل من دوجارديني هيبسيبيوس و تارديجرادوم ميلنيسيوم. أربعة من تسلسلات جديدة قد سيستينيس ستة وتسعة على ثمان، واحد لديه تسعة واثنين بعشرة. وهذا يعطي معلومات ضئيلة جداً، ولكن بمحاذاة التسلسلات للإشارة، يصبح من الواضح أن تسلسل تارديجرادي مع نفس العدد من سيستينيس لا تملك دائماً سيستينيس هيكلياً هاما في نفس المكان ضمن التسلسل ( 5 الرقم و الرقم 6). المحاذاة مع الإشارة يسمح أيضا للاستدلال من الترابط وأنماط (الجدول 2، الاستدلال على أنماط الترابط بين قوسين). ومن الواضح بعض التسلسلات tardigrade تناسب أنماط 1-4. البعض الآخر معظم مماثلة للجد البكتيرية المقترحة أو العقرب Cl-السمية أو عائلة من الفطريات مثل ديفينسين الببتيدات. قد يكون نمط 2 فريقين فرعيين، واحد يمثلها العقرب Na + السموم، دروسوميسين، ومصنع ديفينسينس، والأخرى بالعقرب Cl-السموم. يلزم المزيد من العمل تحقق وظيفة البروتينات تارديجرادي لتحديد إذا كان ينبغي أن يعتبر بعض السموم بدلاً من ديفينسينس.
كثيرا ما تستخدم تحليلات النشوء والتطور لدراسة كيفية قد تطورت مجموعة من البروتينات. التسلسل في فوق عائلة CS αβ قصيرة عموما ومتباينة جداً؛ غالباً ما تكون سيئة تحل الأشجار الناتجة عن ذلك وتقديم القليل من التبصر. كانت الأشجار مل والنظرية الافتراضية لمجموعة فرعية تسلسل تحليل هنا سيئة حلها، مع انخفاض الدعم للعديد من أطوار (الشكل 10، التكميلية الملفات 1-4). أنها ممارسة شائعة لإظهار مستويات bootstrap أكثر من 70 (أو الاحتمالات الخلفي على 0.7) فقط، ولكن الرقم 10 يحتفظ بجميع الأرقام لإظهار مستويات منخفضة عموما لدعم. تم دعم المجموعات الخمس أعلاه 70/0.7 في واحد على الأقل من الأشجار هما: (أ) ج 6 والسم عقرب ج 8؛ (ب) ماسينس؛ (ج) القراد والعقرب ديفينسينس؛ (د) النبات ديفينسينس؛ و defensins (ه) ج 6 من الحشرات والعناكب والرخويات. في الشجرة، ومل ه طور يشمل أيضا السم ج 8 و 8 ج ديفينسين تارديجرادي، ولكن الدعم كان منخفضا جداً (الشكل 10A). بشكل عام، هذه تعكس الفئات المحددة باستخدام الترقيم سيستين مرجع ولكن تبين أيضا أن تسلسل أرقام سيستين مختلفة داخل مجموعة تصنيفية كبيرة قد تكون ذات صلة أوثق من تسلسل مع نفس النمط من مجموعات مختلفة. حين سوى عدد صغير من تسلسلات استخدمت في هذه الدراسة، إجراء تحليل أوسع لتسلسل 250 لا يلغي عدم وجود قرار (تكميلية الملفات 5-8)12. قد توفر محاذاة جدول مرجع التصور أسهل من أوجه التشابه مع صلة هيكلية أو وظيفية بالمقارنة مع أشجار النشوء والتطور.
رقم 1: تحديد تسلسل والسمات الهيكلية لفوق عائلة CS-αβ. الأحماض الأمينية وهيكل ثلاثي الأبعاد تم تلوينها: حلقة (أزرق) وألفا-اللولب (الأخضر)، وبيتا-أوراق (الذهب) وثنائي كبريتيد السندات (الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
رقم 2: الأولية ستة-سيستين مرجع استناداً إلى التسلسل من الحشرات ديفينسين. تشير الأعمدة إلى سيستينيس مصانة (C1-C6)، عزر CSH، حفظت العدد الأمينية الأحماض بين سيستينيس. مربعات شغلها تشير إلى أن التسلسل سيستين معين والأرقام تشير إلى الأحماض الأمينية بين سيستينيس. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
الشكل 4 : ملخص لتسلسل فوق عائلة CS αβ تتماشى مع الإشارة بخصائص المجموعة. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (أرجواني) والاخمصيه (الأخضر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
الشكل 5 : إضافة تسلسلات Tardigrade CS αβ للمحاذاة فوق عائلة مع الإشارة بخصائص المجموعة. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (الأرجواني)، الاخمصية (الأخضر) وتارديجرادا (أصفر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
رقم 6: إضافة تسلسلات Tardigrade CS αβ للمحاذاة فوق عائلة مع مرجع من قبل المجموعة التصنيفية. تشير الأعمدة سيستينيس المصانة والأحماض الأمينية فيما بينهما. تتم تسمية سيستينيس المساهمة في عزر CSH (C3، C4، C8، و C9) وإلى حظيرة CS αβ (C2 و C6). تسلسلات مرمزة بالمجموعة التصنيفية: أما في النصف الجنوبي (أحمر داكن)، أراتشنيدا (برتقالي فاتح) والبكتيريا (أسود)، لاسعات (رمادي)، الفطريات (الضوء الأخضر)، Hexapoda (برتقالي)، رخويات (أزرق)، الوحدات (الأرجواني)، الاخمصية (الأخضر) وتارديجرادا (أصفر). وتشير أرقام مفصولة بواسطة واصلة إلى مجموعة من الأحماض الأمينية الفاصلة؛ وتمثل أرقام مفصولة بخط مائل أما/أو. يشير "C" سيستين إضافية التي لا تحدث بتواتر ما يكفي لتبرير، بالإضافة إلى الإشارة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
7 الرقم: استخدام تسلسل المنحرفة الآلي المحاذاة. الأحماض الأمينية في تسلسل جميع المشار إليها بواسطة * في الصف الموجود أعلى التسلسل الأول (المبينة في مربعات الوردي). الكرب المنحرفة. الفجوة يحتاج إلى إزالة لمحاذاة بشكل صحيح في ج (السهم الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
8 الرقم: الصقل اليدوي للمحاذاة يحافظ على السمات الهامة هيكلياً للتسلسل- تتم الآن محاذاة الكرب بشكل صحيح (السهم الوردي)، وعزر ككسكسسك هو يحافظ تماما لمتواليات (مربعات الوردي). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
الرقم 9 : تسلسلات مكررة في محاذاة. إذا كان هناك زوج من سلاسل متطابقة تقريبا (مربعات الوردي)، واحد يمكن إزالتها، حيث يرجح أن هذه المجموعة معا في دائماً وتساهم قليلاً إلى الطبولوجيا العامة من الشجرة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
الرقم 10 : مقارنة بين الأشجار التي تم إنشاؤها من تحليلات النشوء والارتقاء. (أ) الحد الأقصى يتطابق تحليل احتمال في ميجا، مع 1000 bootstrap استخدام المهرج + G + أنا النموذجي. (ب) تحليل بايزي مع الأجيال 1,000,000 باستخدام الإعداد النموذجي مختلطة. وتظهر أطوار معتمدة في 70/0.7 في خطوط الوردي الصلبة؛ وتبين الخطوط المتقطعة الوردي أطوار معتمدة في 70/0.7 في شجرة أخرى. (أ) ج 6 والسم عقرب ج 8؛ (ب) ماسينس؛ (ج) القراد والعقرب ديفينسينس؛ (د) النبات ديفينسينس؛ و defensins (ه) ج 6 من الحشرات والعناكب والرخويات. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-
الجدول 1: المجموعات داخل فوق عائلة CS αβ استناداً إلى أنماط الاقتران سيستين. تظهر الأنماط الأساسية الخمس لتشكيل السندات باستخدام الأرقام الداخلية (العمود الأوسط) أو الأرقام المرجعية (العمود الأيمن). العقرب Cl-السموم، أسابف 6Cys-ألفا، ومجموعة من الببتيدات الفطرية توضع مع نمط هذا mتطابقاً مع معاهدة الفضاء الخارجي. سيستين غير المدرجة في المرجع هو المؤشرة مرتفع سيستينيس قبل/بعد (مثلاً، ج3/4 ما بين C3 و C4).
الجدول 2: إضافة Tardigrade CS αβ تسلسل إلى نمط مجموعات الأقران سيستين. ديفينسينس تارديجرادي وماسينس (غامق) توضع في المجموعات المحددة سابقا حيثما كان ذلك ممكناً. قد تظهر بعض تسلسلات tardigrade نمط المجموعة على حدة. سيستين غير المدرجة في المرجع هو المؤشرة مرتفع سيستينيس قبل/بعد (مثلاً، ج3/4 ما بين C3 و C4). التدوين "ج 21" يشير إلى هناك سيستينيس هما المنبع لمرجع C1.
التكميلية الملف 1 (S1): محاذاة Dataset هذه في ميجا- اضغط هنا لتحميل هذا الملف.
ملف تكميلية 2 (S2): شجرة كحد أقصى-احتمال ميجا ملف dataset هذه. اضغط هنا لتحميل هذا الملف.
الملف التكميلي 3 (S3): المواءمة بين هذه البيانات في شكل العلاقة بين مرباييس- اضغط هنا لتحميل هذا الملف.
الملف التكميلي 4 (S4): توافق الملف من تحليل هذه البيانات مرباييس- اضغط هنا لتحميل هذا الملف.
الملف التكميلي 5 (S5): محاذاة تسلسلات CS αβ 250 في ميجا- اضغط هنا لتحميل هذا الملف.
التكميلية الملف 6 (S6): "الحد الأقصى لاحتمال" شجرة تسلسلات CS αβ 250. اضغط هنا لتحميل هذا الملف.
الملف التكميلي 7 (S7): محاذاة 250 تسلسل CS αβ في العلاقة بين تنسيق لمرباييس- اضغط هنا لتحميل هذا الملف.
الملف التكميلي 8 (S8): توافق الملف من تحليل مرباييس 250 CS αβ تسلسلات. اضغط هنا لتحميل هذا الملف.
ينبغي أن تكون المعايير المتعلقة بتسمية بروتين ضمن مجموعة واضحة، ولكن هذا ليس هو الحال دائماً. وقد درست تسلسلات التي لديها خدمات العملاء-αβ أمثال في مختبرات عديدة باستخدام مجموعة متنوعة من الكائنات الحية، وأسفر عن أنظمة مختلفة من التسميات، فضلا عن اختلاف مستويات توصيف. محاولة فرض إلى مصطلحات جديدة تماما ليس من المعقول، وسوف ينتج قدرا كبيرا من الارتباك عند استشارة المؤلفات السابقة. يمكن استخدام إشارة نظام الترقيم بالإضافة إلى اسم البروتين لتوضيح خصائصه بالنسبة فوق عائلة.
مجموعات من البروتينات مع معايير واضحة للتسمية والتصنيف من المرجح عدم الاستفادة من توليد إشارة في جدول بيانات، على الرغم من أنه قد يكون من المفيد لتلخيص عدد كبير من تسلسلات وتصور الخصائص الهامة. تسلسل التحالفات والشعارات هي مفيدة للتحقيق مستوى المحافظة في كل موقع، ولكن لا الأولوية بنشاط تسلسل ميزات هامة لهيكل أو دالة. المثال CS αβ يركز على الهيكل، ولكن يمكن أيضا إدراج محددة من الأحماض الأمينية التي تشكل موقع ملزمة كميزة حاسمة. كما يتم تحديد تسلسل الميزات التي تمنح أنشطة مضادات الميكروبات/سمية محددة من الببتيدات CS αβ، وهذه يمكن أن تضاف إلى الإشارة إلى توضيح المجموعات استناداً إلى النشاط. على الرغم من أن الببتيدات ناضجة المتوقعة فقط استخدمت في هذا المثال، إذا كان وجود الببتيد إشارة أو الببتيد المؤيدة المهم، يمكن إضافة هذه المعلومات لكل تسلسل. محددة الإدراج أو الحذف الأحداث، فضلا عن مواقع إنترون، كما يمكن تضمين إذا هم ظنوا أن تكون مفيدة. ويمكن تحليل استفادة من استخدام مرباييس لتحليل النشوء والتطور أنها لا تقتصر على أنها البيانات الجزيئية ترميز البيانات عن الخصائص الأخرى التي قد تكون أهمية تطورية. يمكن ترميز هذه كهذا أو غائبا، توفير معلومات أكثر من تسلسل وحدها.
جمع متواليات ذات الصلة خطوة حاسمة للبروتوكول. اعتماداً على نطاق الدراسة والتوزيع لأعضاء المجموعة، وهذا قد تمتد مجموعات تصنيفية واسعة النطاق. إذا كان الهدف هو فهم لمجموعة كاملة من البروتينات، والنظر في أنه يمكن الاطلاع على بعض تسلسلات خارج الأنواع التي أفادت التقارير أنهم عادة من. إذا كان الأصناف هو الفعل تمثيلاً وتسلسل إضافية غير المحتمل أو زائدة عن الحاجة، استبعادها من البحث قد يكون مناسباً. أساسية قاعدة من بين إبهام لاسترداد يضرب في البحث عن انفجار استخدام قطع من-05 ه-القيمة. ه-القيمة هي عدد الزيارات المتوقع عن طريق الصدفة. في حين أن هذا مناسبة لبعض الحالات، إذا كان هناك مجموعة من تسلسل غير متباينة جداً لكن أسهم الخصائص المحددة، يمكن أن يكون أقل موثوقة قد استرداد متواليات متشابهة ولكن لا يكون ميزات محددة مطلوبة، وقد لا إرجاع تسلسل التي تحتوي على الخصائص الرئيسية ولكنها متباينة جداً. وهناك بعض الطرق المحتملة لمعالجة هذه المسألة. الأول هو أن ننظر في تسلسل التي تم تحديدها في البحث التي تحت عتبة-05 لترى إذا استوفت معايير الاشتمال. ثانيا، إذا كان هناك ما يكفي من المعلومات، استخدام الخاصة بموقف "تكراره الانفجار" (الانفجار PSI)22 أو نمط--ضرب "الانفجار بدأت" (PHI-انفجار)23. يستخدم هذه المبادرة--انفجار النتائج من خلال بحث أولى لإنشاء نموذج جديد للجولة المقبلة، ويمكن في بعض الأحيان إيجاد تسلسل المتباينة التي لم تحدد البحث الأولية. انفجار PHI يتطلب نمطاً لتقديمها جنبا إلى جنب مع سلسلة الاستعلام. يقيد هذا تسلسل التي تم استردادها إلى تلك التي تحتوي على النمط الفائدة. هذا الأداة مفيدة بشكل خاص إذا كانت فكرة فريدة من نوعها للفريق يمكن أن تحدد بوضوح.
محاذاة دقيقة أمر بالغ الأهمية لتحليل النشوء والتطور؛ تفسيرات للأشجار صحيحة فقط إذا كانت يتم إنشاؤها باستخدام المحاذاة جيدة. استخدام المرجع لإعلام المواءمة تساعد على تجنب الأخطاء التي فقط واضحة عند النظر في هيكل أو النشاط. تكرار تسلسل ستحتاج إلى تعريف لهذا المشروع. قد لا تكون تسلسلين تبدو زائدة عن الحاجة لأغراض النشوء والتطور إذا كانت من الأصناف المتباينة على نطاق واسع أو متطابقة تقريبا في تسلسل ولكن لها خصائص هيكلية أو وظيفية مختلفة. إذا كان هناك غموض فيما يتعلق بأي تسلسل ينبغي إدراجها، يمكن إنشاء التحالفات المتعددة وتحليلها كل على حدة لمعرفة كيفية تغيير محاذاة تأثير استدلالات النشوء والتطور. الطريقة المعروضة هنا لا يلغي الحاجة إلى التعديل اليدوي من التحالفات، ولكن يمكن أن تساعد في توضيح كيفية التسلسل يجب محاذاة وربما يمكن استخدامها بالاقتران مع أسلوب المتوازية أكثر تطورا مما قد وصفت قبل13.
للإشارة إلى أن من المفيد، من المهم تحديد الخصائص المميزة التي ليست واضحة حاليا من تسلسل وحدها. على سبيل المثال، النظر في عدم القدرة على مقارنة سيستين الترابط وأنماط بين تسلسلات مع أرقام مختلفة من سيستينيس عندما يتم ترقيم كل تسلسل فيما يتعلق بذاته. الهدف تسهيل المقارنة والمناقشة، ولا إضافة طبقة أخرى من الارتباك. وهذا قد يتطلب عدة تكرارات للإشارة ويدعو الحكم في البت الذي يتميز تدرج. من المأمول أن يزداد اعتماد أسلوب مشترك لمناقشة متواليات متباينة في مجموعة فهم المجموعة ككل.
ليس له علاقة بالكشف عن صاحب البلاغ.
البحوث الجارية الببتيد الميكروبات tardigrade يدعمه التمويل الداخلية من "مكتب بحوث جامعة الغرب الأوسط" ورعاية البرامج (أورسب). وقد أورسب أي دور في تصميم الدراسة أو جمع البيانات، والتحليل، وتفسير أو إعداد مخطوطة.
Name | Company | Catalog Number | Comments |
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved