تقييم أداء خوارزميات المعلوماتية الحيوية لدراسة تسلسل البروتين في البيئة التسلسلية والبيئة التفرعية باستخدام منصات الحوسبة السحابية
الكلمات المفتاحية:
المعلوماتية الحيوية، الأحماض الأمينية، الأسس الآزوتية، الخلية، الجينوم، البروتين، سلاسل DNA، NCBI، BLAST، Google Colab، معالج GPU ، SW ، NW.الملخص
التغيرات التي قد تطرأ على سلاسل البروتين أو المادة الوراثية يمكن أن تؤدي إلى ظهور أمراض متنوعة، بعضها قد يكون مهدداً للحياة، مما يجعل التشخيص المبكر أمراً حاسماً لحماية صحة المريض. وفي إطار السعي الحثيث لاكتشاف هذه التغيرات في وقت مبكر، تم تطوير خوارزميات متخصصة في المعلوماتية الحيوية، تهدف إلى تحليل سلاسل البروتينات ودراسة تسلسل الشيفرة الجينية في الحمض النووي (DNA). ومع كون البيانات البيولوجية هائلة الحجم ومعقدة، فإن استخدام الأنظمة التقليدية لمعالجة هذه الخوارزميات يصبح تحدياً حقيقياً، حيث يحتاج الأمر إلى وقت طويل لتعامل الأنظمة مع هذه البيانات الضخمة.
في هذا البحث، قمنا باستخدام خوارزمية تسلسلية من خوارزميات المعلوماتية الحيوية لاكتشاف سلاسل البروتين، ثم قمنا بتطوير هذه الخوارزمية إلى شكل تفرعي، ونفذناها عبر الحوسبة التفرعية باستخدام وحدات المعالجة الرسومية (GPU) المتوفرة على منصة Google Colab. وبعد ذلك، أجرينا مقارنة شاملة بين النتائج من حيث الدقة، زمن التنفيذ، واستهلاك الموارد المادية مقارنة بالخوارزمية التسلسلية الأصلية. الهدف من هذه المقارنة كان تحديد الحل الأمثل لاكتشاف التغيرات في السلاسل البروتينية، بحيث نحقق دقة أعلى، زمن تنفيذ أسرع، وتكلفة أقل.