AI solves the protein folding problem – part 1/4

//
Artificial Intelligence (AI) helps in solving a 50-year-old grand challenge of biology – part 1/4
الذكاء الاصطناعي يساعد في حل تحدٍ كبير في علم الأحياء عمره 50 عامًا – الجزء الأول من أربعة
We would not be exaggerating if we claim that this is the biggest advancement in structural biology in the past 20 years. The same thing can be said about the applications of AI (in fact, it could be argued that this is one of the biggest advancements in the history of the AI field). What? Why? How? .. read on!
لا نبالغ إذا ادعينا أن هذا هو أكبر تقدم في علم الأحياء البنيوي في العشرين عامًا الماضية. يمكن قول الشيء نفسه عن تطبيقات الذكاء الاصطناعي (في الواقع، يمكن القول إن هذا أحد أكبر التطورات في تاريخ مجال الذكاء الاصطناعي). ماذا؟ لماذا؟ كيف؟ .. واصل القراءة!
 
Introduction .. مقدمة
Amino acids are considered the basic building blocks of life. There are 20 amino acids and each amino acid has a certain structure. Proteins are chains of Amino acids (all the proteins in the world are made of chains of those 20 amino acids). Looking at life from a mechanical perspective, proteins are considered the workhorses of living organisms .. they are structure providers, movers, reaction catalysts and so on) .. so they are the doers and movers of life because they make the cell do things (i.e. they are the workers in the cell).
تعتبر الأحماض الأمينية اللبنات الأساسية للحياة. يوجد 20 حمضًا أمينيًا ولكل حمض أميني بنية معينة. البروتينات تتكون من سلاسل من الأحماض الأمينية (جميع البروتينات في العالم تتكون من سلاسل من تلك الأحماض الأمينية البالغ عددها 21). بالنظر إلى الحياة من منظور ميكانيكي، يمكن اعتبار البروتينات أحصنة عمل للكائنات الحية .. فهم مزودون للبنية ، ومحركون ، ومحفزات رد فعل … وغير ذلك) .. لذا فهم الفاعلون والمحركون للحياة لأنهم يجعلون الخلية تعمل الأشياء (أي هم العاملون في الخلية).
 
The Scientific Problem .. المشكلة العلمية
Protein folding is the process of going from amino acid sequence to a 3D structure. A particular sequence usually maps 1-to-1 to a 3D structure (not always, but usually). The 3D structure determines the function of the protein. The underlying causes of many diseases is the misfolding of proteins.
طي (أو التفاف) البروتين هو عملية الانتقال من تسلسل الأحماض الأمينية إلى بنية ثلاثية الأبعاد. عادةً تسلسل معين من الأحماض الأمينية يناظره تمثيل ثلاثي الأبعاد واحد فقط (ليس دائمًا، ولكن عادةً). البنية ثلاثية الأبعاد تحدد وظيفة البروتين. اختلال الطي في البروتينات هو سبب العديد من الأمراض.
This is the key point .. understanding, or accurately predicting, the 3D structure of a protein can help understand its function, and therefore, treat diseases!
هذه هي النقطة الأساسية .. فهم ، أو التنبؤ الدقيق ل، التركيب ثلاثي الأبعاد للبروتين يمكن أن يساعد في فهم وظيفته ، وبالتالي تصميم الأدوية وعلاج الأمراض!
Knowing the 3D structure of a protein is a very difficult and complex problem; a problem that has been challenging scientists for the past 50 years. Now AI can provide highly accurate solutions (accurate enough to open several doors widely .. doors that were expected to open after decades from now)
معرفة البنية ثلاثية الأبعاد للبروتين مشكلة صعبة ومعقدة للغاية؛ وهي مشكلة كانت تمثل تحديًا للعلماء على مدار الخمسين عامًا الماضية. الآن يمكن للذكاء الاصطناعي تقديم حلول دقيقة للغاية (دقيقة بما يكفي لفتح عدة أبواب على نطاق واسع .. أبواب كان من المتوقع أن تفتح بعد عقود من الآن)
Take this example: to determine the 3D structure of a protein, there are multiple methods. One of them is x-ray crystallography where the cost is ~$120000 per protein (and it takes about one year to determine the 3D structure). Compare: AI can find an accurate shape of a protein in a matter of days!
خذ هذا المثال: لتحديد البنية ثلاثية الأبعاد للبروتين ، هناك طرق متعددة. أحدها هو علم البلورات بالأشعة السينية حيث تبلغ التكلفة حوالي 120000 دولار لكل بروتين (ويستغرق الأمر حوالي سنة كاملة لتحديد الهيكل ثلاثي الأبعاد لبروتين واحد). قارن هذا بالتالي: يمكن للذكاء الاصطناعي استنباط شكل دقيق للبروتين في غضون أيام!
The AI Solution .. الحل باستخدام الذكاء الاصطناعي
This is what researchers from Google’s DeepMind have recently announced .. They have announced that they have made a game changing breakthrough in the way scientific research will look at proteins and their 3D structure. They have developed an AI algorithm (which they call Alpha Fold 2) that can accurately predict the 3D structure of a protein in a few days (see reference [1] for more details)
هذا ما أعلنه باحثون من شركة DeepMind التابعة ل Google مؤخرًا .. أعلنوا أنهم حققوا تقدم سيغير اللعبة ويحدث ثورة في الطريقة التي سينظر بها البحث العلمي إلى البروتينات وبنيتها ثلاثية الأبعاد. لقد طوروا خوارزمية ذكاء اصطناعي (يطلقون عليها Alpha Fold 2) يمكنها التنبؤ بدقة بالبنية ثلاثية الأبعاد للبروتين في غضون أيام قليلة (انظر المصدر [1] لمزيد من التفاصيل)
Why the big fuss? .. Well there is a huge number of ways a protein can fold based on its sequence of amino acids. Compare: there are ~10^80 atoms in the known, observable universe .. on the other hand, there are ~10^143 ways for a protein to fold. A simple calculation can tell you why it is indeed a big big thing. Want to know more about the complexity of the problem? ok .. take this: currently there are ~200 million proteins, and only ~170000 of them have known 3D structures.
لماذا الضجة الكبيرة؟ .. حسنًا ، هناك عدد كبير جداً من الطرق التي يمكن أن ينطوي بها البروتين بناءً على تسلسل الأحماض الأمينية. قارن: هناك حوالي 10 أس 80 ذرة في الكون المعروف الذي يمكن ملاحظته .. من ناحية أخرى ، هناك حوالي 10 أس 143 طريقة لانطواء البروتين .. تخيل عشرة أمامها 143 صفر. عملية حسابية بسيطة يمكن تخبرك عزيزي القاريء لماذا هو بالفعل شيء كبيييير!
هل تريد معرفة المزيد عن مدى تعقيد المشكلة؟ طيب خذ ههذ: يوجد حاليًا 200 مليون بروتين تقريباً، و حوالي 170000 منها فقط هو ما يُعرف لها هياكل ثلاثية الأبعاد.
Currently the scientific research community is waiting for the documentation (i.e. research paper) of the techniques used by the DeepMind team (although many researchers have already guessed some of the details and underlying ideas) .. See the references below for useful links
ينتظر مجتمع البحث العلمي حاليًا التوثيق (أي الورقة البحثية) للتقنيات المستخدمة من قبل فريق DeepMind (على الرغم من أن العديد من الباحثين قد خمنوا بالفعل بعض التفاصيل والأفكار الأساسية) .. انظر المصادر أدناه لبعض الروابط المفيدة
Thank you for reading .. More in the next part .. شكراً على القراءة .. المزيد في الجزء التالي

[1] https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

[2] https://www.nature.com/scitable/topicpage/protein-structure-14122136/

[3] https://www.youtube.com/watch?v=KpedmJdrTpY

[4] https://scitechdaily.com/major-scientific-advance-deepmind-ai-alphafold-solves-50-year-old-grand-challenge-of-protein-structure-prediction/