هوش مصنوعی شرکت دیپ‌مایند دنیا را تغییر خواهد داد!

دانشمندان می‌گویند برنامه یادگیری عمیق گوگل برای تعیین اشکال سه بعدی پروتئین‌ها، زیست‌شناسی را متحول خواهد کرد.

شبکه هوش مصنوعی (AI) که توسط شاخه گوگل دیپ‌مایند توسعه یافته است، جهشی عظیمی را در حل یکی از بزرگترین چالش‌های زیست‌شناسی ایجاد کرده است، تعیین شکل سه‌بعدی پروتئین‌ها از توالی اسیدهای آمینه. در ادامه این مطلب شگفت‌انگیز با آی‌تی‌رسان همراه باشید.

برنامه دیپ‌مایند که AlphaFold نام دارد، در چالش پیش‌بینی ساختار پروتئین دو ساله‌ای به نام CASP، از 100 تیم دیگر بهتر عمل کرد. نتایج در تاریخ 30 نوامبر، در آغاز کنفرانس که امسال برگزار شد، اعلام شد.

جان مولت (John Moult)، زیست شناس محاسباتی در دانشگاه مریلند در کالج پارک، که برای بهبود روش‌های محاسباتی خود برای پیش‌بینی دقیق ساختارهای پروتئینی، در سال 1994 بنیانگذار CASP شد، اکنون اینچنین اظهار نظر کرده است:

این واقعا مهم است، می‌توان گفت اکنون مشکل حل شده است.

توانایی پیش‌بینی دقیق ساختارهای پروتئینی از توالی اسید آمینه یک مزیت بزرگ برای علوم زیستی و پزشکی است. این تلاش‌ها برای درک عناصر سازنده سلول‌ها و امکان کشف سریع‌تر و پیشرفته داروها را بسیار تسریع می‌کند.

برنامه هوش مصنوعی شرکت دیپ‌مایند که AlphaFold نام دارد، در سال 2018 که اولین سال شرکت بود، در آخرین چالش پیش‌بینی ساختار پروتئین (CASP) در بالای جدول قرار گرفت؛ اما امسال، شبکه یادگیری این شرکت از بقیه رقبا بالاتر بود و به گفته دانشمندان، عملکرد بسیار گیج کننده‌ای داشت که می‌تواند نوید انقلابی در علم زیست‌شناسی باشد.

 

آندری لوپاس (Andrei Lupas)، زیست‌شناس تکاملی در موسسه زیست شناسی ماکس پلانک در توبینگن آلمان، که عملکرد تیم‌های مختلف را در CASP ارزیابی کرده بود حالا اینچنین اظهار کرد:

این نوع از هوش مصنوعی باعث می‌شود برنامه کاملا عوض شود، این کشف دارو را تغییر می‌دهد. پژوهش‌ها را تغییر خواهد داد. مهندسی زیستی را تغییر می‌دهد. به عبارت دیگر می‌توان گفت این هوش مصنوعی همه چیز را دگرگون خواهد داد.

برنامه هوش مصنوعی دیپ‌مایند (AlphaFold) قبلا به او کمک کرده است تا بتواند ساختار پروتئینی را که برای مدت یک دهه آزمایشگاه او را آزار داده است، پیدا کند و انتظار دارد که این عمل باعث تغییر نحوه کار و یافتن پاسخ سوال‌هایی شود که وی با آن‌ها دست و پنجه نرم می‌کند.

در برخی موارد، پیش‌بینی‌های ساختار AlphaFold با استفاده از روش‌های آزمایشی استاندارد طلا مانند کریستالوگرافی اشعه ایکس و میکروسکوپ الکترونی-برقی (cryo-EM) که در سال‌های اخیر تعیین شده بود، قابل تشخیص نبودند. دانشمندان می‌گویند که برنامه AlphaFold ممکن است نیاز به این روش‌های پرزحمت و گران‌قیمت را برطرف نکند، اما هوش مصنوعی امکان مطالعه موجودات زنده را به روش‌های جدید فراهم خواهد کرد.

مشکلات ساختاری

پروتئین‌ها عناصر سازنده زندگی هستند و بیشتر آنچه که در داخل سلول‌ها اتفاق می‌افتد، بر عهده آن‌ها است. نحوه کار و عملکرد پروتئین توسط شکل سه بعدی آن تعیین می‌شود. ساختار تابعی از زیست شناسی مولکولی است. پروتئین‌ها تمایل دارند بدون کمک موجود دیگری، شکل بگیرند و این فقط توسط قوانین فیزیک هدایت می‌شود.

برای دهه‌ها آزمایشات آزمایشگاهی اصلی‌ترین راه برای بدست آوردن ساختارهای پروتئینی مناسب بوده است. اولین ساختارهای کامل پروتئین‌ها با تکنیکی که در آن پرتوهای اشعه ایکس به پروتئین‌های متبلور وارد می‌شوند، شروع شد و نور پراکنده شده به مختصات اتمی پروتئین تبدیل شد. کریستالوگرافی اشعه ایکس سهم مهمی از ساختارهای پروتئینی را تولید کرده است. اما طی دهه گذشته، میکروسکوپ الکترونی کرایو (Cryo-EM) به ابزار مورد علاقه بسیاری از آزمایشگاه‌های زیست شناسی ساختاری تبدیل شده است.

اکنون مدت‌هاست که دانشمندان از خود می‌پرسند که چگونه اجزای تشکیل دهنده یک پروتئین یا رشته‌ای از آمینواسیدها، بسیاری از پیچ و تاب‌های شکل نهایی آن را ترسیم می‌کند. محققان می‌گویند که تلاش‌های اولیه در استفاده از رایانه برای پیش‌بینی ساختارهای پروتئینی در دهه 1980 و 1990 عملکرد ضعیفی داشته است. بقیه ادعاهای منتشر شده افرادی مانند محققان نیز هنگامی که سایر دانشمندان از آن‌ها برای پروتئین‌های دیگر استفاده می‌کنند، نقض شدند.

جان مولت، زیست شناس محاسباتی، CASP را برای دقت بیشتر در این تلاش‌ها راه‌اندازی کرد. این رویداد تیم‌ها را به چالش می‌کشد تا ساختار پروتئین‌هایی را که با استفاده از روش‌های آزمایشی حل شده‌‌اند، اما ساختارها برای آنها عمومی نشده است، پیش‌بینی کنند. مولت این آزمایش را با پیشرفت بسیار زیاد در زمینه آزمایش، با در نظر گرفتن ادعاهای دیگر، اعتبار می‌بخشد.

جان مولت اینچنین اظهار کرده است:

در این مرحله واقعا می‌توانید بفهمید که چه چیزهایی امیدوارکننده به نظر می‌رسند، چه عواملی موثر هستند و اینکه همچنین در این زمینه باید از چه چیزهایی دوری کنیم!

جینبو کو (Jinbo Xu)، زیست‌شناس محاسباتی در دانشگاه شیکاگو، ایلینوی اینجنین گفته است که عملکرد دیپ‌مایند در سال 2018 در CASP 13 بسیاری از دانشمندان این حوزه را که مدت‌ها در گروه‌های کوچک دانشگاهی بوده است، مبهوت کرد، اما رویکرد آن کاملا مشابه روش سایر تیم‌هایی است که از هوش مصنوعی استفاده می‌کنند.

اولین بازگویی AlphaFold روش هوش مصنوعی را که به عنوان یادگیری عمیق در داده‌های ساختاری و ژنتیکی شناخته می‌شود، برای پیش‌بینی فاصله جفت اسیدهای آمینه در یک پروتئین اعمال کرد. در دومین مرحله که هوش مصنوعی را استفاده نمی‌شود، AlphaFold از این اطلاعات برای تهیه مدلی کلی از شکل ظاهری پروتئین استفاده می‌کند.

طبق گفته‌های جامپر (Jumper)، تیم سعی داشت این روش را ادامه دهد اما در نهایت به موانعی برخورد کرد. بنابراین این روند تغییر کرد و شبکه هوش مصنوعی جدیدی ایجاد کرد که شامل اطلاعات اضافی در مورد محدودیت‌های فیزیکی و هندسی است که نحوه چیدمان پروتئین را تعیین می‌کند. آنها همچنین کار دشوارتری را پیش روی خود دارند: شبکه به جای پیش‌بینی روابط بین اسیدهای آمینه، ساختار نهایی توالی پروتئین هدف را پیش‌بینی می‌کند. او اینچنین اظهار کرده است:

این سیستم، سیستمی کاملا پیچیده‌تر است.

دقت بالا

این برنامه پیش‌بینی پروتئین، CASP طی چندین ماه انجام می‌شود. پروتئین‌های هدف یا بخشی از پروتئین‌ها در کل حدود 100 عدد، به طور منظم آزاد می‌شوند و تیم‌ها چندین هفته فرصت دارند تا پیش‌بینی ساختار خود را ارائه دهند. سپس تیمی از دانشمندان مستقل پیش‌بینی‌هایی با اندازه‌گیری ساختار تعیین شده از طریق آزمایش را اندازه‌گیری می‌کنند. این افراد نمی‌دانند چه کسی را آن را پیش‌بینی خواهد کرد.

طبق گفته‌های لوپاس (Lupas)، پیش‌بینی‌های AlphaFold با نام گروه 427 ارائه شده است، اما دقت حیرت‌انگیز بسیاری از اطلاعات ثبت‌شده آن باعث برجسته‌تر شدن آنها شده است. او در این باره می‌گوید:

حدس زده بودم که این پیش‌بینی‌ها، کار برنامه AlphaFold باشد. بیشتر مردم نیز این مسئله خبر داشتند.

برخی از پیش‌بینی‌ها از بقیه بهتر بود، اما تقریبا دو سوم از نظر کیفیت با ساختارهای آزمایشی قابل مقایسه بودند. مولت در این باره اینچنین گفته است که در برخی موارد اصلا مشخص نبود که آیا اختلاف بین پیش‌بینی‌های AlphaFold و نتیجه آزمایش خطایی در پیش‌بینی است یا محصولی مصنوعی از آزمایش.

پیش‌بینی‌های برنامه AlphaFold با ساختارهای آزمایشی تعیین شده توسط تکنیکی به نام طیف سنجی تشدید مغناطیسی هسته‌ای مطابقت نداشت، اما این می‌تواند از داده‌های خام به مدل تبدیل شود. این شبکه همچنین تلاش می‌کند ساختارهای تکی را در مجتمع‌های پروتئینی یا گروه‌ها مدل‌سازی کند، در نتیجه تعاملات با سایر پروتئین‌ها شکل آنها را تغییر می‌کند.

مولت در این مورد اینچنین گفته است که به طور کلی، تیم‌ها در سال جاری ساختارها را با دقت بیشتری پیش‌بینی کردند و در مقایسه با آخرین CASP، می‌توان گفت پیشرفت بسیاری در AlphaFold دیده شده است. در مورد اهداف پروتئینی که نسبتاً دشوار تلقی می‌شوند، بهترین عملکرد سایر تیم‌ها به طور معمول 75 در مقیاس 100 نقطه دقت پیش‌بینی بوده است، این در حالی است که AlphaFold در همان اهداف حدود 90 را به دست آورد.

مولت نیز اینگونه اظهارنظر کرده است که در حدود نیمی از تیم‌ها خلاصه این پژوهش را در خلاصه مقاله رویکرد خود ذکر کرده‌اند و معتقد است که هوش مصنوعی تأثیر گسترده‌ای در این زمینه دارد. بیشتر این‌ افراد از تیم‌های دانشگاهی بودند، اما مایکروسافت و شرکت فناوری چینی Tencent نیز وارد CASP14 شدند.

محمد الغراشیه (Mohammed AlQuraishi)، زیست شناس محاسباتی در دانشگاه کلمبیا در شهر نیویورک و یکی از شرکت‌کنندگان CASP، مشتاق است که جزئیات عملکرد AlphaFold را در این مسابقه جستجو کند و هنگامی که تیم دیپ‌مایند رویکرد خود را در 1 دسامبر ارائه می‌دهد، در مورد نحوه کار سیستم اطلاعات بیشتری کسب ‌کند. او اینچنین بیان کرد که ممکن است محصولات پروتئینی آسان‌تر از حد معمول در عملکرد موثر بوده است. باور بزرگ او این است که AlphaFold در حوزه هوش مصنوعی تحول‌آفرین خواهد بود.

محمد الغراشیه گفته است:

فکر می‌کنم منصفانه باشد که بگوییم این امر در زمینه پیش‌بینی ساختار پروتئین بسیار نوآورانه خواهد بود. من گمان می‌کنم بسیاری از افراد این حوزه را ترک خواهند کرد، زیرا بدون شک مشکل اصلی حل شده است. این مانند موفقیتی در مرتبه اول است، مطمئنا یکی از مهم‌ترین نتایج علمی زندگی من نیز خواهد بود.

دمیس حسابیس، مدیر اجرایی دیپ‌مایند گفته است که این شرکت دارد نیازهای زیست‌شناسان از AlphaFold را درک می‌کند.

سریع‌ترین ساختارها

پیش‌بینی AlphaFold به تعیین ساختار پروتئین باکتریایی که آزمایشگاه لوپاس سال‌هاست سعی در شکستن آن دارد، کمک کرده است. تیم لوپاس پیش از این داده‌های پراکنده شده اشعه ایکس خام را جمع‌آوری کرده بود، اما تبدیل این الگوهای Rorschach مانند به ساختار به اطلاعاتی در مورد شکل پروتئین‌ها نیاز دارد. اکنون ترفندهای که در بدست آوردن این اطلاعات و همچنین سایر ابزارهای پیش‌بینی کمک می‌کرد، با شکست مواجه شده‌اند. لوپاس گفته است:

پس از گذشت یک دهه که همه چیز را امتحان کردیم، مدل گروه 427 در عرض نیم ساعت به ما ساختار موردنظر را ارائه داد.

دمیس حسابیس (Demis Hassabis)، بنیان‌گذار و مدیر اجرایی دیپ‌مایند در این باره اینچنین گفته است که این شرکت قصد دارد AlphaFold را برای دانشمندان قابل استفاده کند تا دیگران نیز بتوانند از آن استفاده کنند. (قبلا جزئیات کافی در مورد نسخه اول AlphaFold را برای سایر دانشمندان منتشر کرده تا این رویکرد را تکرار کند.) ایجاد یک ساختار پیش‌بینی شده که شامل تخمین‌های مربوط به مناطق مختلف پروتئین باشد، می‌تواند روزها طول بکشد.

حسابیس که دارو را کشف کرد و طراحی پروتئین‌ها را از کاربردهای بالقوه خود می‌داند، اینچنین اضافه کرده است:

تازه درک کرده‌ایم که زیست شناسان چه می‌خواهند.

استفان بروهاون (Stephen Brohawn)، متخصص مغز و اعصاب مولکولی در دانشگاه کالیفرنیا در برکلی که تیمش این ساختار را در ماه ژوئن منتشر کرد، اینچنین گفته است که در اوایل سال 2020، این شرکت پیش‌بینی‌های کمی از ساختارهای پروتئین‌های ویروس کرونا (SARS-CoV-2) را که هنوز به طور آزمایشی تعیین نشده بود، منتشر کرد. پیش‌بینی دیپ‌مایند در مورد پروتئینی به نام Orf3a در نهایت بسیار شبیه به پروتئینی است که بعدا از طریق میکروسکوپ الکترونی کرایو تعیین شد. او اینچنین اضافه کرد:

کاری که آنها توانسته‌اند انجام دهند، بسیار چشمگیر است!

تأثیر این کشف در دنیای واقعی

بعید است AlphaFold باعث شود آزمایشگاه‌هایی مانند بروهاون بسته شود. این آزمایشگاه‌ها از روش‌های تجربی برای حل ساختارهای پروتئینی استفاده می‌کند. اما این روش می‌تواند به معنای آن باشد که داده‌های آزمایشی با کیفیت پایین‌تر و آسان‌تر برای جمع‌آوری تمام آنچه برای دستیابی به ساختار مناسب لازم است، باشد. برخی از کاربردها، مانند تجزیه و تحلیل تکامل پروتئین‌ها، اکنون قرار است به طور کامل شکوفا شوند، زیرا این حجم از داده‌های ژنومی موجود ممکن است اکنون به ساختارها تبدیل شوند. لوپاس گفته است:

این امر می‌تواند نسل جدیدی از زیست شناسان مولکولی را قادر به طرح سوالات پیشرفته‌تر کند. این کشف به تفکر بیشتر و اندازه‌گیری کمتری احتیاج خواهد داشت.

ژانت تورنتون (Janet Thornton)، زیست شناس ساختاری در آزمایشگاه زیست شناسی مولکولی اروپا، موسسه بیوانفورماتیک اروپا در هینکستون، انگلستان و ارزیابی‌گر گذشته CASP در این باره اینچنین گفته است:

این مشکلی است که من فکر می‌کردم در طول زندگی هرگز حل نخواهد شد.

او امیدوار است که این روش بتواند به روشن شدن عملکرد هزاران پروتئین حل نشده در ژنوم انسان کمک کند و تغییرات ژنی ایجاد کننده بیماری را که در افراد متفاوت است، معنا کند.

عملکرد AlphaFold به مانند نقطه عطفی برای دیپ‌مایند است. این شرکت بیشتر به خاطر داشتن هوش مصنوعی برای تسلط بر بازی‌هایی مانند Go مشهور است، اما هدف طولانی‌مدت آن توسعه برنامه‌هایی با توانایی دستیابی به هوش گسترده و شبیه انسان است. حسابیس نیز گفته است که مقابله با چالش‌های بزرگ علمی، مانند پیش‌بینی ساختار پروتئین، یکی از مهم‌ترین کاربردهایی است که هوش مصنوعی می‌تواند آن را انجام دهد. او در این باره گفت:

فکر می‌کنم این مهم‌ترین کاری بوده است که برای این دنیا انجام داده‌ایم، بی‌شک این عمل تأثیرات زیادی در دنیای واقعی خواهد داشت.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا
TCH