کمپانی مایکروسافت امروز در گردهمایی HOT CHIPS پلتفرم شتابدهنده یادگیری عمیق جدید خود را با کد نام پروژه Brainwave معرفی نمود. این پروژه برای این خلقشده تا سیستمی برای هوش مصنوعی آنی و بدون وقفه طراحی کرده باشد. تولید چنین سیستمی نیازمند تأخیری بسیار ناچیز در دستورات بوده تا این سیستم بتواند درخواستها را بهمحض رسیدن و هر چه سریعتر پردازش کند. بر اساس سخنان دوگ برگر یکی از مهندسین شرکت مایکروسافت: “پروژه Brainwave توانسته جهشی عمده هم در عملکرد و هم در انعطافپذیری برای خدمات بر پایه ابری از مدلهای یادگیری عمیق بردارد.”
سیستم پروژه Brainwave با سه لایه اصلی ساختهشده است. اولین لایه، یک زیرساخت FPGA بسیار بزرگ بوده که از طریق پروژه Catapult در طول چند سال اخیر گسترشیافته است. بهوسیله استفاده از FPGAهای با عملکرد بالا، تیم Project Brainwave توانستند تا شبکههای عصبی عمیق یا DNNها را بهعنوان سختافزار میکرو سرویسها استفاده کنند که از طریق حذف پردازش درخواستهای ورودی از طریق CPU باعث کاهش تاخیر شده و توان عملیاتی بالایی را ممکن میشوند. علت این امر این است که FPGAها میتوانند پردازش درخواستها را بهسرعت شبکههایی که آنها را جاری نمودهاند مورد پردازش قرار دهند.
دوم، این تیم از یک واحد پردازش DNN قدرتمند (DPU) استفاده نموده است، که این واحد بهصورت تجاری با FPGAهای موجود ترکیبشدهاند اما آن را با روشی متفاوت ازآنچه دیگر کمپانیها تابهحال انجام دادهاند، ساختهاند. بهجای تعریف عوامل تراشه و انواع دادهها در زمان طراحی که انعطافپذیری آنها را محدود میکند، کمپانی مایکروسافت یک تراشه را طراحی نموده که در میان یک محدوده از انواع دادهها را پیمایش میکند.
سوم، Project Brainwave محدوده وسیعی از چهارچوبهای یادگیری عمیق محبوب را حمایت میکند که شامل Microsoft Cognitive Toolkit و Google’s Tensorflow است. برای انجام، این تیم یک نمونه متوسط گرافی که مدلهای آموزشدیده را در چهارچوبهای محبوب با زیرساختهای عملکرد بالای کمپانی را به یکدیگر متصل میکند، تعریف کرده است.
مایکروسافت ادعا نمود که سیستم آنها برای هوش مصنوعی آنی و بیدرنگ ساختهشده و میتواند مدلهای پیچیده و با حافظههای فشرده مانند حافظههای LSTM بدون استفاده از دسته کردن بکار ببرد. بهعنوان یک اثبات، این کمپانی از Intel’s new 14 nm Stratix 10 و فرمت نقطه شناور سفارشی 8 بیت ms-fp8 برای اجرای مدل یک واحد بزرگ GRU در مراسم HOT CHIPS استفاده نمود.
نتیجه یک ترافلاپ 39.5 چشمگیر پایدار شده توسط Stratix بوده که مدل بزرگ GRU را اجرا میکند. هر درخواست در کمتر از 1 میلیثانیه اجرا میشود.
درنهایت مایکروسافت در حال برنامهریزی برای انتقال Project Brainwave به پلتفرم Azure و کاربران آن بوده و همچنین از آن برای قدرت بخشیدن به دیگر محصولات در آیندهای نزدیک مانند Bing استفاده میشود. متأسفانه هنوز زمان عرضه این محصول تا بدین لحظه اعلامنشده است.