اوراکل از پلتفرمی رونمایی کرده که آن را بزرگترین ابررایانهٔ هوش مصنوعی در فضای ابری میداند: OCI Zettascale10. شرکت ادعا میکند این سیستم میتواند تا ۱۶ زتافلاپس اوج عملکرد را با ترکیب ۸۰۰٬۰۰۰ واحد پردازش گرافیکی انویدیا فراهم کند — رقمی که معادل حدود ۲۰ پتافلاپس به ازای هر GPU است و با چیپهای ردهبالای دسکتاپ مانند Grace Blackwell GB300 Ultra در یک سطح قرار میگیرد.
معماری شبکه؛ ایجاد پیوند بین GPUها
اُراکل میگوید قلب این سیستم، شبکهٔ اختصاصی Oracle Acceleron RoCE است که برای افزایش مقیاسپذیری و پایداری در عملیاتهای دادهمحورِ هوش مصنوعی طراحی شده است. در این طراحی، کارتهای رابط شبکه مانند سوییچهای کوچک عمل میکنند و GPUها را روی چند «صفحهٔ شبکهٔ مستقل» به هم متصل میکنند. هدف از این رویکرد کاهش تأخیر میان شتابدهندهها و فراهم کردن امکان ادامهٔ کار اگر یک مسیر شبکهای دچار مشکل شد است.
به گفتهٔ پیتر هئوشله از OpenAI، «این طراحیِ RoCE سفارشی و بسیار مقیاسپذیر، عملکرد سراسری فابریک را در مقیاس گیگاواتی به حداکثر میرساند در حالی که بیشتر انرژی را معطوف محاسبات نگه میدارد.» همچنین انویدیا تأکید کرده که این زیرساختِ تمامعیار میتواند به جابجایی پژوهشهای پیشرفته هوش مصنوعی از فاز آزمایشی به تولید کمک کند.
نوآوریهای صرفهجویی در انرژی و نگهداری مستقل
اوراکل از معرفی فناوریهایی مثل Linear Pluggable و Receiver Optics خبر داده که هدفشان کاهش مصرف انرژی و بار خنکسازی بدون کاستن از پهنای باند است. علاوه بر این، طراحی بر پایهٔ صفحات شبکهٔ مستقل به مشتریان اجازه میدهد نگهداری و بهروزرسانی را در سطح هر صفحه انجام دهند تا زمان قطع سرویس کاهش یابد و انعطافپذیری عملیاتی افزایش پیدا کند.
ادعاها، تردیدها و نکاتی که باید بدانید
هرچند ارقام اعلامشده چشمگیر است، اوراکل هنوز تأییدیهٔ مستقل یا دادههای کارایی پیوسته برای اثبات ۱۶ زتافلاپس ارائه نکرده است. معیارهای عملکرد در فضای ابری میتواند بسته به نحوهٔ محاسبهٔ توان عملیاتی متفاوت باشد؛ گاهی مقایسهها براساس اوج نظری (peak theoretical) است نه نرخ پایدار در بار کاری واقعی.
با توجه به اینکه مجموع ارقام تبلیغشده برابر با جمع ظرفیت ۸۰۰٬۰۰۰ GPU سطحبالاست، کارایی واقعی بستگی زیادی به کیفیت طراحی شبکه و بهینهسازی نرمافزار خواهد داشت. تحلیلگران تا زمان راهاندازی و آزمایش میدانی سیستم در سال آینده، به دقت نتایج را زیر نظر خواهند داشت.
چرا این موضوع مهم است؟
Zettascale10 اوراکل نشان میدهد رقابت برای ارائه زیرساختهای عظیم GPU و ابزارهای AI در سطح ابر شدت گرفته است. برای کسبوکارها، وعدهٔ اوراکل دربارهٔ آموزش و استقرار مدلهای بزرگ در یک ابر توزیعشده با امکانات حاکمیت داده (data sovereignty) میتواند جذاب باشد؛ بهویژه برای سازمانهایی که ترکیبی از نیاز به محاسبات سنگین و الزام به محافظت از دادهها دارند.
سرانجام، اوراکل میگوید این سیستم در سال آینده راهاندازی خواهد شد؛ وقتی عرضه رسمی انجام شود، مشخص خواهد شد آیا معماری و طراحی شبکه میتوانند نیازهای مقیاسپذیر، کارآمد و قابلاعتماد محاسبات AI را پاسخ دهند یا خیر.




