هوش مصنوعی LegoGPT معرفی شد: خلق مدل‌های سه‌بعدی با متن ساده

دانشمندان دانشگاه کارنگی ملون موفق شده‌اند با بهره‌گیری از الگوریتم‌های پیشرفته‌ی هوش مصنوعی، ابزاری خلق کنند که قادر است تنها با استفاده از توضیحاتی نوشتاری، سازه‌های لگویی را طراحی کند. این ابزار که LegoGPT نام دارد، می‌تواند با دقتی مثال‌زدنی، ساختارهایی را خلق کند که نه‌تنها از نظر بصری قابل‌قبول‌اند، بلکه از لحاظ فنی نیز امکان ساخت آن‌ها با آجرهای واقعی لگو وجود دارد.

مدل یادشده بر پایه‌ی یک سیستم زبانی خودپیش‌برنده طراحی شده که عملکرد آن بر اساس پیش‌بینی مرحله‌به‌مرحله‌ی جای‌گذاری آجرها انجام می‌شود. به‌عبارتی، LegoGPT مانند یک طراح خبره، با هر واژه‌ای که از کاربر دریافت می‌کند، قدمی به سوی ساخت نهایی طرح برمی‌دارد.

برای آموزش این هوش مصنوعی، محققان از مجموعه‌ی گسترده‌ای از طرح‌های لگویی بهره برده‌اند که شامل بیش از ۴۷ هزار مدل مختلف بوده است. این مجموعه شامل اشیاء متنوعی از جمله میز و صندلی گرفته تا سازهای موسیقی، قایق‌ها و مبلمان خانگی می‌شود. این گوناگونی در داده‌ها به مدل این امکان را داده تا توانایی خود را در درک مفاهیم مختلف و تبدیل آن‌ها به ساختارهای فیزیکی تقویت کند.

آنچه این سامانه را از دیگر ابزارهای مشابه متمایز می‌کند، قابلیت آن در تولید طرح‌هایی کاملاً نو بر اساس توصیف‌های نوشتاری است، بدون نیاز به هیچ پیش‌نمونه‌ای. به علاوه، امکان همگام‌سازی این سیستم با فناوری بینایی رایانه‌ای نیز وجود دارد؛ به‌طوری که کاربر می‌تواند از مجموعه آجرهای در اختیار خود عکس بگیرد و پیشنهادهایی متناسب با همان قطعات دریافت کند.

این ابزار نوآورانه به‌صورت متن‌باز در پلتفرم گیت‌هاب منتشر شده و در اختیار علاقه‌مندان و پژوهشگران قرار گرفته است. قابلیت‌های فنی آن نیز فراتر از طراحی صرف است. تیم توسعه‌ این پروژه، سازوکارهایی نظیر بررسی هم‌پوشانی قطعات و بازگشت به آخرین حالت پایدار را درون آن تعبیه کرده‌اند تا تضمین شود که مدل نهایی، به‌طور کامل قابل ساخت و از نظر فیزیکی بدون مشکل خواهد بود.

در فرآیند تولید داده برای آموزش این مدل، ابتدا متن به مش‌های سه‌بعدی تبدیل می‌شود و سپس با چیدمانی دقیق در ساختارهای لگویی قرار می‌گیرد. در نهایت، از طریق قدرت مدل‌های زبان پیشرفته مانند GPT-4o، توصیف دقیق و پیوسته‌ای از آنچه باید ساخته شود فراهم شده و مدل بر اساس این ارتباط میان زبان و ساختار فضایی، اقدام به طراحی می‌کند.

این پروژه گام مهمی در ترکیب خلاقیت انسانی با قابلیت‌های بی‌نظیر هوش مصنوعی به‌شمار می‌رود و می‌تواند افق‌های تازه‌ای برای طراحان، آموزگاران، علاقه‌مندان به لگو و حتی مهندسان معماری بگشاید.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

به بالا بروید