تکنولوژی هوش مصنوعی جدید دانشگاه MIT می‌تواند صدای آلات مختلف را تفکیک و شناسایی کند

اگر برای شنیدن صدای ساز دلخواه‌تان در یک ویدیو، هزاران بار به آن گوش داده‌اید و از این کار ناامید شده‌اید، در این‌صورت شیفته تکنولوژی جدید هوش‌مصنوعی دانشگاه MIT خواهید شد.

برنامه PixelPlayer که در آزمایشگاه علوم رایانه و هوش مصنوعی ام‌آی‌تی (CSAIL) تهیه شده، می‌تواند صدای آلات مختلف موسیقی پخش شده در یک ویدیو را تشخیص داده و صدای ساز بخصوصی را در سطح پیکسل شناسایی نماید. PixelPlayer به شما این اجازه را خواهد داد تا صدای آلتی را که تمایل به شنیدن آن دارید انتخاب کنید، سپس این برنامه صدای ساز موردنظر شما را بسیار بلندتر از بقیه پخش کرده و حجم صدای سایر آلات را پایین می‌آورد.

این موسسه برای آموزش PixelPlayer از تکنیک یادگیری عمیق بهره برده و بیش از ۶۰ ساعت ویدیو برای آموزش آن استفاده نموده است. این تکنولوژی هنوز کامل نیست، برای اینکه تنها قادر به تشخیص صدای ۲۰ آلت در لحظه است و در شناسایی صداهای شبیه به‌هم مشکلاتی دارد. با بهبود این تکنولوژی می‌توان آن را به یکی از ابزارهای مفید ویرایش صدا تبدیل کرد و متخصصین این امکان را به وجود خواهند آورد تا کیفیت آهنگ‌ها و کنسرت‌های قدیمی را دوباره به حالت اولیه برگردانند. همچنین از آن می‌توان برای آموزش ربات‌ها به منظور تشخیص انواع صداهای محیطی مانند صدای حیوانات، ماشین‌ها و سایر دستگاه‌ها استفاده کرد.

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ