اگر برای شنیدن صدای ساز دلخواهتان در یک ویدیو، هزاران بار به آن گوش دادهاید و از این کار ناامید شدهاید، در اینصورت شیفته تکنولوژی جدید هوشمصنوعی دانشگاه MIT خواهید شد.
برنامه PixelPlayer که در آزمایشگاه علوم رایانه و هوش مصنوعی امآیتی (CSAIL) تهیه شده، میتواند صدای آلات مختلف موسیقی پخش شده در یک ویدیو را تشخیص داده و صدای ساز بخصوصی را در سطح پیکسل شناسایی نماید. PixelPlayer به شما این اجازه را خواهد داد تا صدای آلتی را که تمایل به شنیدن آن دارید انتخاب کنید، سپس این برنامه صدای ساز موردنظر شما را بسیار بلندتر از بقیه پخش کرده و حجم صدای سایر آلات را پایین میآورد.
این موسسه برای آموزش PixelPlayer از تکنیک یادگیری عمیق بهره برده و بیش از ۶۰ ساعت ویدیو برای آموزش آن استفاده نموده است. این تکنولوژی هنوز کامل نیست، برای اینکه تنها قادر به تشخیص صدای ۲۰ آلت در لحظه است و در شناسایی صداهای شبیه بههم مشکلاتی دارد. با بهبود این تکنولوژی میتوان آن را به یکی از ابزارهای مفید ویرایش صدا تبدیل کرد و متخصصین این امکان را به وجود خواهند آورد تا کیفیت آهنگها و کنسرتهای قدیمی را دوباره به حالت اولیه برگردانند. همچنین از آن میتوان برای آموزش رباتها به منظور تشخیص انواع صداهای محیطی مانند صدای حیوانات، ماشینها و سایر دستگاهها استفاده کرد.