هوش مصنوعی گوگل می‌تواند با دقت ۹۴ درصد اجزا تصاویر را تشخیص دهد!

سرویس گوگل Photos به تازگی الگورتیمی را به کار گرفته که می‌تواند مواردی مانند چهره سگ، گربه، انسان، تصویر غذا و … را شناسایی کند. اما این تمام آن چیزی نیست که گوگل به دنبال آن است. این غول دنیای فناوری مدتی است که در حال کار بر روی قابلیت‌های تشخیص تصویر پیشرفته‌تری است و سرانجام امروز میزان پیشرفت خود را با توسعه دهندگان در میان گذاشت.

بلاگ تحقیقاتی گوگل گزارش داده که میزان دقت هوش مصنوعی تیم گوگل Brain در تشخیص تصویر برابر با ۹۳.۹ درصد است. در سال ۲۰۱۴ این تیم با استفاده از مدل دسته بندی تصاویر Inception V1 توانسته بود نتیجه ۸۹.۶ درصدی را ثبت کند. البته ممکن است این پیشرفت چندان زیاد به نظر نرسد، اما هنگامی که به بخش ارزیابی فعالیت‌های طبیعی مشابه انسان می‌رسیم، میزان تقریبا ۹۴ درصدی موفقیت این سرویس اهمیت می‌یابد.

تصویر زیر میزان پیشرفت این سرویس را از سال ۲۰۱۴ تا به حال نشان می‌دهد. در واقع این سیستم در بخش تشخیص اشیا تغییر خاصی نداشته، اما در توصیف مشخصات، رنگ‌ها و حرکات می‌توان بهبودهایی را در آن دید.

چیزی که مدل Inception V3 را کاربردی می‌کند این است که نه تنها توانایی تشخیص افراد و اشیا حاضر در تصویر را به صورت جداگانه دارد، بلکه آن‌ها را به هم وابسته می‌کند. کریس شالو، از مهندسین نرم افزار تیم گوگل Brain درباره این سرویس این گونه توضیح می‌دهد:

به طور مثال، یک مدل دسته بندی تصاویر به شما خواهد گفت که سگ، چمن و فریزبی در تصویر دیده می‌شوند، ولی یک توصیف طبیعی‌ باید علاوه بر آن به شما بگویید که رنگ چمن‌ها چیست و چگونه سگ و فریزبی به هم مرتبط می‌شوند.

این نتایج با استفاده از جمع آوری توصیف انسان‌ها از هزاران هزار تصویر و سپس انتقال این داده‌ها به یک تانسور فلاو به دست آمده‌اند. اگر تصاویر به اندازه کافی شباهت داشته و یکسان باشند، این الگوریتم مجددا از توصیفات انسان‌ها استفاده خواهد کرد، اما اگر چیز جدیدی در تصویر باشد خودش هم به طور جداگانه به توصیف عکس می‌پردازد.

گوگل اعلام کرده که جدیدترین مدل تانسور فلاو به توسعه دهندگان کمک می‌کند تا از آن چه توسعه داده‌اند نهایت استفاده را ببرند.

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ