سرویس گوگل Photos به تازگی الگورتیمی را به کار گرفته که میتواند مواردی مانند چهره سگ، گربه، انسان، تصویر غذا و … را شناسایی کند. اما این تمام آن چیزی نیست که گوگل به دنبال آن است. این غول دنیای فناوری مدتی است که در حال کار بر روی قابلیتهای تشخیص تصویر پیشرفتهتری است و سرانجام امروز میزان پیشرفت خود را با توسعه دهندگان در میان گذاشت.
بلاگ تحقیقاتی گوگل گزارش داده که میزان دقت هوش مصنوعی تیم گوگل Brain در تشخیص تصویر برابر با ۹۳.۹ درصد است. در سال ۲۰۱۴ این تیم با استفاده از مدل دسته بندی تصاویر Inception V1 توانسته بود نتیجه ۸۹.۶ درصدی را ثبت کند. البته ممکن است این پیشرفت چندان زیاد به نظر نرسد، اما هنگامی که به بخش ارزیابی فعالیتهای طبیعی مشابه انسان میرسیم، میزان تقریبا ۹۴ درصدی موفقیت این سرویس اهمیت مییابد.
تصویر زیر میزان پیشرفت این سرویس را از سال ۲۰۱۴ تا به حال نشان میدهد. در واقع این سیستم در بخش تشخیص اشیا تغییر خاصی نداشته، اما در توصیف مشخصات، رنگها و حرکات میتوان بهبودهایی را در آن دید.
چیزی که مدل Inception V3 را کاربردی میکند این است که نه تنها توانایی تشخیص افراد و اشیا حاضر در تصویر را به صورت جداگانه دارد، بلکه آنها را به هم وابسته میکند. کریس شالو، از مهندسین نرم افزار تیم گوگل Brain درباره این سرویس این گونه توضیح میدهد:
به طور مثال، یک مدل دسته بندی تصاویر به شما خواهد گفت که سگ، چمن و فریزبی در تصویر دیده میشوند، ولی یک توصیف طبیعی باید علاوه بر آن به شما بگویید که رنگ چمنها چیست و چگونه سگ و فریزبی به هم مرتبط میشوند.
این نتایج با استفاده از جمع آوری توصیف انسانها از هزاران هزار تصویر و سپس انتقال این دادهها به یک تانسور فلاو به دست آمدهاند. اگر تصاویر به اندازه کافی شباهت داشته و یکسان باشند، این الگوریتم مجددا از توصیفات انسانها استفاده خواهد کرد، اما اگر چیز جدیدی در تصویر باشد خودش هم به طور جداگانه به توصیف عکس میپردازد.
گوگل اعلام کرده که جدیدترین مدل تانسور فلاو به توسعه دهندگان کمک میکند تا از آن چه توسعه دادهاند نهایت استفاده را ببرند.