درک یک تصویر نیاز به شناخت جهان اطراف دارد، این جمله را John Berger که یک منتقد هنری است میگوید. کامپیوترها همه چیز را کاملا متفاوت میبینند. وقتی یک هوش مصنوعی تصویری را میبیند، آن را بهصورت چندین شی درک میکند و تلاش میکند تا از آنها زمینهای بسازد. برنامهنویس استودیو دانمارکی Stoj با استفاده از صحنهای از فیلم “گرگ والاستریت” این مفهوم را نشان میدهد.
این برنامهنویس میگوید:
برای اکثر انسانها این کار بدون توجه به اندازه، مقیاس و چرخش اشیا کار سادهای است. این امر برای کامپیوترها سخت بوده ولی پیشرفتهای اخیر، بهبودهای چشمگیری را در دقت، سرعت و همچنین شناسایی چند شی در یک تصویر را بههمراه داشته است.