Toshiba Corporation разработи AI с 3D разпознаване, който е способен да измерва разстоянието с точност на стерео камера, като използва изображението, направено с търговска камера, и анализира размазването на изображението, причинено от обектива на камерата, използвайки дълбоко обучение. Тази технология ще премахне използването на стерео камери, което в крайна сметка намалява разходите и пространството. Toshiba ще представи това постижение на международната конференция по компютърно зрение (ICCV2019), която ще се проведе в Южна Корея на 30 октомври 2019 г. от 10 часа.
Засичането на изображения става все по-важно и приложения като роботи, движещи се обекти, автономни безпилотни превозни средства, дистанционно управлявани безпилотни летателни апарати, инспектиращи инфраструктура и т.н., изискват нещо повече от просто изображения на обектите, те се нуждаят от малко устройство за анализ на 3D данни, което да включва форма и разстояние. Следователно изследванията са увеличени, за да се разработи измервателна технология с монокулярни камери (те са лесни за миниатюризиране) чрез използване на дълбоко обучение за по-добро изучаване на формата, фона и други пейзажни данни на изобразения обект.
Този метод има недостатък; точността на разстоянието се изчислява с помощта на монокулярна камера в зависимост от научените данни на пейзажа, което причинява спад на точността поради снимките, направени в различни пейзажи. За преодоляване на това Toshiba е разработила цветно филтрирана апертурна фотография, при която към обектива са прикрепени два цветни филтъра, а цветът и размерът на полученото размазване на изображението се анализират според разстоянието от обекта. Въпреки че това решава проблема със зависимостта на данните, модифицирането на съществуващите обективи струва време и пари.
Toshiba е преодоляла този проблем, като е разработила AI с технология за 3D разпознаване, която използва дълбоко обучение, за да анализира как изображението се размазва според позицията му върху обектива, за да постигне измерване на разстоянието със същата висока точност като стереосистемата на камерата, с нормална монокулярна камера, но без да са необходими данни за пейзажи. Досега се смяташе за теоретично невъзможно измерването на разстоянието въз основа на формата на размазването, което е еднакво за обекти както с разстояние, така и далеч, когато са на еднакво разстояние от фокусната точка. Но аналитичните резултати показват съществена разлика между размазаните форми в близост до далечни обекти, дори те са на еднакво разстояние от фокусната точка. С това Toshiba анализира успешно данните за замъгляване от заснетите изображения чрез модул за дълбоко обучение, обучен с модела на дълбока невронна мрежа.
Когато светлината преминава през лещата, е известно, че формата на създаденото замъгляване се променя в зависимост от дължината на вълната на светлината и нейното положение в лещата. В развитата мрежа позицията и цветът се обработват отделно, за да се възприемат правилно промените във формата на размазване, а след това, след преминаване през претеглен механизъм за внимание, да се контролира къде на градиента на яркостта да се фокусира, за да се измери правилно разстоянието. Чрез обучението мрежата след това се актуализира, за да намали грешката между измереното разстояние и действителното разстояние. Използвайки този AI модул, Toshiba потвърди, че едно изображение, заснето с търговска камера, реализира същата точност на измерване на разстоянието, осигурена със стерео камери. Повече информация можете да намерите на тази официална страница на Toshiba.
Toshiba ще потвърди гъвкавостта на системата с предлаганите в търговската мрежа камери и обективи и ще ускори обработката на изображенията, като се стреми към публично внедряване през фискалната 2020 година.