Google Captioning AI может описывать фотографии

В скором времени компьютерные программы смогут описывать содержимое фотографий так же, как и люди. После некоторой тренировки последняя версия алгоритма Google «Show and Tell» может описать содержимое фотографии с ошеломляющей точностью 94%.

Google сделал модель с открытым исходным кодом. Вы можете самостоятельно обучать программу. Исходный код доступен для всех.

caption4

Программа может легко определить где именно был сделан снимок, но очень трудно научить её описывать содержимое фотографии. До недавнего времени это было невозможно.

Реклама

caption3c

Google надеется, что открытая модель будет продвигать исследования в этой области. Для фотографов это большой шаг к автоматической установки тегов и к облегчению поиска снимков.

ИСТОЧНИКpetapixel