В то время как компании и исследователи во всем мире тяжело работают над тем, чтобы обучить свои системы искусственного интеллекта, создавая пары изображений и их описания, у Facebook есть огромное количество материала для обучения системы благодаря миллиардам помеченных фотографий в Instagram. Facebook используют эти фотографии для создания системы распознавания образов.
Распознавание образов может позволить приложениям автоматически генерировать ключевые слова и подписи для фотографий.
«Для того, чтобы улучшить эти системы компьютерного зрения и обучить их последовательно распознавать и классифицировать широкий спектр объектов, нам нужны наборы данных с миллиардами изображений» пишет Facebook. «Наши ученые и инженеры обратились к огромному набору открытых изображений с хэштегами. Сейчас для обучения доступно 3,5 миллиарда изображений и 17000 хештегов».
Благодаря тому, что в 2012 году Facebook купил Instagram за $1млрд, теперь компания имеет постоянно растущее количество фотографий, которые уже помечены пользователями Instagram.
Тренируя свою систему на 1 млрд фотографий и 1500 хэштегах из Instagram в течение нескольких недель, используя 336 графических процессоров, Facebook удалось достичь рекордной оценки точности 85,4% на ImageNet. Прежние методы могли достичь отметки 83,1%.
Facebook всё ещё изучает методы улучшения системы и планирует использовать весь потенциал 3.5+ млрд фотографий и 17000 хештегов.
Следите за новостями: Facebook, Вконтакте и Telegram