Если вы когда-нибудь играли в игру GeoGuessr , вы будете знать, как трудно найти где-то чисто изображение. В онлайн-игре вы попадаете в Google Street View в случайном месте, и ваша задача - определить, где вы находитесь в мире, используя только видимые подсказки. Но даже будучи пространственными существами, нам, людям, трудно отличить нашу австралийскую глубинку от нашего южноафриканского куста.
Теперь Google разработал машину искусственного интеллекта, способную к «сверхчеловеческим уровням точности», когда дело доходит до угадывания местоположения на основе только пикселей фотографии.
Тобиас Вейанд (Tobias Weyand), один из мозгов Google, и команда, которая специализируется на разработке «компьютерного зрения», разработали PlaNet - глубокую нейронную сеть, способную определять, где было снято изображение, исключительно на его пикселе.
Для разработки «пространственной памяти» компьютера команда предоставила 91 миллион изображений с геотегами. Используя эти данные, они разбили карту на сетку, состоящую из более чем 26 000 квадратов, размер квадратов которых пропорционален количеству изображений, снятых там. Большие города с высокой концентрацией населения, как правило, состоят из большего количества площадей по сравнению с сельской местностью. Таким образом, было недостаточно изображений, чтобы включить океан или полярные регионы.
На протяжении всего этого процесса глубокая нейронная сеть обнаруживает тенденции и визуальные сигналы, которые появляются на фотографиях в той же сетке, такие как цвет, текстура и форма. Например, сеть могла бы уловить отличительные красные и коричневые оттенки скалы Гранд-Каньона по бесчисленным фотографиям местности.
Некоторые из предположений PlaNet. Изображение предоставлено: Google / Tobias Weyand et al.
Чтобы проверить нейронную сеть, они дали ей 2,3 миллиона фотографий с геотегами от Flickr, чтобы посмотреть, сможет ли он угадать, где было сделано изображение. Компьютер правильно угадал континент по 48 процентам изображений и определил страну по 28,4 процентам. Кроме того, учеба утверждает, что может «локализовать 3,6 процента изображений с точностью на уровне улицы и 10,1 процента с точностью на уровне города».
Хотя это может показаться не совсем точным, но намного лучше, чем у людей. В игре GeoGuessr команда «PlaNet» выступила против «10 хорошо путешествующих людей». PlaNet выиграл 28 раз из 50 со средней ошибкой 1131,7 километра (703 мили), в то время как люди находились вне цели в среднем на 2320,75 километра (1442 мили).
Примечательно, что исследователи утверждают, что PlaNet даже имеет возможность определять местоположение изображений в помещении, подбирая определенные предметы, MIT Technology Review отчеты.
Вы можете подумать, что у людей будет преимущество, как объясняется в исследовании: «В отсутствие очевидных и дискриминационных ориентиров люди могут прибегнуть к своим познаниям в мире и использовать несколько подсказок, чтобы определить местоположение фотографии.
«Язык уличных знаков или направления движения автомобилей может помочь сузить круг возможных мест. Традиционные алгоритмы компьютерного зрения обычно не имеют такого рода мировых знаний, полагаясь на функции, предоставляемые им во время обучения ».
Тем не менее, Вейанд и коллеги предполагают, что PlaNet на самом деле имеет преимущество, поскольку ему было предоставлено больше изображений мест, чем любой человек мог когда-либо путешествовать, и он научился распознавать едва различимые сигналы из миллионов различных сцен.
Вы можете прочитать полное описание их развития в исследовании в Arxiv ,
[H / T: MIT Technology Review ]
Похожие
Google Shopping - Как сделать это лучше. 1 - блог Google AdWords... определять правильную структуру наших продуктовых кампаний, полезно знать, какие у нас есть варианты. Торговые кампании можно разделить на три основных уровня: кампания Группы объявлений Товарные группы (на основе данных из подачи продукта) Каждый из них дает нам некоторые возможности для управления продуктами, а их общая комбинация позволяет нам точно определять способ отображения наших продуктов в результатах поиска. Как печатать с iPad, iPhone, Android & More
Обновлено: март 2017 По оценкам, во всем мире 4 миллиарда человек имеют смартфоны со встроенными камерами. Даже консервативная оценка В 2017 году с помощью смартфонов будет сделано 1,2 Тест Sony Xperia L
... изображения и видео 5. Выводы / плюсы и минусы / альтернативы 6. Технические данные Качество исполнения и ценность Если вы возьмете Sony Xperia L1 в руки, сразу же создаст ощущение уюта Xperia. Все хорошо и обрабатывается. Хотя корпус L1 выполнен из пластика, это не портит качественный внешний вид. Спина тусклая и ноль подвержена Мы проверили, какие фотографии делает Nokia Lumia 1020
Мы первыми в Польше получили новейший смартфон Nokia Lumia 1020. Смартфон или, может быть, камера? На сегодняшней пресс-конференции Nokia этот вопрос звучал несколько раз. В конце концов, 41-мегапиксельная камера необычна , и не только в области мобильной фотографии. Телефон у меня в руках с полудня, и я уже выработал первое мнение по этому поводу . Asus ZenFone 4 Pro: тестируемая камера
© Asus в текущее оборудование дизайн несколько фокусных расстояний вывод Результат теста «Цветное фото»: 60 баллов; Совет покупки: фокусное расстояние С серией ZenFone 4 Asus хочет догнать лучших собак Apple, HTC, Huawei и Samsung. Любой, кто заигрывает с приобретением такого устройства, должен обратить внимание на различные 1020. Смартфон или, может быть, камера?