Однією з постійних проблем під час навігації за допомогою Карт Google є визначення правильного напрямку руху: звичайно, програма говорить вам йти на північ - але часто у вас виникає питання: “А де я зараз, і де та північ?” Протягом багатьох років ми намагалися підвищити точність за допомогою таких інструментів, як GPS і компас, але виявили, що обидва інструменти мають фізичні обмеження, які роблять вирішення цієї проблеми складним, особливо в міських умовах.
Ми експериментуємо, як вирішити цю проблему за допомогою технології, яку ми називаємо глобальною локалізацією, і яка поєднує в собі сервіс візуального позиціонування (
Visual Positioning Service - VPS), режим Перегляду вулиць (
Street View) і машинне навчання для більш точного визначення місцезнаходження та орієнтації. Використовуючи камеру смартфона як сенсор, ця технологія забезпечує більш потужний та інтуїтивно зрозумілий спосіб допомогти людям швидко визначити, куди прямувати.
У міських умовах орієнтування лише за допомогою GPS може бути обмеженим. Використовуючи VPS, Street View і машинне навчання, глобальна локалізація може надати кращі дані щодо того, де ви наразі по відношенню до того, куди ви прямуєте.
У цій публікації ми розглянемо деякі обмеження навігації в міських умовах і те, як глобальна локалізація може допомогти їх подолати.
Де GPS не допоможе
Процес ідентифікації положення і орієнтації пристрою щодо деякої опорної точки називається
локалізацією. Різні технології забезпечують локалізацію по-різному.
GPS покладається на вимірювання затримки радіосигналів від декількох спеціальних супутників, щоб визначити точне місцезнаходження. Тим не менш, в умовах щільної міської забудови, наприклад, в Нью-Йорку або Сан-Франциско, може бути неймовірно важко визначити географічне положення через погану видимість неба і сигнали, що відбиваються від будівель. Це може призвести до дуже неточного визначення місця розташування на карті, а це означає, що ваше місцезнаходження може виявитися на неправильній стороні вулиці або навіть за кілька кварталів.
GPS сигнали відбиваються від фасадів у міському середовищі.
GPS має ще один технічний недолік: він може визначити тільки місце розташування пристрою, а не орієнтацію. Іноді сенсори у вашому мобільному пристрої можуть виправити ситуацію шляхом вимірювання магнітного та гравітаційного поля землі та відносного руху пристрою, щоб дати приблизну оцінку вашій орієнтації на місцевості. Але показники цих датчиків спотворюються магнітними об'єктами, такими як автомобілі, труби, будівлі і навіть електричні дроти всередині телефону, що призводить до помилок, які можуть бути неточними до 180 градусів.
Новий підхід до локалізації
Для підвищення точності положення та орієнтації на карті необхідна нова допоміжна технологія. Коли ви йдете вулицею, ви орієнтуєтесь, порівнюючи те, що ви бачите, з тим, що ви очікуєте побачити. Глобальна локалізація використовує комбінацію технологій, які дозволяють камері на вашому мобільному пристрої орієнтуватися так, як ви.
VPS визначає розташування пристрою на основі зображень, а не сигналів GPS. VPS спочатку створює карту, беручи серію зображень, які мають відому локацію, та аналізують їх для визначення ключових візуальних функцій, таких як контури будівель або мостів, щоб створити великий та швидкий індекс цих візуальних можливостей для пошуку. Щоб локалізувати пристрій, VPS порівнює функції зображень від телефону з індексами VPS. Проте на точність локалізації через VPS значною мірою впливає як якість зображення, так і пов'язане з нею розташування. І це ставить ще одне питання - де можна знайти джерело високоякісних глобальних зображень?
Увійдіть в режим Street View
Більше 10 років тому ми запустили режим
Перегляду вулиць на Картах Google, щоб допомогти людям краще досліджувати світ. За цей час Street View продовжував розширюватись світом, надаючи можливість людям не тільки переглядати свій маршрут, але й заходити всередину відомих пам'яток і музеїв, де б вони не знаходилися. Щоб забезпечити глобальну локалізацію за допомогою VPS, ми під’єднали його до даних Street View, використовуючи інформацію, зібрану та протестовану з більш ніж 93 країн світу. Цей багатий набір даних забезпечує трильйони орієнтирів для застосування тріангуляції, що допомагає більш точно визначити положення пристрою та спрямувати людей до місця призначення.
Характеристики, які збігаються з багатьма зображеннями
Незважаючи на те, що цей підхід добре працює в теорії, зробити його ефективним на практиці - це та ще проблема. Вона полягає в тому, що зображення з телефону під час локалізації можуть відрізнятися від того, як виглядав пейзаж, коли були зібрані зображення Street View, можливо, кілька місяців тому. Наприклад, дерева мають багато деталей, але змінюються з сезонами, і навіть коли дме вітер. Щоб отримати гарну відповідність, нам потрібно відфільтрувати тимчасові частини пейзажу та зосередитися на постійній структурі, яка з часом не змінюється. Ось чому основний компонент цього нового підходу полягає у застосуванні машинного навчання для автоматичного вирішення, на які особливості слід звернути увагу; визначенні пріоритетів характеристик, які, ймовірно, є постійними частинами пейзажу, та ігноруванні таких речей, як дерева, динамічний рух світла та тимчасове будівництво. Це лише один з багатьох способів, як ми використовуємо машинне навчання для підвищення точності.
Об'єднання глобальної локалізації з доповненою реальністю (AR)
Глобальна локалізація є додатковою опцією, яку користувачі можуть увімкнути, коли їм найбільше потрібна точність. І ця підвищена точність забезпечує можливість відчути низку нових вражень. Однією з новітніх функцій, які ми тестуємо, є можливість використання
ARCore, платформи Google для створення досвіду доповненої реальності для накладання напрямків на Карти Google під час використання режиму пішохідної навігації. Завдяки цій функції швидкий погляд на телефон покаже вам, в якому напрямку потрібно йти.
Хоча ранні результати є багатообіцяючими, попереду ще значна робота. Одним із завдань є те, щоб ця технологія працювала скрізь, у всіх умовах - пізно ввечері, в снігопад або в зливу. Щоб переконатися, що ми створюємо щось дійсно корисне, ми починаємо тестувати цю функцію за допомогою обраних
місцевих експертів, невеликої групи ентузіастів Карт Google у всьому світі, які, ми знаємо, нададуть нам відгуки про те, як цей підхід можна зробити більш корисним.
Як і в інших технологіях, що використовують штучний інтелект, таких як
Google Lens (що використовує камеру для пошуку того, що ви бачите), ми вважаємо, що можливість накладання напрямків на реальне середовище пропонує цікавий і корисний спосіб використання вже існуючої технології прямо у вашій кишені. Ми з нетерпінням чекаємо на подальшу розробку цієї технології, а також можливість камер смартфонів додавати нові типи цінних досвідів.
Автор: Тільман Рейнхардт, інженер, Карти Google
Немає коментарів :
Дописати коментар