На пути к решению проблемы Больших данных в автономном вождении
Как сообщает Вестник ГЛОНАСС, появление беспилотных автомобилей тесно связано с прогрессом в области искусственного интеллекта (AI) и робототехники. Однако беспилотным автомобилям нужно нечто большее, чем просто AI и машинное обучение.
Для построения своего маршрута каждый беспилотный автомобиль отправляет и получает множество данных от различных датчиков, таких как ГНСС, сонары, радары, лидары, камеры и так далее. Информация из всех этих источников должна обрабатываться очень быстро, практически в режиме реального времени. И количество данных здесь действительно огромно. Встроенный компьютер автомобиля не может обрабатывать все данные. Часть информации передаётся для дальнейшего анализа на периферийные серверы и центры обработки данных.
Решающее значение имеют не только алгоритмы AI, но и возможности установленных компьютеров и облака. В наши дни жизненно важны скорость приёма и отправки данных на машине и низкая задержка.
Даже обычные транспортные средства, которыми управляют люди, генерируют огромные объёмы данных. Беспилотные же автомобили создают до 1 терабайта данных каждый час. Этот огромный объём данных представляет собой препятствие для быстрого внедрения автономных автомобилей.
Все данные, генерируемые беспилотными автомобилями, не могут быть обработаны периферийными серверами или в облаке, поскольку это вызывает серьёзные задержки. Каждая задержка в 100 мс может провести черту между жизнью и смертью пешехода или пассажира.
Чтобы уменьшить задержки при отправке и получении данных и реагировании на новые ситуации, некоторые части данных анализируются компьютером автомобиля. Современные автомобили оснащены вычислительными ядрами, число которых доходит до 50 и которые выполняют такие функции, как мониторинг слепых зон, круиз-контроль, предупреждение о препятствиях, автоматическое торможение и так далее.
Автомобильные узлы взаимодействуют друг с другом и с внешними серверами. В результате беспилотные автомобили представляют собой гибридную сеть, включающую в себя облако, локальные центры обработки данных и множество периферийных узлов.
Узлы связи, расположенные на зарядных станциях, светофорах и постах управления, должны оказывать автомобилям дополнительную помощь в безопасном автономном вождении. И, как говорят специалисты по безопасности из VPNBrains.com, все коммуникации должны быть защищены с помощью безопасных частных туннелей.
Диапазон окружающей среды, которую могут анализировать автомобили, увеличивается день ото дня. Тем не менее, каждое транспортное средство может хранить и собирать только ограниченный объём данных. Необходим обмен информацией. Более значительный набор данных, генерируемый парком автономных транспортных средств, помогает лучше анализировать окружающую среду.
Технологии связи между транспортными средствами создают ячеистые сети, состоящие из автомобилей, расположенных в одном и том же районе. V2V можно расширять и обмениваться данными со светофорами и другими подключёнными объектами. Итак, мы потихоньку движемся к переходу от автомобиля к инфраструктуре (V2I).
Беспилотные автомобили постоянно учатся. Они могут отправлять полезную информацию на локальные периферийные серверы, встроенные в светофоры или зарядные станции. Эти зарядные станции могут использовать AI для анализа новых данных, полученных от транспортных средств, и предлагать лучшие решения по маршруту.
С помощью облака эту информацию можно отправить другим беспилотным автомобилям в той же сети. Опять же, эта модель обмена данными означает, что каждый день генерируются эксабайты новых данных.
Беспилотные автомобили должны получать информацию о других автомобилях, велосипедистах и пешеходах не только от собственных датчиков, но и от других автомобилей и другой городской инфраструктуры. Здесь пригодятся возможности, предлагаемые 5G. 5G может обеспечить необходимую скорость, низкую задержку и поддерживать множество одновременных подключений.
На самом деле, беспилотные автомобили не смогут стать полностью автономными без 5G.
Операторы мобильной связи потратили миллиарды на создание сетей 5G. Пришло время интегрировать эту технологию и помочь автомобилям использовать ее в повседневных ситуациях.
Каждый беспилотный автомобиль может генерировать до 20 ТБ в день. Мобильная сеть должна иметь возможность передавать все эти данные. Эксперименты с 5G и автономным вождением не увенчаются успехом, если инфраструктура 5G не будет полностью готова.
Для полноценного внедрения автономного вождения необходимо решить все вопросы с хранением и обработкой огромных массивов данных. Компьютеры автомобиля имеют ограниченные возможности хранения и производительности. В то же время не все данные требуют немедленной обработки. Данные, которые сейчас не важны, могут быть накоплены и проанализированы позже периферийными серверами и облаком.
Старые данные, такие как информация о скорости и местонахождении автомобиля несколько часов назад, полезны при обучении алгоритмов автономного вождения. Разработчики систем машинного обучения должны иметь достаточно данных для обучения своих сетей. Подразделениям по безопасности дорожного движения нужна информация о местонахождении и скорости автомобилей в момент аварии.
Опять же, столкнемся с эксабайтами данных. Для их хранения потребуется гибкая, свободная от вредоносных программ и высокопроизводительная периферийная инфраструктура. Становится очевидной проблема использования оптимальной архитектуры хранения данных. Свежие данные, которые необходимо немедленно проанализировать, можно временно хранить на дисках HAMR большой емкости и твердотельных накопителях. Они предлагают очень низкую задержку, хорошую пропускную способность и поддерживают многодисковые технологии.
После этапа начального анализа данные должны храниться более эффективно в недорогих периферийных хранилищах. Старые данные, которые необходимо сохранить на будущее, можно перенести в архивы.
Данные все чаще обрабатываются на периферии, приближая нас к эпохе Индустрии 4.0. Пограничные вычисления означают, что данные будут обрабатываться там, где они были собраны, а не в традиционном облаке. Это позволит намного быстрее анализировать данные, мгновенно реагируя на изменение ситуации.