Новый российский алгоритм в пять раз ускорит анализ геоданных
Как пишет РИА Новости, принципиально новый подход к пространственной индексации объектов на земной поверхности, который повысит ее производительность в 5-6 раз, предложили ученые МИИГАиК. По их мнению, новый подход найдет применение в системах экологического мониторинга, городского управления, логистики и других пространственных моделях любого масштаба и назначения. Об этом РИА Новости сообщили в пресс-службе вуза.
Индексация — это краеугольный камень всех современных баз данных. Именно благодаря ей возможно из миллионов и миллиардов записей найти необходимые практически моментально. Простейшим, знакомым всем индексом является алфавитный указатель в книге, сообщил доцент кафедры информационно-измерительных систем Московского университета геодезии и картографии (МИИГАиК) Олег Гвоздев.
"Пространственные индексы, в свою очередь, позволяют быстро искать пространственные объекты, имея координаты в пространстве. Найти ближайшую станцию метро или ресторан. Направить обращение в обслуживающую конкретный адрес диспетчерскую скорой помощи или пожарной. Распределить нагрузку на сотрудников курьерской службы и пункты самовывоза. Сформировать отчет, отражающий распределение событий по районам города и решить другие повседневные задачи", — рассказал Гвоздев.
Олег Гвоздев отметил, что обычные методы пространственной индексации позволяют найти объекты, близкие к нужной области, но каждый из них нужно проверить на точное совпадение требованиям запроса.
"Наш метод позволяет сразу получить готовый результат, не обращаясь к данным этих объектов. Более того — он позволяет устранить повторные проверки, для случаев, когда, например, несколько объектов имеют общие точки или границы. Это существенно сокращает объем вычислений и дает 5-6-кратный прирост производительности, по сравнению с доминирующими на рынке универсальными решениями (PostgreSQL+PostGIS), и до 30 процентов — по сравнению со специализированными высокопроизводительными методами на базе сеточных индексов", — пояснил он.
По мнению авторов, предлагаемый метод будет особенно полезен в системах типа "умный город" или "цифровой двойник", куда данные поступают непрерывным потоком, а количество запросов достигает нескольких десятков тысяч в секунду, и уже в этом десятилетии может достичь уровня миллионов в секунду.
Другое потенциальное направление применения разработки — "наука о данных" (Data Science) и анализ больших данных (Big Data Analytics), которые лежат в основе современных методов выработки рациональных управленческих решений в коммерческих организациях и общественных институтах.
"Этот результат усиливает и дополняет существующую инструментальную базу, доступную исследователям и разработчикам. С его помощью можно оптимизировать решение множества практически значимых задач. А он, в свою очередь, основан на еще более фундаментальных исследованиях в области теории построения адаптивных информационных и геоинформационных систем. Все это способствует выходу геоинформатики на новый виток интенсивного развития", — рассказал Олег Гвоздев.
В заключение ученый напомнил, что любой способ высвободить 5 процентов или даже 2 процента вычислительной мощности позволяет провести больше экспериментов, проанализировать больше данных, а в перспективе — совершить новые открытия. К тому же, предложенный метод принципиально расширяет инструментальную базу специалистов в Data Science.
Идея связи координат и ID объектового состава поисковых систем не нова. По меньшей мере лет 30 существуют БД с полями координат и форматы обмена типа Gazetteer. Статья, по подаче полный аналог речи О.Бендера на собрании шахматного клуба. Хорошо бы сообщить хотя бы ссылочку на описание самого инновационного метода. Одними Нью-Васюками, как-то неубедительно.