Как сообщает Вестник ГЛОНАСС, синтетические данные – это именно то, на что они похожи, искусственно сгенерированные данные, рассказал Джастин Дэвис, старший менеджер производящей спутники компании «Плэнет», в шоу Mapscaping. Они создаются с использованием ряда моделей физических процессов и используются многими крупными технологическими компаниями для решения самых разных задач, от разработки рекомендаций для автономных транспортных средств до разработки аналитических материалов для финансового сектора.
Синтетические данные сейчас занимают важное место в области искусственного интеллекта (ИИ), поскольку их можно использовать для быстрой загрузки обучающих наборов данных для моделей компьютерного зрения. Это быстрый способ понять, насколько хорошо работает модель, или сгенерировать много данных для создания новой модели.
Контролируемое и неконтролируемое машинное обучение – это распространённые модели обучения, используемые в ИИ. По сути, контролируемое машинное обучение использует помеченные данные, в то время как неконтролируемое машинное обучение – нет.
При контролируемом машинном обучении большая часть данных должна быть помечена с самого начала, чтобы модель могла понять, что она пытается найти. Широкое определение объектов, которые ищет модель, позволяет рассчитать улучшения в будущем и помогает избежать зацикливания на узком определении, которое упускает ценные варианты использования после нескольких месяцев обучения модели.
Например, с помощью функции обнаружения изменений на дорогах и в зданиях программа изначально обозначала дороги как всё, по чему может безопасно и разумно проехать грузовик, а здания – как всё, под чем может находиться человек.
При машинном обучении без контроля у вас появляется немного больше свободы. Вместо того, чтобы заранее определять, что именно должна искать модель, она проанализирует данные в целом и сгруппирует похожие характеристики. Например, вместо того чтобы модель искала дороги в том виде, в каком они были определены вами, модель будет автоматически группировать изображения с дорогами на основе общих атрибутов. При таком подходе вы можете довольно легко работать в обратном направлении, поскольку вы в состоянии определить решение по каждому объекту постфактум.
Новые разработки в отрасли расширяют возможности, выходящие за рамки поиска сходства и классификации изображений. Есть основания полагать, что мы сможем определить, что на самом деле происходит в любой конкретной области с течением времени, с помощью новых подходов к ИИ.
Существует возможность создания базовой модели спутниковых изображений, которую организации и частные лица могли бы адаптировать, подобно тому, как сейчас используются большие языковые модели. Хотя он отмечает, что для обучения и создания этой модели на начальном этапе потребуется много данных, в один прекрасный день это может стать возможным, основываясь на том, что уже развивается на рынке.