Минцифры создаст центр обезличивания данных для обучения ИИ
Как сообщает ПРАЙМ, Минцифры России в 2024 году планирует создать внутри своей информационной системы центр обезличивания, который будет обезличивать исходные персональные данные для дальнейшего использования, в том числе при обучении моделей искусственного интеллекта, заявил в интервью РИА Новости замглавы ведомства Александр Шойтов.
"ВКонтакте" и "Яндекс" стали лидерами среди компаний в сфере ИИ
"У нас в планах построение центра обезличивания – специальной инфраструктуры внутри ГИС Минцифры. Он будет брать исходные данные и делать из них обезличенные. Для того, чтобы создать центр, необходимо создать его макет — программно-аппаратный комплекс, и в процессе провести соответствующие исследования по обезличиванию", — сказал Шойтов.
По его словам, макет планируется создать на базе Национального технологического центра цифровой криптографии. "Первый вариант должен появиться в конце этого года. И уже полноценный макет, в котором будет реализовано много различных вариантов исходных данных, будет подготовлен к концу 2024 года… Центр обезличивания будет создаваться параллельно. Думаю, также в 2024 году", — отметил Шойтов.
Замглавы Минцифры добавил, что при обезличивании данных есть две задачи. "Первое — нужно сделать так, чтобы невозможно было достоверно установить по полученным обезличенным данным исходные данные конкретного человека. Второе – нужно сохранить их в качественном виде для последующего использования, например, для обучения искусственного интеллекта", — добавил Шойтов.
При этом вопрос обезличивания довольно сложный не только с технологической точки зрения, но и с нормативной. Сейчас в Госдуму внесен проект федерального закона, в котором предусматривается нормативное регулирование одного из подходов.
"Это этап, когда мы обезличиваем данные и из них формируем дата сеты под конкретные задачи внутри информационной системы Минцифры — в центре обезличивания. Туда приходят разработчики искусственного интеллекта и обучают свои модели на специально подготовленных для них наборах данных, не выходя за пределы системы", — подытожил Шойтов, отвечая на вопрос, где будут использоваться обезличенные данные.