Te-st.ru: революция открытых данных - ожидания и результаты
На сайте "Теплица социальных технологий" опубликована статья "Революция открытых данных: ожидания и результаты". Полностью с материалом можно ознакомиться по ссылке.
К чему нас привело появление открытых данных? The Economist анализирует «революцию открытых данных»: успехи, проблемы и их возможные решения.
Шесть лет назад Америка стала страной, сделавшей все правительственные данные открытыми, не считая персональной информации и данных, относящихся к национальной безопасности. С тех пор более 200 000 наборов данных были опубликованы на официальном сайте data.gov.
Более 70 других стран также сделали свои данные открытыми. Согласно Open Knowledge, более 1 миллиона наборов данных были опубликованы на различных порталах.
В результате мы увидели появление большого количества транспортных расписаний, данных о преступлениях, загрязнении воздуха и налогах. Но, несмотря на то, что все это, безусловно, помогло сделать жизнь людей лучше, не ясно, способно ли это привести к значительной трансформации, – для того чтобы она произошла, первоначальный энтузиазм, с которым были опубликованы данные, должен превратиться в здоровый прагматизм.
Успехи открытых данных
Во многих городах пользователи смартфонов могут узнать, когда придет их автобус, на основании аудита больниц решить, куда обратиться за медицинской помощью, а GPS, американская военная система навигации, теперь может быть найдена где угодно – от приложений для знакомств до микрочипов в ошейниках собак.
Многие города используют отчеты жителей о ямах на дорогах или неработающих фонарях. Открытые данные помогают и в борьбе с коррупцией. Так, например, в 2014 году в Мексике благодаря открытым данным было обнаружено более 1 400 работающих учителей, родившихся в один и тот же день в 1912 году, что позволило убрать этих «призраков» из платежной системы.
Это все безусловные успехи открытых данных. Но, учитывая огромное количество имеющихся наборов данных, возникает вопрос, почему с их помощью мы не достигли большего.
Проблемы открытых данных
По мнению The Economist, на этот вопрос есть четыре ответа.
Во-первых, открытые данные часто бесполезны. Во-вторых, программистам и предпринимателям, которые могли бы сделать из данных полезные продукты, бывает очень сложно в них разобраться. В-третьих, специалистов, которые могут работать с открытыми данными, недостаточно. Наконец, в-четвертых, вопросы безопасности личной информации по-прежнему не решены.
Возможно, больше половины всех открытых данных вообще не имеют практической пользы. Например, один из наборов данных в Америке включает в себя последние слова людей, приговоренных к смертной казни в Техасе. Другой части данных не хватает важных метаданных – описательных тегов, без которых сырая информация может не иметь значения. В некоторых странах открытые данные настолько сфабрикованные или некачественные, что многие организации предпочитают собирать данные самостоятельно.
Поиск открытых данных также часто становится сложной задачей, а некоторые наборы данных на государственных порталах являются устаревшими.
Нельзя не отметить и недостаток знаний и навыков по работе с открытыми данными среди должностных лиц, активистов и журналистов. При этом проблема не в том, что только немногие люди обладают специальными навыками, многие испытывают сложности даже с тем, чтобы интерпретировать цифры. Гэвин Старкс из Open Data Institute приводит в пример членов британского парламента, большинство из которых не смогли решить простой математический тест с двумя случайными величинами.
Тем не менее самая сложная проблема открытых данных в настоящий момент – это их приватность. Правительства, открывающие такую личную информацию, как налоговые, медицинские и образовательные данные, «ходят по минному полю». Несмотря на то, что такая информация является самой ценной и способна, например, значительно улучшить медицину, публичные скандалы, связанные с раскрытием личных данных, работают против них.
В настоящее время активисты открытых данных вместе с чиновниками и предпринимателями работают над решением этих проблем. Правительства начинают выпускать данные в машиночитаемом формате. Проводится все больше хакатонов по открытым данным, привлекающих энтузиастов и инвесторов, которые могут превратить идеи в успешные проекты. Некоммерческие организации учат людей тому, как работать с данными, – публикуют руководства и организуют обучение.
Проблема приватности сложнее, но и здесь возможны различные решения.
Возможность эффективного использования информации ДЗЗ в РФ заблокировано, как минимум, тремя не решаемыми проблемами:
• низким качеством первичных космических данных, поступающих со спутников РФ, что ставит в неравные условия российских и зарубежных потребителей космической информации;
• неспособность государственных структур обеспечить глубокую тематическую обработку информации ДЗЗ и представить, создаваемую информационную продукцию в виде сведений, получаемых потребителями ранее из традиционных источников;
• отсутствие государственной программы создания и эксплуатации авиационной компоненты национальной системы ДЗЗ, что лишает росийских потребителей возможности получения не менее 50% необходимой им информации.