Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июль 2012  
пн вт ср чт пт сб вс
           
8
15
16 17
23 24 25 26 27 28 29
30 31          

Бегтин объявил конкурс расшифровки госданных

Сервисы | Новости | 25.08.2010 17:39

Иван Бегтин, специалист по автоматическому извлечению и анализу данных, ратующий за предоставление государственными органами своих данных в машиночитаемом виде, организовал конкурс по разработке открытых парсеров для ряда государственных массивов данных. По его мнению, "не обязательно дожидаться, когда госорганы начнут публиковать данные в машиночитаемом виде".

На основе личных сбережений Бегтин создал скромный призовой фонд в 5-10 тысяч рублей, из которого будут выдаваться премии для участников. Если идея оправдает себя, "то суммы потом будут больше", пообещал Бегтин.

Массивами данных, которые, по его мнению, нуждаются в первоочередной обработке, являются Выписка из реестра плана нумерации Россвязи, Список членов Совета Федерации, Сведения о доходах сотрудников РосГраницы, Реестр недобросовестных поставщиков, Реестр лицензий на осуществление деятельности по организации и проведению азартных игр в букмекерских конторах, а также Сводная налоговая отчетность.

Требования, которые должны соблюдать создатели парсеров, таковы: код парсера должен быть открыт под лицензией, допускающей как некоммерческое, так и коммерческое использование (лицензии BSD, MPL, Apache License и т.п.); парсер должен быть написан на языке, не требующем компиляции (в порядке убывания: Python, Ruby, PHP); выходные данные должны быть в форматах CSV, XML и JSON, в зависимости от сложности их структуры; код должен быть легко читаемым (не подвергнут обфускации).

Несколько человек уже успели откликнуться на этот призыв и даже на скорую руку написать несколько парсеров. Сводная таблица с источниками госданных и ссылками на парсеры находится тут.

Напомним, что на счету самого Бегтина несколько проектов, так или иначе связанных с государственными данными. Последний сервис, который он представил, это РосГосЗатраты, который позволяет мониторить государственные расходы. С его помощью любой желающий может попытаться выяснить, какие суммы обычно тратятся на разработку подобных парсеров, и сравнить их с призовым фондом Бегтина.

(Обновлено 26.08.2010 в 18:10) Иван Бегтин обратил внимание на неточность, которая была допущена нами ранее. На тот момент речь ещё не шла о конкурсе, а было только обсуждение того, как этот конкурс должен проходить. Нас сбила с толку высокая активность граждан, которые стали создавать и публиковать парсеры, не дожидаясь собственно конкурса. Сам Бегтин отмечает, что не ожидал такого результата (уже 7 машиночитаемых массивов данных).

Что до конкурса, то схема его проведения уже выработана в результате обсуждения. С ней можно ознакомиться по этой ссылке.

разделы: Новости | Сервисы

Другие новости

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2012 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost