|
РАЗДЕЛЫ
Архив
|
Бегтин объявил конкурс расшифровки госданныхИван Бегтин, специалист по автоматическому извлечению и анализу данных, ратующий за предоставление государственными органами своих данных в машиночитаемом виде, конкурс по разработке открытых парсеров для ряда государственных массивов данных. По его мнению, "не обязательно дожидаться, когда госорганы начнут публиковать данные в машиночитаемом виде". На основе личных сбережений Бегтин создал скромный призовой фонд в 5-10 тысяч рублей, из которого будут выдаваться премии для участников. Если идея оправдает себя, "то суммы потом будут больше", пообещал Бегтин. Массивами данных, которые, по его мнению, нуждаются в первоочередной обработке, являются Выписка из реестра плана нумерации Россвязи, Список членов Совета Федерации, Сведения о доходах сотрудников РосГраницы, Реестр недобросовестных поставщиков, Реестр лицензий на осуществление деятельности по организации и проведению азартных игр в букмекерских конторах, а также Сводная налоговая отчетность. Требования, которые должны соблюдать создатели парсеров, таковы: код парсера должен быть открыт под лицензией, допускающей как некоммерческое, так и коммерческое использование (лицензии BSD, MPL, Apache License и т.п.); парсер должен быть написан на языке, не требующем компиляции (в порядке убывания: Python, Ruby, PHP); выходные данные должны быть в форматах CSV, XML и JSON, в зависимости от сложности их структуры; код должен быть легко читаемым (не подвергнут обфускации). Несколько человек уже успели откликнуться на этот призыв и даже на скорую руку написать несколько парсеров. Сводная таблица с источниками госданных и ссылками на парсеры находится . Напомним, что на счету самого Бегтина несколько проектов, так или иначе связанных с государственными данными. Последний сервис, который он представил, это РосГосЗатраты, который позволяет мониторить государственные расходы. С его помощью любой желающий может попытаться выяснить, какие суммы обычно тратятся на разработку подобных парсеров, и сравнить их с призовым фондом Бегтина. (Обновлено 26.08.2010 в 18:10) Иван Бегтин на неточность, которая была допущена нами ранее. На тот момент речь ещё не шла о конкурсе, а было только обсуждение того, как этот конкурс должен проходить. Нас сбила с толку высокая активность граждан, которые стали создавать и публиковать парсеры, не дожидаясь собственно конкурса. Сам Бегтин отмечает, что не ожидал такого результата (уже 7 машиночитаемых массивов данных). Что до конкурса, то схема его проведения уже выработана в результате обсуждения. С ней можно ознакомиться . комментарии(0) | Материалы по теме Иван Бегтин: "Гос.данные должны раскрываться в машиночитаемой форме" Бегтин будет следить за госзаказами Другие новости |
Последние комментарии
Гость про Free-lance.ru: "Крупные заказчики созрели" (9)
Гость про Принцип Питера 2.0 (72)
Некропостер про Навальный дискредитирует себя контролерами (63)
Гость про Детское порно не умрет без стукачей (124)
Гость про "Вконтакте" три раза за месяц отказался от инвестиций (65)
Корочун про "Флибусту" закрыли копирасты (39)
Гость про Рунет урезали на 250 детских порно-сайтов (2)
Гость про "Газета.Ру" получила дизайн от Лебедева (17)
все комментарии Гость отвечает: Как создать онлайн игру? Гость отвечает: Что нужно для создания торрент-сервера? Гость отвечает: Почему Gmail пишет Bad Request? akram4018 отвечает: Не могу зайти в однокласники выдает-Валидация аккаунта Макс31313131 отвечает: я не могу зайти на сайт в контакте и одноклассники Гость отвечает: Нужна ли отдельная социальная сеть города? Пример www.navoi.net Дарья спрашивает: Кто еще не нашел работу, вакансию в Москве? Гость отвечает: не могу зайти в контакт и это точно не вирус Гость отвечает: Как вконтакте можно ограничить доступ к своей странице? |
Copyright © 2001-2012 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.