Отворените данни ще позволят натиск за по-добро управление

Боян Юруков
Боян Юруков, един от пионерите на отворените данни в България, за проблемите и новите бизнес възможности от отварянето на публичната информация

Обработката на данни е един от най-перспективните нови бизнеси и оценките за потенциалната стойност, която отварянето на публичните данни може да създаде, достигат трилиони. Известно ли ви е проучване за потенциала в България?

Не ми е известно изследване на комерсиалните възможности. Наскоро завърши и предстои да се публикува изследване на готовността на институциите и очакванията на обществото. Проблемът с оценката на потенциала е, че ефектът на отворените данни е по-скоро косвен. Наистина, има бързо разрастващ се пазар за анализ и визуализация на информация като основни клиенти са банките и рекламните агенции. Той обаче е само част от историята.

Публичната информация създава предпоставки за по-добра комуникация между институции, клиенти и бизнеса. Ще помогне да се оптимизират разходите, да се открият нови пазарни ниши и възможности. Трудността се корени в разликата на пазарите и бизнес практиките. Никой не може да прецени как и до каква степен този тип прозрачност ще повлияе на бизнеса.

С какви проблеми се сблъсквате в усилията си за убедите администрацията в ползата от open data?

Най-вече съпротива към промяната като такава. Аз лично откривам предимно позитивно отношение към тази форма на публичност. Има желание, но проблемите са по-скоро процедурни. Друг проблем е липсата на хора с нужните знания, за да осъществят чисто технически публикуването на данните. Твърде много чиновници, от които зависи изготвянето на стандартите и осъществяването на стратегиите, не разбират какво са отворени данни, защо са нужни и как ще помогнат на тях лично. За някои това са поредната объркана заповед, спусната отгоре, за която ще трябва да загубят времето си. Точно това е и причината много от информационните системи у нас да не работят съвсем – липсва мотивация на ниско ниво да се използват и администрират както трябва. Ако не преодолеем този проблем, принципът на отворените данни няма да залегне в администрацията.

Какви примери за българска държавна администрация, която е предприела стъпки за предоставяне на отворени данни, бихте посочил? А за частни инициативи?

Положителен пример е Народното събрание, което преди няколко години обнови сайта си, публикувайки значителна част от информацията в отворен формат. И преди всеки можеше да отиде и да намери определен законопроект или решение. Сега обаче е много по-лесно да се анализира информацията.

Всъщност има много регистри у нас, които публикуват информацията си под формата на електронни таблици. Пример за това е регистъра за еврофондовете – там може да свалим всичко като един файл. Същият регистър обаче е и пример за основния проблем на публичността в България. Макар да имаме страшно много регистри, почти всички са неизползваеми когато опрем до реален анализ и автоматизация. При толкова много информация е невъзможно един човек или дори екип да прегледа и пресметне всичко. Затова се използват стандартни инструменти и отворени формати.

Регистърът за еврофондовете предоставя електронна таблица, но файлът често е развален или пълен с грешки. Същото важи за почти всички форми на публичност в сайтовете на институциите ни. Липсва изисквания и стандарти как да се публикува информацията и решението винаги опира до доброто желание на системите администратори или чиновници. Всъщност всички добри примери за публични данни у нас са такива точно защото някой чиновник е решил да направи нещо свястно.

Данните за бюджетните плащания чрез СЕБРА може ли да се третират като инициатива за отворени данни?

За жалост – не. Публикуването на бюджетните плащания беше стъпка напред, но само на думи. Практически никой не ги следи в момента. Причината е отново във формата. Всяко министерство и агенция публикува данните по свой начин – някои като електронна таблица, други като PDF и дори снимка на екрана. Липсва единна структура не само между институциите, но дори и месец за месец. Така, за да се направи елементарна справка, трябва няколко дни да се обработват документите на ръка. Единствено финансовото министерство публикува данните в по-добър формат.

След няколкократни разговори по темата стана ясно, че не е проблем да се стандартизират справките. Липсва единствено заповед от МС, която така и не дойде толкова години. Аз написах сайт, който обработва таблиците на МВР и ги показва като интерактивна графика. Оказва се обаче, че няколко пъти месечно уж автоматичните им справки показват елементарни грешки в пресмятането и отново се налага ръчно да се обработят. Това не са отворени данни, а илюзия за публичност.

Как ще коментирате изискването за въвеждане на код при всяка заявка към базата на Търговския регистър или при търсене в Системата за правна информация на МС. Това противоречи ли на духа на инициативата за отваряне на данни?

Абсолютно противоречи. Един от основателите на OpenCorporates (един вид глобален търговски регистър) беше направо слисан от captcha кода на Търговския регистър. Въведен е отчасти, за да предотврати претоварване на системата, но това е продукт на тотално сгрешен начин на мислене. Малко хора знаят, че всеки може да получи цялата база данни на търговския регистър, но срещу 30 000 лв. Никой не успя да ми обясни защо е избрана точно тази сума. Не оправдава разходите по поддържане на сървърите или тези по интеграция. Единствено 3-4 фирми в момента я плащат. Ефектът е, че който не иска да плаща на тези няколко фирми за достъп до иначе публична информация, трябва да се пребори със сайта на Агенцията по вписванията. Алтернативата е да махне таксата изцяло и така да се създаде среда за различни сайтове и приложения предоставящи информацията в бърз и достъпен вид. Така ще намалее натоварването на сайта на Търговския регистър и разходите им за поддръжка ще паднат многократно. Борим се за това от доста време и вече има изгледи да се случи. Това би била истинска публичност. Сегашният им сайт е точно обратното.

Очаквате ли да бъде въведена директивата до 2015 г. Дали отварянето на данни ще е свързано с големи разходи?

Вече текат дебати за транспонирането на директивата. Надявам се това да стане скоро. Тя ще ни даде повече инструменти в изискването на данни от институциите. Прилагането й ще е истински трудната задача. Не защото чиновниците ще искат да крият данни, макар и това да го има понякога, а защото наложеният начин на мислене в държавната ни администрация е да се крие всичко по подразбиране. Има и хора, които разбират от ползата от публичните данни, но те са единици.

Разходи определено ще има, но далеч няма да са големи. Повечето от съществуващите информационни системи имат функции, позволяващи публикуването на информация. Големият разход ще дойде от там да се документира и прецени кое може да е публично и кое – не. Тази задача всъщност е и в сърцето на електронното управление, където тези две теми се преплитат. Там, където е технически невъзможно да има отворени данни, не може и да се свържат системите една с друга и следователно – не можем да говорим за eGov.

Какъв бизнес модел е приложим за България? Търсили ли са ви за комерсиални проекти?

Като начало мисля, че има доста работа в анализа и визуализацията на данни. Както с всеки IT бизнес, тук трябват минимални инвестиции и има налични специалисти. Вече има доста български фирми, които се занимават с това и работят с чужди компании. Публичните данни от държавната администрация няма да създадат нов пазар, а по-скоро ще захрани съществуващия с нови възможности. Един свободно достъпен Търговски регистър, например, би позволил десетки различни приложения с различен модел на заплащане и функции.

Най-голяма полза от тях на този етап биха имали журналистите и неправителствените организации, които също имат нужда от професионален анализ. Точно такива са ме търсили досега.

Грешката, която не трябва да правим, е да очакваме, че отворените данни на държавните институции са универсален лек за проблемите на демократичния процес или нова бизнес възможност. Те са просто инструмент, който може да се използва както от активисти, така и от бизнесмени. Тяхно решение ще е дали да се насочат към него директно, предлагайки услуги базирани на публична информация или ще ги използват косвено, за да развиват бизнеса си. По-голямата и по-добра прозрачност сама по себе си няма да реши никой от проблемите на бизнес средата и обществото. Дори по-лошо – тя ще разкрие повече проблеми в процедурите, регулациите и прилагането им. Може да използваме тези знания обаче да натискаме за конкретни промени и решения.

Визитка

Боян Юруков е известен блогър и участник в инициативата за отворено управление. Негови са повечето известни визуализации на отворени данни – http://opendata.yurukov.net/

Снимка: TEDxBG 2014/Илиян Ружин