Революцията на отворените данни е следващото голямо нещо, което българската администрация пропуска – поради ведомствен феодализъм, недостиг на компетентност и дефекти на информационните системи. Отварянето на масивите от информация ще подобри контрола над държавното управление, което е очевидното предимство. Освен това то ще позволи на много стартиращи предприятия да опитат създаването на иновативни продукти. Резултатът ще бъдат неочаквани идеи и нови услуги. Управлението на кризи като наводненията ще бъде облекчено, тъй като отворените данни насърчават взаимодействието. Но добрите примери у нас в тази сфера още са малко.

Докато правехме рейтинга на регионите по икономически, социални и други индикатори се натъкнахме на сериозни проблеми с данните.

Един от тях бе невъзможността за надеждна оценка за качеството на въздуха по региони. На сайта на МОСВ и Изпълнителната агенция има много информация (предимно ПДФ файлове), но тя е структурирана и представена по начин, който на практика не допуска обработка. Макар и любезни, служителите също не успяха да помогнат да намерим необходимите ни данни. Искахме, например, да свържем различните измервания за качеството на въздуха по региони, за да конструираме общ индикатор за замърсеност. Оказа се, че не можем да изтеглим данни в удобен формат.

Друг  пример е достъпът до информация за кризисни събития. На сайта на НСИ има исторически данни за наводнения, пожари и земетресения, БАН и Иниститутът по метеорология публикуват също някои данни, а басейновите дирекции представят карти (jpeg) и доклади за риска от наводнения. Трудно е да се обработи това, за да се създаде оценка по региони за риска от кризисни събития. Затова е добре, че в София (все пак защо не в по-застрашени райони?) вече ще има хидрометрични станции с радарни сензори за предупреждение за наводнения. А през 2015 г. ще бъде представена карта за районите в риск от наводнения. Но не е достатъчно да видим картинка с оцветени зони по райони. Подобна информация е нужно да се представи като отворени данни, така че да може да се обработва повторно.

На други места по света подобна информация задвижва истинска революция в информационните услуги. Суровите данни на американската ЕPA за качеството на въздуха, например, отдавна се публикуват в отворен формат, което позволява те да се комбинират по неочакван начин. Такива приложения са особено важни за медицинските изследвания, за застрахователите и, разбира се, за градските власти.

Оценките за потенциала на тази индустрия са еуфорични. Твърди се, че тя може да създаде стойност за трилиони долари.

Представете си, че Столичната компания за градски транспорт публикува свободно данните за движението, които тя събира и визуализира на табла на някои спирки, в отворен формат. Това би насърчило разработчици да създадат приложения, които ще ви показват в реално време къде се намира най-близкият автобус и дали закъснява. Подобни трафични данни, оставени за обработка от частни компании, биха съдействали за намаляване на задръстванията. Те биха помогнали на бизнеса да не губи пари поради закъснения, свързани с трафика, биха помогнали и на общината по-добре да управлява тесните места в системата си. Много бизнеси биха плащали за подобни услуги – например, таксиметрови компании или фирми, които превозват товари, заради които се налага затваряне на улици. Когато тези данни се натрупат, те могат да служат и за планиране на пътни проекти или ремонти. Това е напълно различен подход от сегашния, който разчита, че администрацията може сама да анализира данните си. Или да наема външни консултанти за целта, които да работят по нейните, обикновено недобре написани задания.

Поне засега, отворените данни са поредната революция, която българската администрация пропуска. Те се споменават в планове и стратегии и дори са предмет на обучение в Института по публична администрация (срещу такса), но много малко е направено. Както често се случва, причината изобщо да се говори по темата е европейско изискване.

Новата директива

Миналата година бяха приети поправки в Директивата за повторната употреба на обществената информация, които изискват всички публични документи да могат да бъдат използвани повторно. Освен данните, събирани от централната и местната администрация, ще се включат и дигитализираните документи на библиотеките, музеите и архивите. Информацията ще се предоставя в машинно четими формати безплатно или срещу цена, покриваща само разходите за обработка.

Новите правила ще влязат в сила през 2015 г.

Благодарение на това  ще се предлагат нови услуги като информация в реално време за разписанията на обществения транспорт, за движението на такситата, финансови и топографски услуги, както и данни за търговските дейности и за градското и пътно планиране. Основен докладчик в европарламента бе Ивайло Калфин.

Вече съществува единен европейки портал за отворени данни – open-data.europa.eu. Най-щедрият доставчик на информация за повторно използване е Евростат. Европейският банков орган също публикува много данни в отворен формат.

Такъв проект много преди ЕС развива американското правителство (Data.gov), ООН и Световната банка също имат портали за отворени данни.

Тиха съпротива

Държавните органи не желаят да предоставят данни не само поради стремеж към непрозрачност и липсата на гъвкавост.

За много от държавните структури данните са източник на допълнителни приходи от такси. Дори когато са задължени да предоставят безплатен достъп до дадена информация, те се опитват да попречат на свалянето на данните. Такъв пример е Агенцията по вписванията, която изисква въвеждане на код при всяко търсене в Търговския регистър, за да попречи на свалянето на данните от компании, които искат да създадат от тях информационни системи без да си плащат. Столичната компания за градски транспорт, която изисква да се въвежда код, за да се види информацията от виртуалните табла, е друг пример. Други институции, например НСИ, изискват регистрация за част от услугите.

Това е общоевропейска слабост. За разлика от САЩ, на континента е предпочитан лицензиозният модел.

Затова победата, която Ивайло Калфин като докладчик в ЕП постигна по отношение на новата европейска директива, е важна. Тя бе наложена след няколкомесечна съпротива от страна на част от страните членки. Пречката бе ограничението за цените на услугите, тъй като те ще намалят приходите на органите, разполагащи с данните. Според Ивайло Калфин обаче публичните органи не бива да събират такси, по-високи от разходите за разпространението на информацията, тъй като гражданите вече са платили за нея, чрез данъците. Това означава, че таксите трябва да се равни на пределните разходи, тоест на цената за копие, което в интернет е нищожна сума (но не и таксата за плащането й).

Аргументите, че освобождаването на информацията ще даде силен стимул за развитието на малкия и среден бизнес, надделяха в ЕС. Но в България инициативите за отворено управление все още са формалност.
Да, има обществени обсъждания и се публикува все повече информация. Но тя често е във вид, който не позволява повторна употреба, не е структурирана, дори не е в съпоставим и разбираем вид.

Макар че отворените данни са кауза, която насърчава не само граждански инициативи, но и комерсиални приложения, бизнесът няма голям интерес да настоява пред държавата да направи стъпки в тази посока. Много от големите компании в ИТ сектора работят основно по обществени поръчки за ведомствата или разчитат на еврофондовете. В България все още няма големи големи проекти на корпорации, които да разчитат на големи данни при вземането на решения.

Затова и инициативите за отворено управление у нас се възприемат като досадно европейско изискване и предизвикват интерес само от НПО.

Интегрирането на информационните системи на различните институции е друго предизвикателство – не само за електронното управление, но и за отворените данни. Тъй като няма координиращ орган, който да съгласува изискванията към информационните системи, софтуерите на различните ведомства не си „говорят” и произвеждат данни в различни формати.

Единен стандарт

Но дори в рамките на една отделно взета институция данните не са уеднаквени и удобни за обработка (дори за ръчна обработка). Все още предпочитан формат са pdf-ите. От опит твърдим, че ежемесечното задълбочено обработване на данните за бюджета, които излизат като PDF, отнема повече време, отколкото би трябвало – то е трудно за човек и е невъзможно за машина. Обяснимо е, че повечето медии преповтарят готовия анализ на МФ (А може би това е целта). Дори числата в различните pdf-и на МФ не са в еднакъв формат.

И в НСИ, която е институцията с най-голямо отношение към данните, ще се натъкнете на липса на унификация. В някои таблици, например, все още се изписва София-окръг, в други подредбата на областите (ако не е по райони на планиране, тя обикновено е по азбучен ред) е объркана заради Добрич. Тъй като някога градът се казваше Толбухин, все още има справки, в които областта е към края на таблицата. Това затруднява автоматичната съпоставка на екселски таблици, изготвени от различни отдели на НСИ.

При добро желание тези пречки могат да бъдат преодоляни. Важна стъпка е да се създаде единен стандарт за публикуване на данни.

Боян Юруков (интервю с него), който заедно с Калфин и ЕК е основната причина у нас изобщо да се говори за отворени данни, предлага някои решения в рамките на дебата по инициативата “Партньорство за открито управление”.

Например, да се въведе изискване за администрацията, дори когато съществуващите компютърни системи не позволяват пряко извеждане на данните в отворен формат, те да извеждат справки чрез съществуващите методи и да ги предоставят във възможно структуриран вид.

Друго негово предложение е при обществени поръчки за нови информационни системи или модернизиране на съществуващи такива да се изисква съществуването на външни интерфейси в отворен формат, а системите за справки да поддържат извеждане на данни в отворен формат.

Ключовото решение е да се създаде национален портал за отворени данни. Така всеки разработчик, а и служителите в държавната администрация ще се ориентират лесно за достъпната информация. Такъв портал, чието изграждане не е скъпо, ще насърчи и частния сектор, както и образователните институции да публикуват информация.
Повече от 20 страни от ЕС вече имат свои портали за отворени данни. Не и България.

Примери

www.GovTrack.us – информира обществеността за решенията, взети в Конгреса на САЩ.

http://traintimes.org.uk/map/tube/ – метрото на Лондон в реално време

http://www.theguardian.com/news/datablog/interactive/2014/sep/26/who-lives-where-in-europe-nationalities-across-the-continent-mapped – визуализация за чужденциите, живеещи в различни страни в Европа, включително България

http://opendata.yurukov.net/educ/map/ – Отворени данни за децата в детските градини и училищата по области (Боян Юруков)