Derfor havde vi brug for Rigsrevisionens beretning om åbne data

Rigsrevisionens beretning om åbne data skaber for første gang et samlet overblik over de åbne data, der er, men det italesætter også det åbenlyse behov for en statslig, koordinerende enhed, der viderefører overblikket og kan strukturere dialogen med anvenderne og dataejerne, så de åbne data bliver reelt værdiskabende

Del artikel:

Rigsrevisionen udgav i fredags en beretning, der kortlægger alle statslige, åbne datasæt. De har identificeret 921 datasæt fordelt på 88 forskellige udstillingsplatforme. Datasættene tæller alt fra de mange statistikker i Danmarks Statistiks statistikbank til en oversigt over erhvervssygdomme fra Videncenter for Arbejdsmiljø, og fælles for dem alle er, at enhver kan tilgå dem og benytte dem, om end nogle datasæt er underlagt lovgivning, der begrænser anvendelsen afhængigt af formålet. I et digitalt datakatalog kan enhver nu se, hvilke data, der er tilgængelige og klikke dig direkte videre til den platform, det givne datasæt er udstillet på

 

Datakataloget skaber værdi i sig selv

Mens det blotte overblik over, hvor mange datasæt og hvilke, der kan tilgås, i sig selv er interessant, udfylder beretningen også et vigtigt missing link i den samfundsmæssige værdiskabelse, som der i statslig regi har været en udpræget forventning om både i grunddataprogrammet og i den generelle iværksættelse af åbne data-initiativerne (se fx https://sdfe.dk/data-skaber-vaerdi/temaer/grunddataprogrammet/ og http://www.opendata.dk/blog/aabne-offentlige-geodata-skaber-vaerdi); hidtil har det været nærmest umuligt at vide, hvilke data, der er tilgængelige og hvor

 

For hvordan skal både etablerede virksomheder eller nye start-ups udvikle nye produkter og services på baggrund af data, hvis ingen ved, at data er tilgængelige og da slet ikke hvor? Det sker naturligvis ikke. Derfor er det samfundsmæssigt prisværdigt, at Rigsrevisionen på eget initiativ nu har gennemført denne kortlægning

 

Overraskende usikkerhed om videreførelsen

Netop derfor er det også overraskende, at man allerede på beretningens side 4 kan læse, at Finansministeriet, der skal overtage datakataloget under navnet ”datasætkatalog” ”… har oplyst, at Datasætkataloget som minimum skal indeholde oplysninger om 75 af statens 921 åbne datasæt, men at der ikke er truffet endelig beslutning om antallet. Kataloget vil ikke indeholde oplysninger om, hvor datasættene udstilles, og ministerierne er ikke forpligtede til at opdatere oplysningerne om deres datasæt i kataloget. Finansministeriet har endnu ikke taget stilling til, om ministeriet vil bruge en bemyndigelse fra PSI-loven til at forpligte ministerierne til at benytte Datasætkataloget og opdatere oplysningerne i kataloget"

 

Et overraskende lavt ambitionsniveau, når nu de får serveret et komplet udgangspunkt fra Rigsrevisionen. Og naturligvis er sådan et datasætkatalog ikke de offentlige kroner værd, hvis ambitionsniveauet er så lavt. Så kan man lige så godt lade være – men dog skynde sig at udnytte det datakatalog, Rigsrevisionen nu har lanceret, så længe det er aktuelt. Samtidig må alle, der har direkte eller indirekte gavn af de åbne data stemme i, når vi siger, at Finansministeriet må hæve ambitionsniveauet, hvis åbne data skal kunne skabe den samfundsværdi, de nye produkter og de nye arbejdspladser, vi alle tror på, at de kan

 

Kendskab er ét, datakvalitet nummer to

Men kendskabet til data gør det ikke alene. Rigsrevisionen opstiller selv fire krav til, at data kan kaldes åbne. Her i kortformat (den fulde definition kan læses på beretningens side 9):

  • Offentligt tilgængelige
  • Uden adgangsrestriktioner
  • Maskinlæsbare
  • Uden restriktioner på videreanvendelse

 

Mens de fire punkter overordnet fint beskriver, hvornår data er åbne, sikrer de ikke i sig selv, at data er anvendelige. Til dét mangler nemlig dén faktor, der er lige så vigtig som at øge kendskabet til datas eksistens: Datakvalitet

 

Datakvalitet er alfa og omega for, at data kan skabe værdi. Ingen kan bruge data, der ikke kan stoles på, og der er talrige eksempler på, hvordan offentlige data nok er blevet gjort tilgængelige, men uden den nødvendige kvalitetssikring. Ét eksempel er FLIS, der i sine første år led voldsomt at dårlig datakvalitet og forskellige registreringspraksisser i kommunerne. Et andet eksempel er et projekt, Geomatic løste for Erhvervsstyrelsen i 2016, der viste, at hele 6 % af adresserne i CVR på det tidspunkt ikke kunne findes i adresseregistret

 

Fremtiden for åbne data kræver handling bag ordene

Men nu er det her, overblikket. Derfor har vi og alle andre dataanvendere mulighed for at skabe et overblik over de tilgængelige datasæt, fremsætte ønsker til nye åbne datasæt og teste kvaliteten af dem, der er tilgængelige. På Finansministeriets banehalvdel ligger derimod opgaven med at vedligeholde overblikket og indgå i en konstruktiv dialog med dataanvenderne for at forbedre anvendeligheden ved blandt andet at sikre datakvaliteten og opdateringsfrekvensen på data