Blogindlæg  –  læsetid: 7 minutter

Dit data er en guldgrube af viden, men hvordan udnytter du den?

af | aug 29, 2024

Dataudnyttelse og datakvalitet

AI synes at være 2024s helt store hit og står i mange virksomheder allerøverst på enten bestyrelsens eller ledelsens ønskeliste – også selvom virksomhedens datagrundlag slet ikke kan bære det

At koble data og AI direkte sammen giver måske ikke lige umiddelbart mening for alle, men når man tænker over hvordan AI virker, giver det faktisk rigtig god mening. Kunstig intelligens bruger nemlig information – som data jo egentlig bliver til – til at identificere f.eks. mønstre, give forslag til optimeringer, give sparring eller hvad man nu ellers ønsker at træne kunstig intelligens til at kunne. Derfor kræver det også rigtig store mængder af højkvalitets data, hvis man skal kunne uddanne et AI værktøj til at operere i virksomhedens egne systemer. Datamængder og i en kvalitet, som mange virksomheder slet ikke er i besiddelse af på nuværende tidspunkt.

Uanset om dit ambitionsniveau er introduktion af AI i virksomheden eller ej, er det aldrig en dårlig idé at granske virksomhedens datakilder. Dine datakilder rummer nemlig vigtige informationer om din virksomhed, dens drift og ikke mindst, hvor der er værdi at hente med driftsmæssige forbedringer. For at kunne uddrage noget relevant eller specifik information fra sine data, er det vigtigt at dataene giver mening i den ønskede henseende.

Din datastrategi påvirker kvaliteten af din dataindsamling

Få et forretningsmæssigt forspring med bedre datakvalitet:

Billede af vores CEO og kollega Søren

ref

Især følgende faktorer har betydning for din datakvalitet:

  • Dokumentation af dataenes oprindelse
  • Ensretning af dataformater og skab konsistens
  • Indsamling af fulde datasæt
  • Datamængden

Søren Skieller
CEO og fullstack udvikler hos Skieller Software

Hvordan identificerer du (relevante) datakilder?

Din virksomheds værdiskabelse kan være et godt udgangspunkt for din dataindhentning, hvor du med fordel kan granske, hvor der ikke skabes optimal værdi. Du kan også lade dit udgangspunkt være baseret på, hvor du vil kunne udtrække værdifulde data fra din forretning.

Når du ved hvilke informationer/data der vil være værdigivende at have, er det også nemmere at blive klogere på, hvor du enten skal kunne generere eller udtrække dem. Søger du at forbedre din kunderejse, vil den mest værdi- og indsigtsfulde data komme fra salgs- og marketingteamet, som varetager de kontaktpunkter kunderne har med din virksomhed.

For at du faktisk kan bruge data fra de identificerede kilder er det væsentligt at forholde sig til, hvordan de skal opstilles for at give mening og ikke mindst hvilket format de udtrækkes i. Formatet er altafgørende for at få værdi ud af dataene, da det skal kunne læses af enten virksomhedens ansatte eller anvendte software.

Mangler du væsentlige data?

I din gennemgang af relevante datakilder, er det slet ikke usandsynligt at du fik identificeret et eller flere områder, hvor du mangler data for at kunne udlede den ønskede information. I sådan en situation er du nødt til at forholde dig til, om det er information du ikke ønsker at undvære eller ej. Hvis du vurderer at informationen er værdifuld og kan give indsigt i vigtige aspekter i din virksomhed, så har du et grundlag for at starte en ny dataindsamling.

Før du starter indsamlingen af data på det nye område, er det dog vigtigt at du overvejer hvordan den nye data skal anvendes og til hvad. Som tidligere nævnt er dataformatet væsentligt for at det kan udnyttes og skabe den ønskede værdi. Ligeledes er det vigtigt at sætte nogle rammer op for indsamlingen og datastrukturen, så de indsamlede data er ensrettede, nemme at bearbejde og giver mest mulig værdi med mindsk mulig arbejdsindsats.

Høj datakvalitet starter med din dataindsamling

Uanset om målsætningen er implementering af kunstig intelligens eller ej, så vil det gavne din virksomhed at sørge for at indsamle data af høj kvalitet. Datakvaliteten sætter nemlig begrænsningen for det udbytte du kan få.

Derfor skal du også overveje flere faktorer når du skal lægge din datastrategi, for at sikre at I får indsamlet data i en kvalitet der batter:

  • Dokumentation af dataenes oprindelse
  • Ensretning og konsistens
  • Fyldestgørende datapunkter uden manglende værdier
  • Datamængden

At have styr på dokumentation betyder at I tracker hvor dataene kommer fra, hvor gammel den er, om den er blevet redigeret, slået sammen med andre datasæt, hvem der i så fald har lavet disse ændringer. På denne måde kan I dokumentere dataenes autenticitet, hvilket øger troværdigheden af informationen.

At skabe konsistens i sin datarepræsentation/-format er virkelig vigtig for datasættets reelle værdi. Hvis du ved hjælp af formler i et databehandlingsprogram skal analysere datene, skal de være skrevet ens for at give et retvisende resultat: Fx vil det give store udfordringer at bruge data med ja/nej-input, hvis de er angivet som: true/false, 1/0, Y/N og som Ja/nej. Det gør sig ligeledes gældende hvis du skal overføre data mellem to programmer, da de skal være enige om formatet, hvis de begge skal kunne udtrække meningsfyldt information ud af det.

At have en fyldestgørende dataindsamling, hvor der ikke mangler input, giver dine analyser eller statistikker en høj troværdighed. Når der mangler input, bliver resultaterne mindre nuancerede og vil i større eller mindre grad være baseret på antagelser frem for fakta – hvilket ikke er tilfældet, når der ikke er huller i datasættet.

Huller i et datasæt kan desuden have store konsekvenser, hvis I f.eks. producerer fødevarer, medicin eller et andet produkt, hvor fx temperatur er af vital betydning, konstant skal være stabil og derfor måles mere eller mindre konstant. I sådan en situation kan det få stor betydning for produktsikkerheden, hvis din temperaturmåler ikke har foretaget en måling mellem kl. 13.45 og kl. 14.30 – også selvom gennemsnitstemperaturen for dagen ligger på det helt rigtige niveau.

Det taler ligeledes ind i det sidste punkt om datamængde. Mængden af data påvirker nemlig også kvaliteten og gør informationen der udledes mere troværdig – en større volumen af data giver bedre og mere præcise statistikker.

Afhængig af virksomhedens størrelse og det omfang af relevant data I kan generere, kan det desuden være en god investering at ansætte en dataansvarlig, som kan understøtte virksomhedens datastrategi og sikre optimal dataudnyttelse. Husk dog at data kun har værdi for virksomheden, hvis den kan give indsigt i noget I faktisk ønsker at vide – ellers vil det blot besværliggøre analysearbejdet.

Er målsætningen at implementere AI i virksomheden, så er høj datakvalitet et absolut must. Højkvalitetsdata er dog ikke den eneste udfordring i møder, hvis I ønsker at gøre brug af kunstig intelligens. For at kunne uddanne den kunstige intelligens til at være en reel ressource i præcis din virksomhed, kræver det at I har rigtig meget information/data at træne den på.

Fremvis din data og udnyt den optimalt

Jeg har flere gange nævnt det at skabe troværdighed til den information, der udledes fra din data – og det er der god grund til. Slår du troværdighed op i den danske ordbog er de nærmeste begreber bl.a. sandhed, gyldighed, evidens, virkelighed og ægthed. Det afspejler, i min optik, at det er vigtigt at skabe troværdighed omkring noget information, hvis den skal fremstå sand, gyldig, virkelig og ægte.

Første trin i at skabe troværdighed til din data er at gøre den tilgængelig. Det gælder både den udledte information og den bagvedliggende data, der skal være tilgængeligt for de ansatte i virksomheden. På denne måde undgår du at skabe en troværdighedskløft mellem informationen og medarbejderne, når de selv kan tilgå kilden.

Hvis dataindsamlingen virkelig skal give et løft i virksomheden, er direkte gengivelse essentiel da det vil give dine medarbejdere mulighed for, i realtid, at følge med i hvad der sker. Direkte gengivelse af data kan i mange tilfælde øge motivationen hos medarbejderne, som ikke skal vente i dage, uger eller måneder på at se om deres nye tilgang til kundepleje, nye værktøj til bedre ressourceudnyttelse eller noget helt tredje har den ønskede effekt – de kan simpelthen se det med det samme.

Skåret helt ind til benet: Indsaml relevant data, sørg for den er up to date, gør den lettilgængelig og vis den frem – live.

Hvorfor bør vi overhovedet bøvle med at få indsamlet data?

I bund og grund er dataindsamling en form for indsigt i egen biks. Derfor er data relevant at indsamle for at du kan blive klogere på din egen virksomhed og for at vide, hvor du med fordel kan optimere jeres processer – hvilket i sidste ende vil spare dig på bundlinjen.

Særligt, hvis I ønsker at gøre brug af højteknologiske værktøjer som AI, er det vigtigt at have store mængder data af høj kvalitet, for at kunne uddanne og træne værktøjet ordentligt.

Hvornår bør vi begynde vores dataindsamling? Nu, i dag – endnu bedre havde det dog være, hvis I var begyndt i går og helt ideelt have det være, hvis I begyndte allerede ved virksomhedens grundlæggelse. Det er selvfølgelig umuligt at lave om på nu, men jo hurtigere I kommer i gang, jo hurtigere kan I få et datagrundlag der spiller.

Mangler du hjælp til datahåndteringen i din virksomhed?

Skal vi give vores bud på, hvordan du kan forbedre jeres datahåndtering?