Blogindlæg – læsetid: 7 minutter
Dit data er en guldgrube af viden, men hvordan udnytter du den?
AI synes at være 2024s helt store hit og står i mange virksomheder allerøverst på enten bestyrelsens eller ledelsens ønskeliste – også selvom virksomhedens datagrundlag slet ikke kan bære det
Uanset om dit ambitionsniveau er introduktion af AI i virksomheden eller ej, er det aldrig en dårlig idé at granske virksomhedens datakilder. Dine datakilder rummer nemlig vigtige informationer om din virksomhed, dens drift og ikke mindst, hvor der er værdi at hente med driftsmæssige forbedringer. For at kunne uddrage noget relevant eller specifik information fra sine data, er det vigtigt at dataene giver mening i den ønskede henseende.
Få et forretningsmæssigt forspring med bedre datakvalitet:
Især følgende faktorer har betydning for din datakvalitet:
- Dokumentation af dataenes oprindelse
- Ensretning af dataformater og skab konsistens
- Indsamling af fulde datasæt
- Datamængden
Søren Skieller
CEO og fullstack udvikler hos Skieller Software
Hvordan identificerer du (relevante) datakilder?
Når du ved hvilke informationer/data der vil være værdigivende at have, er det også nemmere at blive klogere på, hvor du enten skal kunne generere eller udtrække dem. Søger du at forbedre din kunderejse, vil den mest værdi- og indsigtsfulde data komme fra salgs- og marketingteamet, som varetager de kontaktpunkter kunderne har med din virksomhed.
For at du faktisk kan bruge data fra de identificerede kilder er det væsentligt at forholde sig til, hvordan de skal opstilles for at give mening og ikke mindst hvilket format de udtrækkes i. Formatet er altafgørende for at få værdi ud af dataene, da det skal kunne læses af enten virksomhedens ansatte eller anvendte software.
Mangler du væsentlige data?
Før du starter indsamlingen af data på det nye område, er det dog vigtigt at du overvejer hvordan den nye data skal anvendes og til hvad. Som tidligere nævnt er dataformatet væsentligt for at det kan udnyttes og skabe den ønskede værdi. Ligeledes er det vigtigt at sætte nogle rammer op for indsamlingen og datastrukturen, så de indsamlede data er ensrettede, nemme at bearbejde og giver mest mulig værdi med mindsk mulig arbejdsindsats.
Høj datakvalitet starter med din dataindsamling
Derfor skal du også overveje flere faktorer når du skal lægge din datastrategi, for at sikre at I får indsamlet data i en kvalitet der batter:
- Dokumentation af dataenes oprindelse
- Ensretning og konsistens
- Fyldestgørende datapunkter uden manglende værdier
- Datamængden
At have styr på dokumentation betyder at I tracker hvor dataene kommer fra, hvor gammel den er, om den er blevet redigeret, slået sammen med andre datasæt, hvem der i så fald har lavet disse ændringer. På denne måde kan I dokumentere dataenes autenticitet, hvilket øger troværdigheden af informationen.
At skabe konsistens i sin datarepræsentation/-format er virkelig vigtig for datasættets reelle værdi. Hvis du ved hjælp af formler i et databehandlingsprogram skal analysere datene, skal de være skrevet ens for at give et retvisende resultat: Fx vil det give store udfordringer at bruge data med ja/nej-input, hvis de er angivet som: true/false, 1/0, Y/N og som Ja/nej. Det gør sig ligeledes gældende hvis du skal overføre data mellem to programmer, da de skal være enige om formatet, hvis de begge skal kunne udtrække meningsfyldt information ud af det.
At have en fyldestgørende dataindsamling, hvor der ikke mangler input, giver dine analyser eller statistikker en høj troværdighed. Når der mangler input, bliver resultaterne mindre nuancerede og vil i større eller mindre grad være baseret på antagelser frem for fakta – hvilket ikke er tilfældet, når der ikke er huller i datasættet.
Huller i et datasæt kan desuden have store konsekvenser, hvis I f.eks. producerer fødevarer, medicin eller et andet produkt, hvor fx temperatur er af vital betydning, konstant skal være stabil og derfor måles mere eller mindre konstant. I sådan en situation kan det få stor betydning for produktsikkerheden, hvis din temperaturmåler ikke har foretaget en måling mellem kl. 13.45 og kl. 14.30 – også selvom gennemsnitstemperaturen for dagen ligger på det helt rigtige niveau.
Det taler ligeledes ind i det sidste punkt om datamængde. Mængden af data påvirker nemlig også kvaliteten og gør informationen der udledes mere troværdig – en større volumen af data giver bedre og mere præcise statistikker.
Afhængig af virksomhedens størrelse og det omfang af relevant data I kan generere, kan det desuden være en god investering at ansætte en dataansvarlig, som kan understøtte virksomhedens datastrategi og sikre optimal dataudnyttelse. Husk dog at data kun har værdi for virksomheden, hvis den kan give indsigt i noget I faktisk ønsker at vide – ellers vil det blot besværliggøre analysearbejdet.
Er målsætningen at implementere AI i virksomheden, så er høj datakvalitet et absolut must. Højkvalitetsdata er dog ikke den eneste udfordring i møder, hvis I ønsker at gøre brug af kunstig intelligens. For at kunne uddanne den kunstige intelligens til at være en reel ressource i præcis din virksomhed, kræver det at I har rigtig meget information/data at træne den på.
Fremvis din data og udnyt den optimalt
Første trin i at skabe troværdighed til din data er at gøre den tilgængelig. Det gælder både den udledte information og den bagvedliggende data, der skal være tilgængeligt for de ansatte i virksomheden. På denne måde undgår du at skabe en troværdighedskløft mellem informationen og medarbejderne, når de selv kan tilgå kilden.
Hvis dataindsamlingen virkelig skal give et løft i virksomheden, er direkte gengivelse essentiel da det vil give dine medarbejdere mulighed for, i realtid, at følge med i hvad der sker. Direkte gengivelse af data kan i mange tilfælde øge motivationen hos medarbejderne, som ikke skal vente i dage, uger eller måneder på at se om deres nye tilgang til kundepleje, nye værktøj til bedre ressourceudnyttelse eller noget helt tredje har den ønskede effekt – de kan simpelthen se det med det samme.
Skåret helt ind til benet: Indsaml relevant data, sørg for den er up to date, gør den lettilgængelig og vis den frem – live.
Hvorfor bør vi overhovedet bøvle med at få indsamlet data?
Særligt, hvis I ønsker at gøre brug af højteknologiske værktøjer som AI, er det vigtigt at have store mængder data af høj kvalitet, for at kunne uddanne og træne værktøjet ordentligt.
Hvornår bør vi begynde vores dataindsamling? Nu, i dag – endnu bedre havde det dog være, hvis I var begyndt i går og helt ideelt have det være, hvis I begyndte allerede ved virksomhedens grundlæggelse. Det er selvfølgelig umuligt at lave om på nu, men jo hurtigere I kommer i gang, jo hurtigere kan I få et datagrundlag der spiller.