processanalys

HVAD ER ET DATA WAREHOUSE ?

Dette fantastiske begrep blev udformet i 1980’erne af IBMs forskere Barry Devlin og Paul Murphy for at støtte såkaldt ”decision support environments“, som i moderne termer kaldes business intelligence eller beslutningsstøttesystemer. Det er noget uklart, hvem der faktisk opfandt begrebet ”Data Warehouse”, men Bill Imnon industrialiserede det i 1990’erne, og omkring samme tid lancerede Ralph Kimball dimensionmodeller som ”Den Sande Vej”. Derefter fulgte en ideologisk krig mellem nørderne på enten Inmon eller Kimball-siden. Krigen ulmer stadigvæk i dag, med yderligere kombattanter på banen, især ivrige “Data Vault” tilhængere syntes, ​​at alle andre er tager fejl. Men hvad der kan være mest interessant er, at ”Data Warehouse” som et koncept har overlevet i over 25 år!

I de sidste fem til ti år er Data Warehouse blevet udfordret både af kunder, software leverandører og udviklere af forskellige årsager som f.eks leveringstid og omkostninger. Intensiteten af ​​disse “angreb” øges ofte når der introduceres nye produkter, der lover store besparelser, hurtigere udvikling mv. Når der er kommer noget nyt, lytter vi vores kunder godt efter. Hvad er ”The Next Big Thing”?. Hvem vil ikke have tingene billigere, bedre, hurtigere og måske med flashy grafer?

Hvorfor bygger vi stadig Data Warehouse egentligt?. Er der virkelig ingen produkter, der kan købes, der løser de problemer, som et Data Warehouse løser?. Det kommer an på : Det er muligt at reducere omkostningerne, forkorte leveringstiden, men så er der normalt noget andet, der skal ofres. Jeg tænker på den berømte trekant med lave omkostninger, høj kvalitet og hurtig levering. Du kan ikke få alt på samme tid. Derudover er der andre aspekter, som man ofte overser, som f.eks lag-delt arkitektur.

 

Men hvad får vi, når vi bygger et Data Warehouse ?.

 

Lagdelt arkitektur

Et lagdelt arkitektur betyder, at arkitekturen består af flere lag med forskellige roller og ansvar. Datalagring / integration, dataoverførsel / analyse, applikationer / analyse.

Et Data Warehouse består af selve Data Warehouset, der bruger standard SQL. Hvorfor er det godt? Fordi det tillader brugen af ​​forskellige overliggende software platforme, mens data gemmes på et sted og dermed følger den samme definition. Hvis der er behov for at køre Microsoft kuber, Qlik eller Cognos, er et Data Warehouse et nødvendigt element for ikke at skabe et fragmenteret arkitektur, som ofte giver forskellige resultater. På toppen af ​​Data Warehouset kan man f. eks. bygge kuber med eller uden en SQL datamart. Eller Qlik, Cognos eller dit yndlingsværktøj. Hvorfor ikke Tableau?

 

Tolkede, modellerede data

En stor del af anstrengelsen ved opbygningen af ​​et Data Warehouse er at forstå alle dataene, og hvordan det er forbundet. Vi bygger en eller flere datamodeller både til at gemme og levere data til både applikationer og brugere. Det adskiller sig f.eks. fra “Big Data”, der anvender en schema-on-read-metod, dvs. fortolkning og behandling af data når det kræves.

 

Integrerede data

Data kommer som regel fra mange kilder og integreres i Data Warehouset (vi identificerer hvad der er hvad), for eksempel at behandle kundedata ved at læse forskellige data fra forskellige systemer. Dette muliggør parallelanalyse på tværs af flere kilder, hvilket er en af ​​de store gevinster med et Data Warehouse. Hvis vi har salg i et system og kundeoplysninger i en andet, kan vi analysere salg og få de oplysninger med, der kun er tilgængelige i kundesystemet.

 

Vasket data

Det er meget almindeligt, at dataene ikke ser ud som du vil have det, når de analyseres. Dataene kan derefter vaskes og omdannes til et format, der er brugbart til forskellige formål. Ved ”datavask” er forretningslogik også inkluderet for at konvertere data til nyttig information, f.eks. hvis en kunde ikke har en adresse i et system, så kan vi tage det fra en anden kilde.

Datalger, Data Warehouse

Hos Advectas har vi stor erfaring med at bygge Data Warehouse til både store og mellemstore virksomheder. Hvis du har spørgsmål til artiklen eller Data Warehouse generelt,  så kontakt os endelig.

 

Tilmeld Event & Nyheds-liste