Skapa tydliga visualiseringar av kartor med hjälp av några enkla medel

I den här artikeln skall vi förklara hur klassificering av värdemängden påverkar visualiseringen i koropletkartor. Ofta behövs bara några få klick för att du skall kunna göra dina kartvisualiseringar mycket tydligare. Vi förklarar varför du skall titta lite extra noga på det data du vill visa och vad olika metoder ger för effekt. Det går att göra kartor både vackra och tydliga med enkla medel!

Tematiska kartor är kanske den bästa beskrivningen. Koroplet kommer från grekiskans ”choros” (χώρος), som betyder plats och ”plithos” (πλήθος), som betyder storlek. De är väldigt enkla att skapa i program som Tableau, Power BI, Qlik och andra visualiseringsverktyg. Men den automatik, och de algoritmer som programmen använder skapar ibland oreda, eller skall vi säga en blek bild?

Titta på den här kartan, skapad i Tableau, som beskriver andelen invånare under 20 år som lever i ett hushåll med lägre inkomst än 60 % av medianen, per kommun. Detta beskrivs ibland som barn eller ungdomar som lever i ekonomiskt utsatta familjer.

Ju mörkare färg, desto högre andel. Det blir en ganska jämn färgskala och ögat har svårt att göra någon skillnad. Stora ytor med avvikande färg från omgivningen sticker ut.Såhär ser det oftast ut då man använder visualiseringsverktygens färdiga, snabba funktioner för koroplatkartor. Några klick och allt är klart.

Men, färgskalan blir steglös från lägsta till högsta värde. Vi har alltså ingen egentlig kategorisering och eftersom antalet färgsteg blir stort kommer ögat att ha svårt att uppfatta nyansskillnader.Anledningen till att det blir så är att väldigt mycket data inte är normalfördelat. Ju mer snedfördelat det är desto blekare blir bilden.

Använd klassificering

I en datamängd kan man använda sig av flera sätt att klassificera data. Jämför vi hur fördelningen av andelen unga som bor i hushåll med en inkomst som ligger 60 % under medianinkomsten, mellan en oklassificerad färgskala och en där vi väljer en färgskala i fem steg, ser vi en tydlig skillnad.

 

Genom att dela in det vi mäter i grupper får vi en tydligare bild. Kartan får bättre kontraster som ögat lättare kan särskilja. Visualiseringsprogrammet delar nu in mätskalan i önskat antal klasser. Vårt lägsta värde är 4 % och vårt högsta är 38 %, spannet är alltså 34 % (enheter). Delar vi detta i 5 klasser kommer varje klass att bli 6,8 % bred. Vår ljusaste färg kommer då att gå från 4 % till 11 % (avrundat). Klass nummer två avlöser från 11 % och går till 18 % där nästa klass avlöser, o.s.v.

Eller använd kvintiler

Ett tredje sätt att presentera sitt data på en karta är att dela in dimensionen, alltså det man mäter på, i kvintiler. En kvintil är en femtedel på samma sätt som en percentil är en hundradel. Vi nämner detta eftersom funktionen vi använder i visualiseringsverktyget är just percentil. Vilken percentil i detta fall en kommun tillhör bestäms genom att man sorterar dem alla i storleksordning med avseende på måttet. Täby hade 4,8 % unga som bodde i hushåll med en inkomst under 60 % av medianen medan Lessebo hade 38 %.

 

I bilden ovan är färgskalan kontinuerlig och vi har inte delat in i några kategorier. Tittar vi på siffrorna indelade i fem kategorier ser det ut som på bilden nedan:

 

Vi ser att vi får olika antal staplar (kommuner) i de olika grupperna men att intervallet mellan färgerna alltid är 7 %. Färgskalan börjar vid 5 %.

För att skapa kvintiler behöver vi bara ändra i måttet som kategoriserar färgen. Här anger vi att vi vill se percentiler. Behåller vi de fem färgkategorierna bildar detta kvintiler eftersom 100 (%) genom 5 blir 20 (%).

Nu har vi så att säga vridit indelningen. I stället för att dela y-axeln, skalan, i fem lika bitar har vi delat in dimensionen, kommuner, i fem lika stora delar. Vi har 290 kommuner i Sverige, så varje färg (kvintil) har fått 58 staplar.

Visar vi resultatet i kartor får vi tre olika bilder

 

 

Den vänstra kartan visar med ”exakt” färg andelen unga per kommun som lever i hushåll med en inkomst under 60 % av medianen. Varje värde har sin egen färgton.

Mittenkartan har fem distinkta färgsteg som visar andelen. Här är intervallet alltid detsamma. Intervallen beräknas som maxvärdet minus minimivärdet dividerat med antalet önskade klasser.

Den högra kartan har även den fem distinkta färgsteg. Men istället för att visa procentandelen visar den vilken andel av kommunerna en viss kommun tillhör. En del av tricket i tydlighet sitter i att det finns lika många ytor av samma färg. De mörkaste, 58 kommuner, är de 20 % av Sveriges kommuner som har högst andel unga som bor i ekonomiskt utsatta hushåll. På samma sätt visar de 58 ljusaste fälten de 20 %, den kvintil, som har minst andel ungdomar som lever i sådana hushåll.

Vill man förtydliga bilden genom att lägga etiketter i kartan går mycket av idén med diagramtypen förlorad. Därför är det viktigt att färgen och effekten blir lätt för hjärnan att uppfatta och bearbeta.

Vilken man vill använda är naturligtvis en smaksak och en funktion av vad man vill förmedla. Alla tre varianter är mycket enkla att åstadkomma i de flesta visualiseringsverktyg. Antalet klasser är också något man själv får arbeta sig fram till. Men förhoppningsvis har du fått lite inspiration på hur du kan gå till väga för att skapa så tydliga kartor som möjligt.

 

Källor:

Tableau Picass, George Gorczynski: http://tableaupicasso.com/setting-tableau-map-classification-with-parameters/

GISGeography: (https://gisgeography.com/choropleth-maps-data-classification/

Lantmäteriet: Stort tack till Malin Johansson på Kundcenter!

 

 

Per Strid

Per Strid
per.strid@advectas.se
Jag som skrivit den här artikeln heter Pelle Strid. Jag har arbetat med BI sedan 1991 (på Advectas sedan 2016.) Efter så många år är jag ganska mångsidig. Tableau är mitt huvudsakliga verktyg, men jag behärskar också IBM SPSS Modeller sedan många år samt Alteryx. Analytisk SQL är också en del i arsenalen för att bygga smakfulla visualiseringar.

Alla inlägg av Per Strid

Besvara den svenska Business Intelligence- & Data Science-studien 2019

Till enkäten