Analysera sambanden i politiken

I sin blogg på Dagens Nyheters webbplats skriver statsvetardoktoranden Anders Sundell bland annat om sambandet mellan benägenheten att rösta på Sverigedemokraterna och Feministiskt initiativ å ena sidan, och utbildningsnivån å den andra.

Jag blev nyfiken på hur jag skulle kunna göra samma analys bara för Skåne, där jag arbetar. Och samtidigt – kolla hur sambandet ser ut när det gäller exempelvis andra partier.

Valresultatet hittade jag förstås på Valmyndighetens sajt.

Tabellen längst ner på sidan är enkel att skrapa från sidan, exempelvis med hjälp av Chrome-tillägget Scraper. Sedan man installerat det, markerar man bara en bit av tabellen, högerklickar och väljer ”Scrape similar”. Därefter dyker den upp som en tabell som är enkel att exportera vidare till Google Drive.

En bra sak här är att kommunerna redan står i bokstavsordning. Det kan vi ha glädje av senare.

Därifrån valde jag att exportera det vidare till Excel.

En färdig tabell över utbildningsnivån i landet från 2013 finns nedbruten på kommunnivå på Statistiska centralbyråns sajt. Det är den tredje uppifrån på den här sidan.

Jag gick vidare med att skapa ett nytt kalkylblad i Excel. Jag plockade ut Skånekommunerna ur SCB-statistiken (tips: de står efter varandra!) och la in dem. Genom att sortera dem i bokstavsordning är det sedan enkelt att bara ställa upp valstatistiken intill.

I mitt Exceldokument har jag då kommunnamnen i första kolumnen, utbildningsnivån i den andra och därefter valresultaten i procent. Kolumnen med de absoluta siffrorna har jag plockat bort.

Däremot såg jag ingen anledning att inte behålla kolumnerna ”ÖVR” (övriga), ”BLANK” (blankröster), ”OG” (ogiltiga) samt ”VDT” (valdeltagande). De stör ju ingen.

När vi nu skaffat oss lite ordning och reda på det underlag vi behöver, är det dags att begripliggöra siffrorna. För att enkelt kunna publicera diagrammet på webben kan man exempelvis använda tjänsten Infogram.

Efter att ha skapat ett konto väljer vi Create, därefter Charts och slutligen Scatter. Klicka på Add chart. Dubbelklicka på diagrammet för att få fram tabellen. Ta bort exemplet, och lägg därefter in kommunnamnen i första kolumnen, utbildningsnivån i andra kolumnen och valresultatet för Sverigedemokraterna i den tredje.

Ändra inställningarna genom att klicka på fliken Settings. Ange till exempel ”X Axis label” till ”Andel med lång högskoleutbildning” och ”Y Axis label” till ”Andel som röstade på Sverigedemokraterna”. Klicka på Done.

Spännande! Resultatet i Skåne liknar ju det som den bloggande statsvetaren fick fram för riket.

Vi snyggar till vårt diagram lite till.

Dubbelklicka på rubriken och ange ”Andel sverigedemokrater vs utbildningsnivå i Skåne”. Dubbelklicka på textrutan under själva diagrammet och ange ”Källa utbildningsnivå: SCB. Källa valresultat: Valmyndigheten.” Klart!

Klicka på knappen Share och välj sedan det alternativ som passar dig bäst. För att bädda in på bloggen väljer jag bland alternativen längst ner.

Finns det något annat intressant samband? Det visade sig direkt efter valet att universitetsstaden Lund stack ut åt andra hållet – ett ovanligt svalt intresse för Sverigedemokraterna i kombination med en ovanligt hög utbildningsnivå. Kan valdeltagande över lag har något med utbildningsnivå att göra? (Ja!) Låt oss kontrollera – vi har ju den kolumnen. Gör alltså som tidigare i Infogram, men lägg in kolumnen ”VDT” längst till höger i stället för SD:s valresultat. Uppdatera axlar, rubrik och informationsruta i enlighet med det.

Nu frågar sig förstås den nyfikne hur sambandet mellan Fi-röstande och utbildningsnivå ser ut i Skåne. Enligt Anders Sundell var det ju påtagligt i riket. Vi går vidare i Infogram med rösterna på Feministiskt initiativ.

Här är det inte alls lika tydligt att utbildningsnivå och en lagd röst på Feministiskt initiativ hänger ihop. I stället verkar röstandet vara mer utspritt i väljarkåren. Jag konstaterar bara det. Analyserna har vi ju statsvetare till. Folkpartiet och Miljöpartiet då? Hur ser det ut?

En koppling mellan bildning och Jan Björklund verkar det alltså finnas. Kopplar de intellektuella också ihop miljöfrågorna med Miljöpartiet?

Också här är det enkelt att urskilja ett samband!

Nu uppstår förstås frågan hur jag har kunnat gissa så bra. Det verkar ju som om det ofta blir ett ganska tydligt samband. Hur har jag kunnat chansa så bra?

Det finns ett statistiskt mått på hur starka den här typen av samband är – alltså hur väl de olika variablerna korrelerar med varandra. Det är förstås mycket lätt att beräkna det här måttet i Excel.

del av Excelark
Korrelation i Excel

På raden längst ner i mitt kalkylblad har jag lagt in formeln för att beräkna korrelationen mellan valresultaten i den aktuella kolumnen och andelarna med högutbildade. Det är ganska enkelt att göra det med hjälp av funktionen KORREL().

I det aktuella fallet kan det till exempel vara =KORREL($B2:$B34;C2:C34). Första argumentet är den ena kolumnen, och andra argumentet är den andra. För att jag ska kunna kopiera formeln till höger men alltid jämföra valresultatet med utbildningsnivån och inte med ett annat parti, så har jag satt dollartecken framför kolumnbokstäverna i första argumentet – det fryser dem.

Man får ett mått mellan –1 och +1. Ju närmare –1 respektive +1 man hamnar, desto starkare är korrelationen. Tal närmare 0 visar att variablerna inte samvarierar i lika stor utsträckning.

Första värdet på rad 35 handlar om Moderaterna och det tredje om Folkpartiet. Med hjälp av de här siffrorna kan vi alltså i någon mån i förband lista ut vilka korrelationer det är värt att göra ett diagram på.

Korrelationen mellan SD-röster och utbildningsnivå är nästan starkast, –0,84. Men det finns en som är lika stark, fast positiv, +0,84. Det är den mellan utbildningsnivå och valdeltagande över huvud taget.

Alla andra är svagare. I Skåne. Så då vet vi det.