I början av 1900-talet fanns det ungefär 2400 landskommuner i Sverige. De svenska kommunerna var på den tiden (1863 till 1970) uppdelade i tre typer: städer, köpingar och landskommuner. Landskommuner var alltså ungefär vad vi idag skulle kalla landsbygdskommuner. Det finns idag, tror jag är rimligt att säga, ett ökande intresse för statistiska undersökningar av hur politiskt beteende på landsbygden historiskt varierat med olika kontextuella faktorer, såsom jordbrukets struktur (fler gods, eller mer bondedominerat?) eller helt enkelt hur dominant jordbruket var. Bland exemplen här på bloggen om historiska politiska studier med kommun- eller distriktdata, där man alltså utforskar variationer inom länder, finns t ex Dawn Teeles studie av kvinnliga röstmönster i Sverige på 1920- och 30-talen, Boix och Magyar om den svenska socialdemokratins uppgång på 1910-talet, eller Gingerich och Vogler om arbetskraftsbrist, agrar struktur och naziströstning i Tyskland.
De politiska skillnaderna som är intressanta att utforska i Sverige är till exempel skillnader i partival. Jag använder här Sten Berglunds dataset över valen 1911-1944 som finns på Svensk Nationell Datatjänst, och kombinerar detta med egeninsamlade data över bakgrundsvariabler. Jag använder också Johan Junkkas R-paket histmaps för att göra kartor med historiska kommungränser.
År 1911, det första valet med allmän rösträtt för män till andra kammaren, så var det tre partier som konkurrerade om väljarna: högern, liberalerna och socialdemokraterna. Högerns stöd i landskommunerna varierade mellan 0 procent (!) och 100 procent (!) med ett medianvärde om 32.0 procent. De 18 kommunerna utan högerväljare inkluderade Bromma och Önnarp i Skåne men var i övrigt dominerade av Norrbotten: Råneå, Nederkalix och Överkalix, Gällivare med flera. I gengäld så fanns det sju landskommuner där alla väljare röstade på högern. Här var Gotland det främsta högerfästet med tre sådana kommuner: Lokrume, Källunge och Vallstena. Övriga fyra super-högerfästen kom från fyra olika län: Stockholms (Vada), Jönköping (Hagrida), Kalmar (Algutsrum på Öland) och Malmöhus (Tofta, ungefär vid Landskrona). Till detta kom 15 landskommuner till där högern fick 95 procent eller mer av rösterna. Av dessa 15 kom tre från Jönköpings län, en från Gotland, fyra från Halland, tre från Älvsborg och en från Skaraborg. Överlag var Götaland alltså högerns starkasta region. Det syns också i kartan nedan.
All denna variation blir ju intressant att relatera till olika bakgrundsfaktorer, som jordbrukets andel av sysselsättningen. Om man går fram tio år i tiden så finns det ännu mer att kolla på, eftersom antalet partier blir fler. 1913 grundades Bondeförbundet och 1915 deras konkurrent Jordbrukarnas Riksförbund; 1921 enades de två. Också på vänstersidan hände saker: 1917 bildades Sveriges socialdemokratiska vänsterparti (SSV) som senare blev kommunistpartiet. För landskommunerna blir det särskilt intressant att fundera på vilka som attraherades av det nya Bondeförbundet och vilka som höll sig till de etablerade partierna, högern eller liberalerna, som på 10-talet var enormt starka på landsbygden. (Högern och SAP var relativt starkare i städerna.)
I Bondeförbundets tjugo starkaste fästen år 1921 fick de 81 procent eller mer av rösterna, och fästena var särskilt koncentrerade till Gotland (nio kommuner) och Öland (fyra kommuner). Övriga var i Malmöhus län (Östra Karaby och Jonstorp), Halland (Idala), Bohuslän (Björlanda och Tuve) och Älvsborg (Kärråkra och Jern).
Hur jordbruksdominerade var dessa kommuner? De första kompletta uppgifterna (som jag har hittat) om sysselsättningsstruktur per kommun är från år 1930, folkräkningen. Histogrammet nedan visar fördelningen av landskommuner på andelen sysselsatta i jordbruket, och kartan visar samma variabel. Föga förvånande så dominerar jordbruket sysselsättningen i landskommunerna: fördelningen tätas runt 60 till 80 procent sysselsättning i jordbruket.
I förhållande till detta så sticker Bondeförbundets 20 starkaste fästen faktiskt inte ut: deras andel sysselsatta i jordbruket varierar mellan 52 procent (Tuve och Jonstorp) och 85 procent (Vallstena). I detasetet som helhet är korrelationen mellan Bondeförbundets röstandel år 1921 och sysselsättningen i jordbruket år 1930 faktiskt bara 0.317. För valet år 1932 är korrelationen starkare: 0.460. Scatterplotten nedan visar relationen mellan de två variablerna.
För socialdemokraterna var korrelationen år 1932 som väntat den motsatta: SAP var starkare i mer industriella landskommuner.
De mest socialdemokratiska landskommunerna år 1932 var Örja utanför Landskrona med 82.7 procent, Skultuna i Västmanland och Holm i Uppland med 80.4, Åker i Sörmland med 80.4, Husie nära Malmö med 79.2, Nödinge nära Göteborg med 76.9, Ramnäs i Västmanland med 76.7, och Öved och Håstad i Malmöhus med 76.2 och 75.4 procent. Av dessa topp 10 finns både ett par riktigt industriella kommuner -- Husie och Nödinge hade båda mindre än 13 procent anställda i jordbruket -- några bruksorter som Skultuna och Åker, men också, intressant nog, ett par jordbrukskommuner: i Holm arbetade 86 procent inom jordbruket och i Öved 77.9 procent. När man kollar på topp 20 landskommuner med stöd för SAP 1932 (>73,4 % stöd) tillkommer ytterligare ett par jordbrukskommuner: Storsjö med 89,6 procent anställda i jordbruket, Utö med 61,4 procent, Viksjö med 83,1 procent och Husby i Sörmland med 78,3 procent.
Tillbaka till sysselsättningsstrukturen. Vad kan man veta om andelen sysselsatta i jordbruket före år 1930? Jag har ingen direkt data på kommunnivå, men ett par relaterade mått. Här är andelen sysselsatta i jordbruket på häradsnivå (från Sundbärg 1910):
Och här är andelen icke-jordbrukstillgångar av totala beskattade tillgångar år 1900:
Andelen på häradsnivå var rätt persistent: om man jämför andelen år 1900 med den år 1930 så är korrelationen 0.70. Scatterplotten nedan visar relationen mellan de två.
Jag beräknar två proxies för andelen jordbrukssysselsättning per landskommun år 1900. Den första bygger på information om antal bondgårdar i kommunen från BiSOS N, SCB:s jordbruksstatistik. Denna statistik presenterar antal gårdar år 1900 uppdelade på de som brukades av ägarna, och de som brukades av arrendatorer, och uppdelat på fyra storleksklasser: upp till 2 hektar åker, 2-20 hektar, 20-100 hektar, och större än 100 hektar. Antal torp redovisas också för sig. Jag gör då antagandet att varje torp och gård måste ha en viss mängd sysselsatta (i bred bemärkelse: bonde, bondhustru, vuxna barn, drängar och pigor, anställda lönearbetare) för att kunna fungera. Jag räknar ut antal anställda i jordbruket i kommunen utifrån ett antagande om 1,5 personer per gård med <2 hektar, 3 personer per gård med 2-20 hektar, 7 personer per gård med 20-100 hektar, 15 personer per gård med över 100 hektar, och 1,5 personer per torp. Jag har inga uppgifter om arbetskraftens storlek utan bara befolkningen i stort [1] och delar därför antal anställda i jordbruket med antal personer i kommunen. Det finns alltså en massa felkällor här: antagandet om att lika många personer arbetar på varje gård av samma storlek, och att jag inte har någon riktig arbetskraftsstatistik. En tredje felkälla är att jordbruket i nationalräkenskaperna inkluderar skogsbruk och fiske, men att beräkningen i proxy ett bara bygger på gårdar.
Jag beräknar därför den andra proxyn som jag tror är mer pålitlig. Denna bygger på häradsnivåstatistiken för år 1900, faktisk statistik för sysselsättningen per härad (statistik från Gustav Sundbärgs bidrag till Emigrationsutredningen), och på 1930 års statistik för sysselsättningen per kommun. Utifrån antagandet om att kommuners speciella karaktär inom härader var hyfsat stabila över tid, så beräknar jag varje kommuns avvikelse från sin häradsnivå år 1930, och använder denna avvikelse för att justera häradsnivån år 1900 till en kommunnivå. För att ta ett exempel. Kils härad i Värmland hade år 1930 fem landskommuner: Frykerud, Nedre Ullerud, Ransäter, Stora Kil och Övre Ullerud. Variationen i andelen sysselsatta i jordbruket var stor: i Ransäter arbetade bara 18,7 procent i jordbruket, i Nedre Ullerud 30,8 procent och Stora Kil 41,2 procent, men Övre Ullerud och Frykerud var mycket mer agrara, med 68,0 och 70,4 procent. Jag räknar ut det oviktade medelvärdet för sysselsatta i jordbruket, som alltså blir 45,8 procent, och därefter varje ingående kommuns relation till medelvärdet. Ransäter har alltså faktor 0,408, eftersom andelen sysselsatta i jordbruket bara var 40,8 procent så hög där som medelvärdet för häradet. År 1900 var andelen sysselsatta i jordbruket i häradet Kil 67 procent, så proxy 2 för Ransäter år 1900 blir 0,408*67=27,3 procent.
Hur blir då beräkningarna? Tabellen nedan visar fördelningsstatistiken för mina två proxies och tar också in distriktsnivåinformationen (applicerad på kommunnivå) som en jämförelsepunkt som visserligen är trubbig eftersom distriktsdata smetas ut på kommuner, men som åtminstone är hårda data.
Det första intrycket är att båda mina proxies ger för mycket variation: för låga lägstavärden, och för höga högstavärden. Andelen sysselsatta i jordbruket kan förstås per definition inte vara över 100 procent men min proxy 1 ger i fyra fall -- två i Kristianstad, två på Gotland -- nivåer över 100 procent. Det bör vara så att antalet sysselsatta per gård varierade mer än vad jag utgått ifrån och att just i Västra Broby, Akebäck, Vallstena och Järrestad hade man färre anställda per gård än mina schablonantaganden.
Proxy 2 ser åtminstone rimligare ut i det att den hamnar väldigt nära distriktsnivån, som den ju delvis bygger på, vad gäller median och medel. Rimligt är också att korrelationen mellan proxy 1 och proxy 2 är 0.44, ungefär vad man kunde förvänta sig. De plockar upp lite olika saker men är ändå relativt starkt positivt korrelerade.
För att inspektera lite mer vad dessa proxies egentligen gör kollar jag på de 20 kommuner med lägst och högst värden på proxy 1. Dessa syns i den röda tabellen (låga värden) och gröna tabellen (höga värden)
För den andra proxyn så ser topp 20 och botten 20 ut så här:
De 20 lägsta är inte så kontroversiella, det är mest storstadsnära landskommuner som av uppenbara skäl inte försörjde sig särskilt hög grad på jordbruk och som i många fall absorberades av stadskommuner -- eller omvandlades till sådana -- under 1900-talets första hälft. De 20 högsta är mer problematiska. Jag har toppkodat variabeln till 95 procent eftersom det förstås är omöjligt att ha mer än 100 procent, och som synes är det fler än 20 kommuner som omfattas av denna toppkodning. Problemet är inte ställen som Bolmsö eller Femsjö i Småland, som verkligen var jordbruksbygder, men snarare ställen som Grödinge och Östra Ryd, där värdet pumpats upp av ett lågt värde i nämnaren i ekvationen sysselsättningsandel_kommun / sysselsättningsandel_härad. Dessa härader med låga andelar jordbruk hade kanske inte så mycket variation mellan kommuner i absoluta tal.
Jag provar därför att beräkna en tredje proxy. Också denna bygger på distriktsnivåinformationen för år 1900 samt skillnaden mellan kommun och kommunens härad år 1930, men använder det absoluta avståndet istället för multiplikationsfaktorn. [2] Histogrammen nedan visar fördelningarna för de båda, utan toppkodning och liknande. Vi ser att med plus-/minus-approachen i proxy 3 kan man också få negativa värden. Det är fem kommuner som fått negativa värden: Partille (-9.2), Höganäs (-4.2), Holmsund (-1.0), Torshälla landskommun (-0.6) och Motala landskommun (-0.4). På andra sidan av fördelningen är det 36 kommuner som får värden på 100 procent eller högre. En del är i Norrbotten -- Karesuando och Korpilombolo toppar listan med 124 och 110 procent men spridningen är ganska jämn, med kommuner från Närke, Västerbotten, Älvsborg och andra ställen.
Överlag blir proxy 2 och 3 väldigt lika, förstås, eftersom de båda bygger på samma data, bara med skillnaden att proxy 3 bygger på den absoluta skillnaden mellan kommunnivån och häradsnivån år 1930 och att proxy 2 bygger på den relativa skillnaden. Korrelationen mellan de två (före toppkodning) är 0.98.
På många sätt blir bilden ganska lik i stort -- även om den diffar i det lilla -- oavsett vilken proxy man använder. Ett ytterligare sätt att kolla hur rimliga dessa tre proxies egentligen är, är att jämföra dem med den helt orelaterade variabeln som de borde vara korrelerade med, andelen beskattad förmögenhet i kommunen år 1900 som var icke-agrar. Denna är ju icke-relaterad på så sätt att den bygger på helt andra data (förmögenhetsskattedata) men är substantiellt djupt relaterad: i kommuner med stora andelar icke-agrara förmögenheter, typ fabriker och sågverk, borde andelen sysselsatta i jordbruket vara lägre. Korrelationen ska alltså vara negativ. Den första proxyn, som bygger på mina antaganden om hur många som jobbade på gårdar av olika storlekar, klarar inte detta test: korrelationen är +0.09. De två andra proxierna, som bygger på 1900 års häradsdata och 1930 års folkräkning, klarar däremot testet: båda har en negativ korrelation om -0.07 med andelen icke-agrar förmögenhet.
fotnoter
[1] För landet som helhet såg befolkningen år 1900 ut så här: 5.14 miljoner personer varav 1.67 miljoner barn 0-14 år och 430 tusen 65 år eller äldre. 59.1 procent var alltså i arbetsför ålder, 15-65. Statistik från SCB, Historisk statistik 1 Befolkning 1720-1967, tabell 16.
[2] Jag byter alltså ut
agriemplshare_1900proxy = empl1900agri_district * (agriemplshare1930 / mean_agriemplshare_1930_district)
mot
agriemplshare_1900proxy2 = empl1900agri_district + (agriemplshare1930 - mean_agriemplshare_1930_district)