måndag 2 mars 2026

Social tables-metoden och 1800-talets inkomstojämlikhet

Tidigare i år publicerade något av ett all star team inom historisk ojämlikhetsforskning -- Philipp Erfurth, (Bologna), María Gómez León (Valencia), Giacomo Gabbuti (Pisa) och Branko Milanovic (CUNY) ett working paper som diskuterar hur man kan använda social tables för att mäta historisk inkomstojämlikhet. Social tables som metod har diskuterats här många gånger förr, t ex i inlägg om Variationer i inkomstojämlikhet i förmoderna samhällen (om Milanovic 2018), inkomstfördelningen i Italien 1900 till 1950 (om Gómez León och Gabbuti 2021, WP), historisk inkomstojämlikhet i Afrika, eller ekonomisk ojämlikhet i Latinamerika och Afrika 1650-1950. Men kort sagt så kan man väl säga att ST är en metod för att beräkna inkomstfördelningen (och den totala inkomsten) utifrån två parametrar: andelen av den vuxna befolkningen som befinner sig i olika, mer eller mindre brett definierade sociala grupper, och medelinkomsten för varje grupp.

Styrkan med ST-metoden, säger Erfurth et al, är för det första att den möjliggör att man beräknar inkomstfördelningen i kontexter där man inte har hushållssurveys eller skattedata (som ju används t ex av Piketty).[1] För det andra, "social tables are intuitive and 'historical' as they are based on a class structure that reflects historical realities" (s. 4). Man kan utifrån sin kunskap om den samhälleliga kontexten anpassa indelningen i grupper och så fånga socialt viktiga skillnader, och förhoppningsvis kunna begränsa heterogeniteten inom grupperna. För det tredje, att även om det finns tabulerade skattedata som låter en studera toppinkomsttagarna, så låter ST en också studera strukturomvandling och dess effekter på olika grupper, och skillnader bland arbetare, inklusive mellan män och kvinnor, vilket man inte kan göra med toppinkomstdata.


Erfurth et al fokuserar sin studie på perioden mellan 1815 och 1914, "the era of the concert of Europe that ended with WW1" (s. 4) och möjligheterna att jobba fram en gemensam analysram för denna period med hjälp av social tables. De börjar sin diskussion med en kortfattad översikt över de existerande studierna för denna period. Latinamerika är välrepresenterat, medan det bara finns en enda lång serie för ett land i Afrika, och det är Ghana. För Europa pekar de särskilt på studien av Tyskland och Storbritannien av Gómez León och de Jong (2019) och Östeuropa av Nikolic et al (2024); Erfurth et al menar att dessa bredare studier visar att t o m i relativt välstuderade länderr som Frankrike, Tyskland eller Japan vet vi inte riktigt när "Great Leveling" efter 1945 (! Jag skulle datera den till 1920 och framåt) började påverka den breda majoriteten arbetare, och litteraturen har fokuserat oproportionerligt på policies som påverkade toppinkomsttagarna (som höga marginalskatter) och mindre på "transformative changes such as the welfare state, nationalization, and the like." (s. 6)

Milanovic (2024) har nyligen använt Bourguignon-Morrisson-approachen till global ojämlikhet, som bygger på BNP per capita för olika länder i kombination med något mer eller mindre väl underbyggt antagande om fördelningen inom länderna. Utifrån detta menar M att ojämlikheten, globalt sett, ökade under 1800-talet och fram till 1950, men det är svårt att säga när vi saknar kvalitativa estimat för ojämlikheten inom många länder. Det behövs alltså av flera skäl fler social tables-studier av 1800-talet.

Sektion 3 ägnas åt en metodologisk diskussion av ST-metoden. Här börjar de med att referera artikeln av von Fintel, Links och Green (2023) som pekar särskilt på fyra problem för att göra jämförbara ST-estimat: ojämlikheten/spridningen inom grupper, överlapp mellan grupper, antal grupper, och utmaningar gällande att beräkna storleken på toppen- och botten-gruppen. von Fintel, Liks och Green efterfrågar "greater cohesion and agreement in producing comparable estimates that can give a global view of historical inequality" med hjälp av ST. Här lägger Erfurth et al till ytterligare några dimensioner av vad man bör tänka på om man ska göra sådana jämförbara studier. 

De börjar med principen om extern validering. På ett sätt är ju styrkan med social tables-approachen att man i en och samma process, baserat på samma data, beräknar både nationalinkomsten [2] och dess fördelning, grupp-för-grupp. Men man vill ju samtidigt veta att ens estimat och antaganden -- typiskt så kommer social tables ofta bygga på antaganden snarare än hårda data för grupper som de arbetslösa, småbönder och andra grupper som arbetar i den informella ekonomin eller liknande -- är rimliga och att ekvationerna så att säga går ut. I min artikel med Diego Castaneda Garza där vi gjorde social tables för Mexiko 1895, 1910, 1930 och 1940 så jämförde vi till exempel våra implicerade nationalinkomt-estimat med BNP beräknat i de historiska nationalräkenskaperna. Denna typ av förfarande kallar Erfurth et al för extern validering och de pekar då t ex på att man bör plocka ut medelinkomsten (dvs BNP/capita) och subsistensinkomsten från andra källor och jämföra. (s. 9-11) De pekar här på Gómez León och Gabbutis (2025) studie av Italien där de t ex jämför den implicerade löneandelen från deras social tables med löneandelen som beräknats från nationalräkenskaper av Gabbuti i en tidigare studie.

 
 (Del av) ett diagram från Fintel, Links och Green (2023, WP).

 

Nästa diskussionsfråga är ojämlikhet inom grupperna. ST bygger ju på att varje grupp tilldelas en medelinkomst och att ojämlikheten sedan består av ojämlikheten mellan grupperna. Därmed är alla ST-baserade estimat av ojämlikhet biased neråt: eftersom man per konstruktion missar ojämlikheten inom grupperna så blir ens Lorenzkurvor hackigare och stegvis rakare, mer homogena än vad de egentligen borde vara. Relaterat, så bör ens resulterande Gini-estimat bli allt mindre (artificiellt så) desto färre grupper man har i sin social table. Erfurth et al är dock ganska optimistiska här: de menar att forskaren hade inte valt de grupper han eller hon valt om inte de var just rätt indelning av befolkningen sett till inkomster, och pekar på att Fintel, Links och Green (2023) inte hittar någon linjär korrelation mellan antal grupper i en ST och beräknad ojämlikhet. Fintel, Links och Green hittar också att i de ST-studier som bygger på surveys så är ojämlikheten inom grupperna typiskt bara större långt ner och långt upp i fördelningen medan grupperna i mitten av fördelningen har triviala within-Ginis, runt 0.05! Detta förvånar mig måste jag säga. Av detta skäl klistrar jag också in den översta panelen i Figur 6 från Fintel, Links och Greens papper längre upp i inlägget. När jag tittar på panel c så tycker jag nog att det ser ut som en positiv relation mellan antal klasser och estimerad Gini, i alla fall i den övre delen av x-axeln, när man har säg 35 till 50 klasser. Och i den extremt låga delen av x-axeln, med säg 5-10 grupper, så tänker jag att det också är speciella samhällen som studeras -- väldigt ojämlika och fattiga samhällen med klen tillgång till källor -- vilket förvrider jämförelsen. [3] Erfurth et al verkar i vilket fall mer sangviniska än vad jag är på denna punkt: de menar dels att forskaren som gör historiska social tables ofta är intresserad av just ojämlikhet mellan grupper snarare än inom grupper, dels att om man introducerar ojämlikhet inom en eller flera grupper i ens ST, t ex genom att använda skattedata för toppgruppen, så gör man ens ST mindre jämförbar med andra kontexter. Men jag blir inte riktigt övertygad om detta. För det första så är ju ojämlikheten inom grupperna en viktig check på ens antagande att det är rimligt att dela upp större grupp X i tre mindre grupper X, Y och Z: om spridningen inom ens grupp, säg, "manliga verkstadsarbetare" är en Gini om 0.75 så har man nog missat något i konstruktionen, och gruppen borde i själva verket delas upp i två eller flera. För det andra så är ju varje införande av inom-grupp-ojämlikhet bara en variant och man kan alltid presentera båda estimaten: det utan inom-grupp-spridning, och det med. Det första estimatet är trubbigare men jämförbart, det andra mer realistiskt men mindre jämförbart. Båda har fördelar och båda bör publiceras.


En relaterad fråga är den om hur stora botten- och toppgrupper man jobbar med. Fintel, Links och Green menar att även om inte antalet grupper i stort ger någon konsekvent bias, så får man problem om man inte differentierat bottengrupperna och toppgrupperna tillräckligt. Här experimenterar Erfurth et al med existerande social tables från Tyskland år 1907, Storbritannien år 1901, Italien år 1901 och Spanien år 1900 för att åskådliggöra dessa frågor. De har homogeniserat antalet grupper i varje ST till 22 men eftersom de olika studierna har olika differentiering inom grupperna (skilled, unskilled, lärlingar, eller män/kvinnor) så varierar antalet grupper ändå mellan 60 i Italien till 78 i Tyskland och Storbritannien, och 107 i Spanien. De gör också en variant där de reducerar de 22 grupperna till 10 breda klasser. Indelningen syns i Tabell 2, och resultaten -- Gini-koefficienterna utifrån de olika antagandena -- i Tabell 3. Erfurth et al kommenterar:

"We observe that when the number of groups is reduced from the maximum level of disaggregation to 22, the loss of information remains limited: the observed Gini falls by 3-6 points, and the inequality ranking is largely preserved. Compressing the distribution into only 10 groups, however, generates substantially larger declines (up to 12 Gini points) with the magnitude of this bias varying across countries. The distortions are most pronounced in countries whose occupational structures are more polarized, that is, where large segments of the population are concentrated both in low- and high-mean-income groups." (s. 16) 

Min tolkning av tabell 3 är lite, lite annorlunda: jag tänker att den helt homogeniserade andra kolumnen med 22 klasser i varje land borde vara benchmark, för i den första, med 60-107 klasser, så har de ju olika mängder av inom-grupp-spridning, men inte på ett konsekvent sätt. Så jag ser mer kolumn ett som en variant av kolumn två, där olika mängder av inom-grupp-spridning tillförs. Men det viktiga är väl egentligen att den riktigt grovhuggna förenklingen, ner till 10 grupper, verkligen får stora effekter och förvrider jämförelserna: Erfurth et al påpekar att med 10 grupper går Spanien från näst mest ojämlikt i huvudestimaten (kolumn ett) till mest jämlikt, medan Storbritannien blir lika ojämlikt som Italien, medan Italien i grundestimaten var mest ojämlika.

En intressant del av experimentet är kolumnerna 3 och 4, som reducerar ner till 10 grupper men på olika sätt. I 10A slås de två toppgrupperna godsägare och industrialister ihop; i 10A är det de tre bottengrupperna jordbruksarbetare, tjänstefolk och arbetslösa som slås ihop. De största effekterna är med 10A, specifikt för Italien och Spanien, vilket stödjer idén att för mycket kompression är ett problem både i toppen och botten av fördelningen.

Från detta går de över till en diskussion om hur man konstruerar social tables från yrkesräkningarna. De menar att yrkes-/folkräkningarna är att föredra framför industriräkningarna här eftersom industriräkningarna tenderar att ha en mer kortsiktig konceptualisering av vad man har för yrke, vilket ger för mycket kortsiktiga fluktuationer för en ST. Däremot så menar de att industriräkningarna kan vara bra för att få fram lönestatistik för olika arbetargrupper, och att jordbruksräkningar är användbara för att bryta ner antalet bönder på gårdsstorlek etc. Här diskuterar de också specifika problem med folkräkningar som underskattar kvinnors arbete (eftersom gifta kvinnor räknas som hustrur, utan yrkestitel), klassificerar daglönare som arbetslösa, osv. (s. 20-21)

Den sista metoddiskussionen handlar om att beräkna inkomstfördelningen inte bara för ett land i taget, utan också för vissa regioner, städer etc. De menar att projektet i grund och botten handlar om att förstå interaktionen mellan ekonomi och politik, och att det därför är centralt att ha med hela landet, men att det å andra sidan också är intressant att bryta ner resultaten på regional nivå, t ex för Italien (studerat av Gabbuti och Rappa) där just regionala ojämlikheter var en väldigt viktig del av den ekonomiska ojämlikheten. 

Sektion 4 handlar om hur man kan gå till väga när man konstruerar social tables. Det gäller att identifiera, säger de, vilka grupper som var meningsfulla entiteter i samhället man studerade. "Where does one class begin and where does the previous one end? Particularly in more professionally diversified societies such as in the 19th century this question is much harder to answer." (s. 23) Och är det rimligt att använda en grupp även om man vet att spridningen inom den kunde vara mycket stor? -- De exemplifierar här med lantarbetare i Tyskland, för vilka lönen var nästan dubbelt så stor i trakten runt Bielefeld i västra Tyskland som i Schlesien i östra delarna av landet. Från dessa mer principiella resonemang går de in på att bygga en ST för Preussen år 1863 (s. 24-28), och en för Italien år 1901 (s. 28-31).

I slutsatserna presenterar Erfurth et al två mallar för hur man kan göra konsekventa social tables: en mall som utgår från europeiska källor (folkräkningar etc) år 1900, och en från Latinamerika runt 1870. 


referens

Philipp Erfurth, María Gómez León, Giacomo Gabbuti och Branko Milanovic (2026) "Historical social tables: advantages, methodology, and problems". European Historical Economics Society Working Paper No. 296, januari 2026. 

fotnoter

[1] Jfr också mitt inlägg om forskning av Jenkins, Charpentier med flera som jämför ojämlikhetsstudier med surveydata och hushållsdata. Se också inlägget om Geloso och Magness kritik av Piketty och Saez skattedatabaserade studie av USA:s 1900-tal.

[2] Den del av nationalinkomsten som distribueras bland individer och hushåll, vad som i den engelskspråkiga litteraturen brukar kallas "personal income". Den brukar motsvara 70-80 procent av BNI. Se t ex Piketty, Saez och Zucmans (2018) artikel om DINAs i USA, s. 560ff. De säger visserligen att personal income är ett begrepp specifikt för USA:s National Income and Product Accounts och inte används i det internationella System of National Accounts och att de därför vill undvika just PI-begreppet. Men jag syftar i alla fall på skillnaden mellan BNP och hushållens inkomster. 

[3] En datapunkt jag har som stödjer min intuition här kommer från Diegos och mitt papper om Mexiko 1895-1940. I appendix D jämför vi våra huvudestimat, som använder 18 sociala grupper för att representera Mexikos inkomstfördelning, med estimat som vi gör med samma data fast med 7 grupper (utifrån HISCO) eller med 4 grupper, en indelning som Arroyo Abad och Astorga använt i en tidigare studie av Mexiko. Gini-koefficienten sjunker från runt 50 i våra huvudestimat till runt 35 i de som vi gör med fyrgruppsindelningen. Vi visar också hur viktig toppgruppen är i en variant där vi använder Arroyo Abad och Astorgas 4 grupper men bryter ut de stora godsägarna, hacendados, ur toppgruppen. Bara den enkla ändringen ökar Gini-koefficienten med ungefär 5 punkter.

Inga kommentarer: