onsdag 15 april 2026

Dekomponeringsmetoder inom nationalekonomin

Nationalekonomerna Nicole Fortin (University of British Columbia, UBC), Thomas Lemieux (också UBC) och Sergio Firpo (Insper, Brasilien) börjar sitt kapitel om dekomponeringsmetoder inom nationalekonomin, publicerat i en Handbook of Labor Economics, på ett rakt och effektivt sätt:

"What are the most important explanations accounting for pay differences between men and women? To what extent has wage inequality increased in the United States between 1980 and 2010 because of increasing returns to skill? Which factors are behind most of the growth in US GDP over the last 100 years? These important questions all share a common feature. They are typically answered using decomposition methods. The growth accounting approach pioneered by Solow (1957) and others is an early example of a decomposition approach aimed at quantifying the contribution of labor, capital, and unexplained factors (productivity) to US growth. But it is in labor economics, starting with the seminal papers of Oaxaca (1973) and Blinder (1973), that decomposition methods have been used the most extensively. These two papers are among the most heavily cited in labor economics, and the Oaxaca-Blinder (OB) decomposition is now a standard tool in the toolkit of applied economists."

I fallet Solows (1957) produktionsfunktion så var den: Q = F(K,L;t) där Q stod för kvantiteten output, K för input av kapital, L för input av arbete, och t för teknisk utveckling. Den ökning av Q som inte kan härröras till ökning av K eller L ansågs då kunna förklaras av en (icke observerad) förändrad i t, den så kallade Solowresidualen. Hos Oaxaca (1973) var framställningen mer teknisk, inställd på att förklara skillnaden mellan mäns och kvinnors löner på urbana arbetsmarknader och hur mycket som förblev oförklarat efter att man kontrollerar för erfarenhet, utbildning och andra relevanta variabler som facklig/ickefacklig, sektor osv. Den oförklarade residualen kunde då ses som ett mått på omfattningen av diskriminering av kvinnor. Det var alltså en regressionsbaserad dekomponering. [1] (Se också Blinder 1973.)

Fortin et al kommenterar att dekomponeringsanalyserna alltså ofta är väldigt ambitiösa: att förklara ekonomisk tillväxt, eller könsdiskriminering på arbetsmarknaden, och liknande stora frågor. Detta betyder, säger de, att man ofta använder stora antaganden för att göra analysen möjlig. Framför allt så måste man göra "allt annat lika"-antaganden och alltså göra delvisa jämviktsanalyser snarare än allmänna jämviktsanalyser: redan Gregg Lewis (1963) påpekade att när man för att estimera fackets effekt på de fackligt anslutna arbetarnas löner genom att dekomponera skillnaderna mellan de fackligt anslutna och de fackligt icke anslutna och tillskriva residualen (efter kontrollen för andra relevanta variabler) till facket, så gör man antagandet att fackets existens inte har några effekter på de icke anslutna -- vilket det säkerligen har. Kapitlet kommer framför allt använda delvis jämviktsapproachen, men diskutera allmänna jämviktsaspekter i slutet, säger Fortin et al.

Dekomponeringsanalysens andra stora begränsning, säger de, är att även om man med dekomponering kan belägga vilka faktorer som spelar roll, så kan man inte säga något om mekanismerna genom vilka de spelar roll. Vad man däremot kan göra är så klart att "provide useful indications of particular hypotheses or explanations to be explored in more detail. For example, if a decomposition indicates that differences in occupational affiliation account for a large fraction of the gender wage gap, this suggests exploring in more detail how men and women choose their fields of study and occupations." (s. 3)

De skriver historien om dekomponeringsmetodernas plats i nationalekonomin ungefär så här. Hos Oaxaca och Blinder i det tidiga 1970-talet var utfallsvariabeln som skulle dekomponeras framför allt medelvärdet av en variabel, t ex lönen för en kvinna och för en man. Med Richard Freemans papers i det tidiga 1980-talet skiftade intresset till olika delar av fördelningen. Men det var framför allt på 1990-talet som dekomponeringsmetoderna tog riktig fart, med studierna av inkomstojämlikhetens utveckling i USA. Här kom Juhn et al (1993) och DiNardo et al (1996) med nya dekomponeringsmetoder.

På 1990-talet utvecklade sig dekomponeringsmetoderna också i dialog med vad de kallar "the program evaluation literature", alltså forskningen inom offentlig ekonomi och arbetsmarknadsekonomi som arbetar med att med kausala metoder beräkna effekterna av olika policies. Med influenserna därifrån har dekomponeringslitteraturen arbetat hårdare på flera element, säger de: "to (i) clarify the assumptions underneath popular decomposition methods, (ii) propose estimators for some of the elements of the decomposition, and (iii) obtain formal results on the statistical properties of the various decomposition terms. As we explain below, the key connection with the treatment effects literature is that the “unexplained” component of a Oaxaca decomposition can be interpreted as a treatment effect. Note that, despite the interesting parallel with the program evaluation literature, we explain in the paper that we cannot generally give a “causal” interpretation to the decomposition results." (s. 4)

De förklarar grundmodellen så här:


Det stora här är alltså skillnaden mellan de två huvudposterna, den delen av variationen som förklaras av variationer i vilka värden grupp A och grupp B har på kontrollvariablerna X ("explained") och den andra delen, "unexplained", som t ex skulle kunna vara diskriminering i Oaxacas (1973) fall eller teknologiska framsteg i fallet Solow (1957).  Att dela upp ΔµO i de två komponenterna ΔµS och ΔµX kallar de för en "aggregate decomposition" och med "detailed decomposition" syftar de på att dela upp både ΔµS  och ΔµX i "the respective contributions of each covariate". 

Sedan 1990-talet, säger de, har mycket fokus varit på att inte bara dekomponera medelvärden. Man tog sig an metoder från program evaluation-litteraturen för att dekomponera också per kvantiler och liknande (Hirano et al 2003; Firpo 2007). [2]

 

Efter att ha introducerat huvuddragen i dekomponeringsmetodernas utveckling så går de över till sektion II som presenterar dekomponeringarnas teori på ett lite mer avancerat sätt; Fortin et al menar att dekomponeringarnas stringens har underskattats eftersom litteraturen varit så praktiskt inriktad och inte diskuterat antaganden och teori på något utförligt sätt, och därför blir det särskilt viktigt att göra det här. De ägnar också ungefär 25 sidor åt detta. (s. 10-36) 

 

Jag skippar den mer tekniska delen och går till del III. I praktiken är det enkelt att göra en Oaxaca-Blinder-dekomponering, säger de. Tabell 2 visar de underliggande estimaten för en O-B-dekomponering av könslönegapet i USA år 2000. "The composition effect is computed as the difference between the male and female means reported in column (1) multiplied by the male coefficients reported in column (2). The corresponding wage structure effect is computed from the difference between the male and female coefficients reported in columns (2) and (3)." Kompositionseffekten förklarar 0.197 (0.018) logpoäng av 0.233 (0.015) genomsnittligt log-lönegap mellan män och kvinnor. "When the male wage structure is used as reference, only an insignificant 0.036 (0.019) part of the gap (the wage structure effect) is left unexplained."


I samband med exemplet med löneskillnaden män-kvinnor för de också intressanta resonemang om vad för kontrafaktiska fördelningar man kan använda. Hade kvinnor haft männens lönestruktur om könsdiskrimineringen inte hade funnits? En rad studier  (Reimers, 1983; Cotton, 1998; Neumark, 1988; Oaxaca and Ransom, 1994) har föreslagit en "weighted average expression" β∗ = ΩβA + (I − Ω)βB, där Ω = I sammanfaller med β∗ = βA, och Ω = 0 sammanfallermed β∗ = βB, och där Ω = ω. Om Ω = 1 är männens fördelning och Ω = 0 är kvinnornas. Dekomponeringen är obalanserad på så sätt att om man utgår från kvinnornas lönestruktur för att bedöma männens så ger det ett resultat, och om man omvänt använder männens för att bedöma kvinnornas så ger det ett annat resultat. Om man varierar Ω kan man spela med detta förhållande. Man kan också använda en reweighting-approach där man "omskapar" t ex kvinnornas fördelning med värdena på X från männen, t ex i inverse probability weighting. Då kan man göra dekomponeringen i komposition (skillnader i X) och struktur (skillnader i avkastning på X) utan att anta att effekten är linjär (som när man bara kollar på medelvärdet). I relation till detta diskuterara de också att Barsky et al (2002) dekomponerade hur etniska skillnader i förmögenhet i USA är icke-linjärt beroende av löneskillnader med mera, och därför gick ifrån en parametrisk approach (linjär, loglinjär etc) till en icke-parametrisk approach där de mer direkt modellerar variationen i data. Så här förklarar de approachen:


En annan utveckling av dekomponeringsmodellerna är att förklara binära utfallsvariabler, t ex arbetskraftsdeltagande. (s. 51-52)

 

Nästa stora sektion handlar om dekomponeringar av andra dimensioner av fördelningen än medelvärdet. Diskussionen börjar med variansen i (loggade) löner, som Richard Freeman (1980, 1984) analyserade i sina papers på 1980-talet. Freeman visade att medan facket i USA ökar ojämlikheten mellan fackligt anslutna och icke anslutna arbetare genom att höja de fackligt anslutna arbetarnas löner, så minskar de ändå den totala ojämlikheten eftersom fackets negativa effekt på ojämlikheten bland de fackligt anslutna kvantitativt dominerar effekten på skillnaden mellan de två grupperna (de anslutna och icke anslutna). Andra forskare på 1980-talet som Cowell (1980) och Shorrocks (1980, 1984) visade att man också kunde dekomponera ojämlikhetsmått som Gini och Theil med samma tekniker. Det är ju egentligen denna typ av dekomponeringar som jag är intresserad av, så jag citerar Fortin et als diskussion om dessa mera utförligt:

"Note that the between vs. within decomposition is quite different in spirit from the aggregate or detailed OB decomposition discussed in the previous section. There are advantages and disadvantages to this alternative approach. On the positive side, looking at between- and within-group effects can help understand economic mechanisms, as in the case of unions, or the sources of inequality growth (Juhn et al., 1993).On the negative side, the most important drawback of the between vs. within decomposition is that it does not hold in the case of many other interesting inequality measures such as the interquartile ranges, the probability density function, etc. This is a major shortcoming since looking at what happens where in the distribution is important for identifying the factors behind changes or differences in distributions. Another drawback of the between vs. within approach is that it does not provide a straightforward way of looking at the specific contribution of each covariate, i.e. to perform a detailed decomposition. One final drawback is that with a rich enough set of covariates the number of possible groups becomes very large, and some parametric restrictions have to be introduced to keep the estimation problem manageable." (s. 53) 

Just dessa problem ledde till nya innovationer på 1990-talet:

"In response to these drawbacks, a new set of approaches have been proposed for performing aggregate decompositions on any distributional statistic. Some approaches such as Juhn et al. (1993), Donald et al. (2000), and Machado and Mata (2005) can be viewed as extensions of the variance decomposition approach where the whole conditional distribution (instead of just the conditional variance) are estimated using parametric approaches. Others such as DiNardo et al. (1996) completely bypass the problem of estimating conditional distributions and are, as such, closer cousins to estimators proposed in the program evaluation literature."  (s. 54)

De börjar den substantiella diskussionen i sektionen med variansdekomponeringen. Medelvärdes-dekomponeringarna antar att: E(Y |X) = Xβ. Alltså att värdet på Y ökar linjärt med värdena på X. "This follows directly from the linearity and zero conditional mean assumptions introduced in Section 2. Using the law of conditional expectations, it then follows that the unconditional mean is E(Y ) = E(E(Y |X)) = E(X)β." Man kan utvidga denna logik från medelvärdet till variansen:

 

Variansen delas i den första kedjans sista led in i två delar. spridning i löner givet samma egenskaper, alltså within-group-ojämlikheten. β′Var(X)β är istället spridningen i löner som beror på skillnaden i grupptillhörighet, alltså between-group-ojämlikheten. Länge ner har vi ΔV=ΔXV​+ΔSV​ där, återigen, delta V alltså är hela variansen, delta XV variansen som beror på skillnader i X, och delta SV variansen som beror på skillnaden i struktur. De diskuterar ett mycket intressant metodproblem med att beräkna vA(X) och vB(X), alltså variansen i de två grupperna A och B. De säger med referens till en tidigare studie av Lemieux (2006) att ännu tidigare studier utgick från att feltermerna i regressionerna för att skatta vA(X) och vB(X) var homoskedastiska (alltså ingen variation i feltermen relaterat till värdena på X) men att Lemieux visade att med heteroskedastiska fel så kan skillnader mellan σA^2 och σB^2 göra att dekomponeringen tillskriver strukturen (delta VS) effekter som egentligen är kompositionseffekter (delta VX). "Lemieux (2006b) has shown this was a major problem when looking at changes in residual wage inequality in the United States since the late 1980s."

Nästa subsektion handlar om att dekomponera andra ojämlikhetsmått än variansen. De resonerar mycket intressant om att många faktorer som vi teoretiserar påverkar ojämlikheten inte påverkar alla delar av fördelningen lika mycket, utan tvärtom lämpar sig för metoder som låter oss utforska heterogena effekter. De förklarar detta så här:

"An important limitation of summary measures of dispersion such as the variance, the Gini coefficient or the Theil coefficient is that they provide little information regarding what happens where in the distribution. This is an important shortcoming in the literature on changes in wage inequality where many important explanations of the observed changes have specific implications for specific points of the distribution. For instance, the minimum wage explanation suggested by DiNardo et al. (1996) should only affect the bottom end of the distribution. At the other extreme, explanations based on how top executives are compensated should only affect the top of the distribution. Other explanations based on de-unionization (Freeman, 1993; Card, 1992; DiNardo et al., 1996) and the computerization of “routine” jobs (Autor et al., 2003) tend to affect the middle (or “lower middle”) of the distribution. As a result, it is imperative to go beyond summary measures such as the variance to better understand the sources of growing wage inequality." (s. 57)

Med dessa metoder vill man kanske t ex dekomponera gapet i inkomst mellan percentil 90 och percentil 10. De diskuterar olika antaganden och metoder man kan göra för att göra detta, med början i Juhn et als approach från 1993.

Nästa sektion handlar om reweighting-metoder. (s. 63ff) Nästa därefter om metoder "based on estimating the conditional distribution". (s. 69ff)

Nästa stora sektion, sektion 5, handlar om "DETAILED DECOMPOSITIONS FOR GENERAL DISTRIBUTIONAL STATISTICS". (s. 74-87) Den sista sektionen handlar om tre extensioner. "We first consider the case where either the ignorability or the zero conditional mean assumptions are violated because of self-selection or endogeneity of the covariates.We next discuss the situation where some of these problems can be addressed when panel data are available. We conclude the section by discussing the connection between conventional decomposition methods and structural modeling."

Slutsatssektionen börjar: "The development of new decomposition methods has been a fertile area of research over the last 10-15 years." (s. 96) De avslutar med att diskutera relationen mellan dekomponeringsmetoder och strukturella modeller.

"The literature on inequality provides some useful hints on how this connection can be useful and improved upon. In this literature, decomposition methods have helped uncover the most important factors behind the large secular increase in the distribution of wages. Those include the return to education, de-unionization, and the decline in the minimum wage, to mention a few examples. These findings have spurred a large number of more conceptual studies trying to provide formal economic explanations for these important phenomena. In principle, these explanations can then be more formally confronted to the data by writing down and estimating a structural model, and using simulation methods to quantify the role of these explanations.
This suggest a two-step research strategy where “off-the-shelf ” decomposition methods, like those discussed in this chapter, can first be used to uncover the main forces underlying an economic henomenon of interest. More “structural” decomposition methods could then be used to better understand the economics behind the more standard decomposition results. We expect such a research strategy to be a fruitful area of research in the years to come." (s. 96-97) 

 

referens 

Nicole Fortin, Thomas Lemieux och Sergio Firpo (2011) "Decomposition Methods in Economics", i Orley Ashenfelter och David Card (red.) Handbook of Labor Economics, Volume 4a. Elsevier. 


fotnoter
[1] Efter att ha presenterat sina regressionsresultat säger Oaxaca: "The effects of discrimination are approximated by the residual left after subtracting the effects of differences in individual characteristics from the overall wage differential. The calculations based on the full-scale wage regressions are presented in Table 3. As a simple average of the two estimates obtained, discrimination accounts for 58.4%o of the logarithmic wage differential for whites and 55.6%o for blacks. The average value of the discrimination coefficient is .29 for whites and .25 for blacks. Table 4 presents the effects of discrimination calculated from the personal characteristics wage regressions. Predictably, the estimated effects of discrimination are larger than those reported in Table 3: Discrimination accounts for approximately 77.7%o of the wage diffferential for whites and 93.6%o for blacks." I slutsatserna till artikeln säger han att: "As in other studies we find the sex differential to be quite large. We are in agreement with other researchers that unequal pay for equal work does not account for very much of the male-female wage differential. Rather it is the concentration of women in lower paying jobs that produces such large differentials. Our results suggest that a substantial proportion of the male-female wage differential is attributable to the effects of discrimination.
The effects of discrimination are estimated as the residual left after adjusting the sex differential for differences in various characteristics. This methodological technique is found in other studies as well and may take the form of regression analysis or standardization analysis. There are some difficulties with this general approach which should be mentioned. " (s. 708) 

[2] De diskuterar det så här, där IPW står för Inverse Probability Weighting: "While most of the results in the program evaluation literature have been obtained in the case of the mean (e.g., Hirano et al., 2003), they can also be extended to the case of quantiles (Firpo, 2007) or more general distribution parameters (Firpo, 2010). The IPW estimator originally proposed in the decomposition literature by DiNardo et al. (1996) or matching methods can be used to perform the decomposition under the assumption of ignorability. More parametric approaches such as those proposed by Juhn et al. (1993), Donald et al. (2000) and Machado and Mata (2005) could also be used. These methods involve, however, a number of assumptions and/or computational difficulties that can be avoided when the sole goal of the exercise is to perform an aggregate decomposition. By contrast, IPW methods involve no parametric assumptions and are an efficient way of estimating the aggregate decomposition." (s. 7)

tisdag 14 april 2026

Lorenzkurvan som ojämlikhetsmått


 

Rolf Aaberge, statistiker och nationalekonom vid Statistisk Sentralbyrå i Oslo börjar en artikel från 2007 med att enkelt konstatera att många studier av inkomstfördelningen använder Lorenzkurvan. Lorenzkurvan kan ses som en kumulativ distributionsfördelning (CDF) och Aaberge har själv i en tidigare artikel (i Social Choice and Welfare, 2000) använt denna egenskap för att förespråka en variant där man fokuserar på de första momenten av kurvan. Med "första moment" syftar han här på kurvans första karakteristika, i enlighet med matematikens momentbegrepp. Jag citerar Wikipedia om detta:

"Moments of a function in mathematics are certain quantitative measures related to the shape of the function's graph. For example, if the function represents mass density, then the zeroth moment is the total mass, the first moment (normalized by total mass) is the center of mass, and the second moment is the moment of inertia. If the function is a probability distribution, then the first moment is the expected value, the second central moment is the variance, the third standardized moment is the skewness, and the fourth standardized moment is the kurtosis."

Men approachen har, säger Aaberge, sina brister, framför allt att den inte lägger tillräckligt mycket vikt på vad som händer i den nedre delen av fördelningen:

"However, considered as a group these measures suffer from a drawback since none of them in general are particularly sensitive to changes that concern the lower part of the income distribution. The reason why the moments of the Lorenz curve in most cases are more sensitive to changes that take place in the central and upper part rather than in the lower part of the income distribution is simply due to the fact that the Lorenz curve has a convex functional form. Thus, even though the first three LC-moments in many cases jointly provide a good description of the inequality in an income distribution it would for informational reasons as well as for the sake of interpretation be preferable to employ a few measures of inequality that also prove to supplement each other with regard to sensitivity to transfers at the lower, the central and the upper part of the income distribution. To this end Section 2 provides arguments for using a specific transformation of the Lorenz curve, the scaled conditional mean curve, rather than the Lorenz curve as basis for introducing and justifying application of a few measures for summarizing inequality in income distributions." 

Aaberge argumenterar alltså för att använda en anpassad variant av Lorenzkurvan, som han kallar "the scaled conditional mean curve". Detta mått har flera attraktiva egenskaper, säger han. För det första, en bekväm och transparent tolkning. För en viss nivå på u är M(u) ration mellan medelinkomsten för den fattigaste 100 * u andel av befolkningen och medelinkomsten överlag. Liksom Lorenzkurvan har den också en enkel, lättläst "jämlikhetskurva" -- vi ser båda i diagrammen ovan. För det andra:

"Second, the scaled conditional mean curve of a uniform (0,a) distribution proves to be the diagonal line joining the points (0,0) and (1,1) and thus represents a useful additional reference line. Thus, when a M-curve intersects the diagonal line once from above (single intersection) the corresponding distribution exhibits lower inequality than a uniform (0, a) distribution below the intersection point and higher inequality than a uniform (0, a) distribution above the intersection point. Note that incomes are uniformly distributed over (0, a) if any income in this interval occurs equally frequently."

För det tredje: de olika måtten i M-familjen är bundna av en enhetskvadrat

Aaberge säger utifrån diagrammen 1 och 2 ovan att vi ser att M-måtten reagerar mer på förändringar i botten av fördelningen än vad Lorenzkurvan gör. [1] Han diskuterar också hur M lever upp till det klassiska kriteriet för ett ojämlikhetsmått, the Pigou-Dalton principle of transfers, som säger att en överföring av inkomst från en fattigare till en rikare person alltid ska öka den mätta ojämlikheten. (s. 309-310) Från detta går han över till diskussionen om vad han kallar "Lorenzfamiljen av ojämlikhetsmått", alltså en uppsättning mått som kan genereras ur en Lorenzkurva. Lorenzfamiljen är starkt relaterad till en del av "the extended Gini Family" som tidigare diskuterats av Donaldson och Weymark ("A single parameter generalization of the Gini indices of inequality", J of Economic Theory, 1980) och av Yitzhaki ("On an extension of the Gini inequality index", International Economic Review, 1983).

Han diskuterar relationen mellan de olika måtten. Diskussionen är teknisk och mycket tät men han säger bland annat att: "Aaberge [2] demonstrated that the Lorenz family of inequality measures as well as the 
Bonferroni coefficient can be given explicit expressions in terms of social welfare and moreover are members of the “illfare-ranked single-series Ginis” introduced by Donaldson and Weymark [18] and discussed by Bossert." Och att de olika måttens sätt att vikta observationer från olika delar av fördelningen kan karakteriseras så här:


 


 

Tabellen presenterar alltså vilken vikt de tre måtten lägger vid förändringar i relationerna mellan inkomsterna på olika platser i fördelningen: (a) mellan 5:e percentilen och medianen, (b) mellan den 30:e percentilen och medianen, och (c) mellan den 95:e percentilen och medianen. Så i enkelt språk: tycker vi att det är viktigast med förändringar i botten av fördelningen (a) eller i toppen (c)? Alla tre mått i tabellen fäster faktiskt större vikt vid förändringar i botten än förändringar i toppen, men Bonferroni har en extrem preferens för lägre delar av fördelningen medan Ginin gör lite jämnare betoningar. [2]

Aaberge diskuterar utvecklingar av detta, och går sedan också vidare med att visa hur inkomstfördelningen i Norge 1986-1998 utvecklades enligt de tre måtten. Med C1 ökade ojämlikheten med 7,14 procent, med C2 (Gini) med 9,07 procent, och med C3 med 10,96 procent -- så vi förstår att mer hänt, relativt sett, i toppen av fördelningen eftersom ökningen av C3 blir större än den i C1. 

Nästa sektion heter "Estimation and asymptotic distribution results" och går vidare till fördelningen som en CDF. Detta är en mycket matematisk sektion (s. 316-320) som jag skippar här. I sina slutsatser säger Aaberge att:

"This paper proposes to use a specific transformation of the Lorenz curve, called the scaled conditional mean curve, rather than the Lorenz curve as basis for choosing a few summary measures of inequality for empirical applications. The scaled conditional mean curve turns out to possess several attractive properties as an alternative interpretation of the information content of the Lorenz curve and furthermore proves to provide essential information on polarization in the population. The discussion in Section 3 demonstrates that the inequality measures C1, C2 and C3 define the first three moments of the scaled conditional mean 
curve. Thus, jointly they may give a good summarization of inequality in the scaled conditional mean curve and consequently act as primary quantities for measuring inequality in distributions of income. Moreover, since C2 is the Gini coefficient and C1 and C3 prove to supplement the Gini coefficient with regard to focus on the lower and the upper part of the income distribution, it should be justified to call the group formed by these three inequality measures the Gini’s Nuclear Family. The paper also provides asymptotic distribution results for the empirical scaled conditional mean curve and the related family of empirical measures of inequality, including Gini’s Nuclear Family." (s. 320) 

 

 

referens 

Rolf Aaberge (2007) Gini’s nuclear family, Journal of Economic Inequality.

fotnot

[1] Här refererar han också återigen till Lorenzkurvans konvexa form: "In contrast to the Lorenz curve, which always is a convex function, the shape of the scaled conditional mean curve proves to be strongly related to the shape of the underlying distribution function. ..." (s. 309)

[2] Aaberge diskuterar själv tabellen så här: "As suggested by Table 1 W1 (C1) is more sensitive than W2 (C2) to changes in the 
income distribution that concern the poor, whereas W2 (C2) is more sensitive than W3 (C3) to changes that occur in the lower part of the income distribution. For example, the weights in Table 1 demonstrate that the social weight of an additional Euro to a person located at the 5% decile is 4.3 times the weight of the median income earner when C1 (W1) is used as a measure of inequality (social welfare), whereas it is only 1.3 times the weight of the median earner when C3 (W3) is used as a measure of inequality (social welfare). As is suggested by Table 1 and is easily verified from Eq. 8, C1, C2 and C3 preserve first-degree M-curve and 
Lorenz dominance and thus satisfy the Pigou–Dalton principle of transfers. However, to deal with situations where M-curves or Lorenz curves intersect a more demanding principle than the Pigou–Dalton transfer principle is required. An obvious idea is to introduce a principle that places more emphasis on a given transfer the lower it occurs in the income distribution. Kolm [33], [34] and Mehran [35] proposed two alternative versions of such a principle; the principle of diminishing transfers which requires the income difference between receivers and donors to be fixed and the principle of positional transfer sensitivity which requires a fixed difference in ranks between receivers and donors." (s. 313)

måndag 13 april 2026

Brittisk arbetslöshet under mellankrigstiden

Den höga arbetslösheten är säkerligen en av de saker som folk associerar allra mest med mellankrigstiden i Europa. Det brukar då ofta handlar om 1930-talet och den stora depressionen, med bilder av Wall Street-kraschen, soppkök och arbetslösas demonstrationer, men ekonomisk-historiker vet att 1920-talet i många länder (t ex i Sverige) såg lika stor arbetslöshet [1], framför allt under och efter den våldsamma deflationen vid mitten av decenniet. Diagrammet ovan, från ekonomisk-historikern Meredith Paker (då vid Grinnell College, nu i Oxford), visar att arbetslösheten i Storbritannien år 1926, året för storstrejken, var runt 15 procent, medan den 1931-1932 nådde höjdpunkter mellan 20 och 25 procent. [2]

Paker förklarar syftet med sin artikel, publicerad i European Review of Economic History 2024, rakt och enkelt: "The aim of this paper is to explore the gender, industrial, and spatial concentration of interwar unemployment. Is there significant heterogeneity across these lines, and if so, who benefited and who lost out?" Hennes artikel bygger på finfördelad månadsvis statistik på arbetslösheten 1923-1926, uppdelat på 100 branscher och på kvinnor och män, från Ministry of Labour och publicerad i Labour Gazette, antagligen motsvarande Sociala Meddelanden i Sverige.

Hennes resultatdiskussion börjar med att konstatera att år 1931 (då en folkräkning utfördes) befann sig 5,6 miljoner kvinnor i arbetskraften. De var därmed 30 procent av den totala arbetskraften, men kvinnornas arbetslöshet har knappt diskuterats i litteraturen om mellankrigstidens arbetslöshet. Arbetslöshetsmönstret skilde sig åt för de två könen, som vi redan sett i diagrammet ovan: överlag var de försäkrade männens arbetslöshet högre än kvinnornas. En grundorsak till detta är förstås att kvinnorna var mindre benägna att befinna sig i arbetskraften, vilket man ju måste vara för att räknas som arbetslös: i folkräkningen 1931 var 90 procent av män arbetande eller arbetslösa, men bara 34 procent av kvinnorna.

Ett annat relevant genusrelaterat önster är skillnader i vilka branscher män och kvinnor jobbade. Paker presenterar en scatterplot med andelen kvinnor i sektorn på y-axeln och den genomsnittliga arbetslösheten 1923-1936 på x-axeln. Över 50 procent på y-axeln har vi en rad branscher som tillverkar kläder och textilier (dresses; blouses and shirts; hosiery; other textile; linen; cotton; jute) och även tobaksindustrin (ungefär 2/3 kvinnor), choklad och godis, hotell, tvätterier, och "pottery, earthenware". Nära noll procent kvinnor hade gruvorna, stenbrotten, spårvagnarna (!), hamnarbete, stål och varven. De flesta branscher var koncentrerade mellan 10 och 25 procent arbetslöshet men det ser ut att finnas en svag korrelation från uppe-vänster till nere-höger, alltså att de mer mansdominerade branscherna hade större arbetslöshet. Detta drivs av stål, hamnarna och varven, medan juteindustrin är en outlier åt andra hållet (många kvinnor och hög arbetslöshet). Paker gör en analys där hon simulerar hur arbetslösheten hade utvecklats per sektor om fördelningen kvinnor/män hade varit samma i alla sektorer; skillnaderna är inte så stora.

En sektorsvis analys av arbetslösheten säger att 20-30-talens höga arbetslöshet inte bara drevs av en nedgång för "staple industries" (kol, bomull, järn och stål, varven, osv) som dominerade 1800-talets industrialisering; det handlade alltså inte bara om en strukturkris som ledde bort från dessa "gamla" branscher. (s. 489-491)

Regionalt sett så var arbetslösheten större i norra England, Wales och Skottland än i Midlands och södra England. En hypotes är att detta beror på sektorssammansättningen av ekonomin regionalt sett: kanske jobbade särskilt många i stålindustrin, hamnarna och på varven just där? Paker visar utifrån Census 1931 att södra England hade relativt större andelar anställda i handel och tjänstesektorn. Midlands var särskilt starkt i bilindustri, mer avancerad textilproduktion och järnvägar. Norra England och Wales var koncentrerade i gruvindustrin och traditionella textilier som bomull och ull. Paker beräknar ett Herfindahl-Hirschman-index för industrins sammansättning; indexet visar att västra Midlands hade den mest diversifierade regionala ekonomin medan södra Wales var den mest specialiserade regionen. Korrelationen mellan HH-indexet (alltså sektorskoncentration) och arbetslöshet var svagt positiv (0.22), alltså att mer specialiserade regioner hade större arbetslöshet.  Paker använder också sektorssammansättningen och de sektorsvisa arbetslöshetsandelarna för att göra ett slags shift-share-analys, en kontrafaktisk analys av hur mycket arbetslöshetens utveckling formades av sektorssammansättningen. I södra England och London var arbetslösheten ännu lägre än man skulle förvänta sig av sektorssammansättningen, och i norra England och Wales var arbetslösheten högre än man skulle förvänta sig: det fanns alltså regionala effekter bortom själva sektorssammansättningen.

 

referens

Meredith M. Paker (2024) "Industrial, regional, and gender divides in British unemployment between the wars", European Review of Economic History 28: 475-516.

fotnot

[1] Paker talar i sin bakgrundssektion om en "global depression" 1921. (s. 477) 

[2] Det är viktigt att beakta att statistiken här bara handlar om arbetare som var med i en arbetslöshetsförsäkring. En del sektorer var i Storbritannien under perioden uteslutna ur a-kasse-systemet eftersom man ansåg deras risk för arbetslöshet som låg: jordbruk, skogsbruk, trädgårdsarbete, husliga tjänster, den offentliga sektorn, armén och skolorna. Den offentliga statistiken, som bygger på de som var med i försäkringen, överskattar alltså arbetslösheten något. (s. 480) Detta liknar situationen i Sverige: se t ex Jakob Molinders working paper "Why Was Unemployment so Low in Postwar Sweden? An Analysis with New Unemployment Data by Manufacturing Industry, 1935-1948" (2019).

måndag 6 april 2026

Första världskriget och kvinnors arbetskraftsdeltagande


Man pekar ofta på att världskrigen ökade kvinnornas möjligheter på arbetsmarknaden i Europa och USA: eftersom männen i stridför ålder var borta i militären, eller till och med döda, så behövde andra grupper, som yngre män, äldre män eller kvinnor, fylla arbetskraftsbehoven på hemmafronten. Nationalekonomerna Jörn Boehnke (UC Davis) och Victor Gay (Toulouse) presenterar i en artikel från 2022 i och för sig analysen av ökat kvinnligt arbetskraftsdeltagande över tid som att det framför allt i Claudia Goldins anda fokuserat på teknologi som långsiktig drivkraft (s. 1210), men det verkar långsökt att hävda att inte många studier också fokuserat på krigen. I sin litteraturöversikt diskuterar de också en rad sådana studier, framför allt om USA och andra världskriget: Goldin 1991; Acemoglu, Autor, and Lyle 2004; Goldin and Olivetti 2013; Doepke, Hazan, and Maoz 2015. Evan Rose (2018, JEH) visar i en nyare studie, säger de, att resultaten inte verkar varit omedelbara och inte så starka som tidigare studier sagt.

Franska historiker har också varit skeptiska mot idén att WW1 fungerade som en befrielsefaktor (engine of liberation) för kvinnor, säger de med referens till Thébaud 2013 som hävdar att hundratusentals kvinnor visserligen arbetade i industrin under kriget, men att detta var en "parantes" och att de därefter gick tillbaka till hushållsarbetet. [1]

 

Ekonomisk teori om hushåll säger att när det råder en brist på män så kommer det implicita marknadspriset på kvinnors hushållsarbete faller, vilket gör det mer attraktivt för dem att arbeta på arbetsmarknaden (Chiappori 1992; Grossbard 2014). Detta har ekonomer utforskat med variationer i kohortstorlek, utvandringsmönster och liknande, och förstås så innebar också WW1, där 1,3 miljoner franska män dog i strid, att könsbalansen försköts i det franska samhället. Figur 2 visar att regioner (de har data för 87 regioner) som led större förluster i kriget såg större ökning av kvinnors förvärvsarbete mellan folkräkningarna 1911 och 1921, medan de inte såg någon sådan trend före kriget, 1901-1911. Figur 3, kartan som jag klistrat in längst upp, visar fördelningen av dödligheten.

Det är visserligen inte så, säger de, att sannolikheten att dö i kriget var slumpmässig i förhållande till ens hemregions ekonomiska karakteristika, för den franska staten tog ut fler män från mer agrara regioner, för att inte hämma den för kriget viktiga industrin allt för mycket. (s. 1217-1218) Men mönstret är, och det är det viktiga, inte korrelerat med förändringar i kvinnors arbetskraftsdeltagande före kriget. De belägger också detta på ett mera formellt ekonometriskt sätt (avsaknad av pre-trends). De använder också en instrumentvariabeldesign som använder arméns olika träning av olika kohorter och hur detta påverkade dödligheten. (s. 1225-1228)

Deras kvantitativa resultat säger att "In départements that experienced military death rates of 20 percent rather than 10 percent, female labor force participation increased by 11 percent relative to pre-war levels." (s. 1238) Denna skillnad består under mellankrigstiden och de menar att den beror på krigets effekter på demografin (det blev svårare för kvinnor i mer drabbade regioner att gifta sig) snarare än på efterfrågan i företagen (att man ersatte män med kvinnor). De avslutar med en intressant diskussion om vad som är kontextspecifikt med resultaten och i vilken grad resultaten kan överföras till andra kontexter:

"the response of female labor to sex ratio imbalances we identify was arguably amplified by the historical context in which it occurred—most women were not in the labor force at the time, and low-skilled jobs in the manufacturing sector were increasingly available because of the transition toward Taylorism during the interwar period (Downs 1995). As a result, changes in marriage market conditions profoundly affected the extensive margin of female labor. Analyzing the impact of WWI military fatalities on female labor across countries with different characteristics might be crucial to better understand dependencies between the mechanisms we highlight and the historical context and to gauge the external validity of our findings." (s. 1238) 

Några år senare kom Carl P Kitchens och Luke P Rodgers, nationalekonomer vid Florida State University, med en ny artikel i frågan. Här handlar det dock inte direkt om krigets dödlighet utan om effekter på demografin och kvinnors arbete av den prisboom på mat som kriget ledde till. Kitchens och Rodgers studerar perioden 1910-1930, en period när fertiliteten föll med 29 procent i USA, en ungefär lika stor förändring som baby boomen efter WW2, fast i andra riktningen. Detta relaterar de alltså till jordbrukets utveckling med en mer än fördubbling av jordbrukspriserna och mer än 70 procents ökning av intäkterna i jordbruket i det sena 1910-talet. Prisboomen ledde till optimism bland bönder och jordpriserna steg (en avspegling av förväntad god avkastning i framtiden), men efter kriget och Versaillesfreden kom en (för bönderna och för många företagare) brutal deflation igen.

Kitchens och Rodgers har -- vad jag kan se -- lagt ner stor möda på att skapa ett dataset som ger hur beroende varje county i USA var av olika jordbruksprodukter och deras prisutveckling. Detta relaterar de till  demografiska datata, först födslar sedan 1910 på county-nivå, sedan 1930 årss folkräkning som ger varje vuxen kvinnas historia av att föda barn (eller inte), och folkräkningarna 1910 och 1920 som tillsammans med den 1930 ger olika personers demografiska beteende, i counties med olika ekonomiska förutsättningar.  

Resultaten säger att de höga jordbrukspriserna skapade fler jobb för kvinnor i jordbruket och att detta ledde till att kvinnor, framför allt kvinnor från fattigare bakgrund, födde färre barn och gifte sig senare än vad kvinnor i mindre påverkade regioner gjorde (eller: förändrade sig åt det hållet). De avslutar sin artikel med en mild policyrekommendation för samtida utvecklingspolitik i fattiga länder: "As policymakers consider potential responses to the many challenges that declining fertility presents to existing social programs, the results of this paper serve as a reminder that gender-specific changes to opportunity costs are central to the discussion. Put another way, there is more to the relationship between income and fertility than just income effects." (s. 3003)



referenser

Jörn Boehnke och Victor Gay (2022) "The Missing Men: World War I and Female Labor Force Participation", Journal of Human Resources.

Carl T Kitchens och Luke P Rodgers (2023) "The Impact of the WWI Agricultural Boom and Bust on Female Opportunity Cost and Fertility", The Economic Journal, Volume 133, Issue 656, November 2023.

fotnoter

[1] De refererar här också studier om demografiska effekter: "Implications of WWI in France for marriage and fertility outcomes have also been the subject of recent research. Most related to our article, Abramitzky, Delavande, and Vasconcelos (2011) show that women in regions that experienced greater military death rates faced deteriorated post-war marriage prospects.4 To explain post-war patterns in fertility and female marriage choices, Vandenbroucke (2014) and Knowles and Vandenbroucke (2019) build and calibrate models of fertility choices and marital matching. All three studies rely on military fatalities data from Huber (1931, p. 426), which are only available across 22 regions and the accuracy of which has been challenged by historians (Prost 2008). Besides studying alternative consequences of the war over a longer time horizon, our analysis employs a measure of military death rates that builds upon the collection of 1.3 million individual military records (Gay and Boehnke 2020). Our measure is therefore more accurate than that in the literature as it varies across 87 units rather than just across 22. In fact, we show that variation in the Huber (1931) data is insufficient to precisely identify the effect of WWI military fatalities on female labor force participation."

onsdag 4 mars 2026

Spannmålschocker och emigration från Italien, 1881-1912


Man brukar säga att i Sverige så emigrerade mellan 1870 och 1914 ungefär en fjärdedel av befolkningen till Amerika. Med det så kvalificerar vi oss till en topplacering i Europas emigrationsliga under perioden. Jag brukar säga till mina studenter att de fyra länder som såg störst del av befolkningen emigrera var Irland, Italien, Norge och Sverige, ungefär i den ordningen. En referens som jag brukar använda, som dock inte presenterar riktigt så användbar kumulativ statistik utan statistik decennium för decennium är Timothy Hatton och Jeffrey Williamsons gamla NBER-working paper från 1992, "What Drove the Mass Migrations from Europe in the Late Nineteenth Century?". (Publicerad som artikel i Population and Development Review, 1994.)


 

Ett bredare kumulativt mått kommer från Wikipedia men är i absoluta tal, inte relaterat till befolkningen:


De länder som framträder som viktiga här utanför min lista på fyra länder är Tyskland, Storbritannien, Österrike-Ungern och Ryssland. Fyra väldigt folkrika länder, så inte lika högt i per capita-rankings som är mer intressanta från emigrationsperspektivet, även om absoluta tal är mer intressant från USA-immigrationsperspektivet. En annan aspekt är att emigrationen från Tyskland och Storbritannien var mer utspridd över tid, med större inslag från perioden före 1870, som jag inte är lika fokuserad på.

Faktum är att en annan av Jeffrey Williamsons artiklar om emigrationen kanske är mer användbar: "Convergence in the age of mass migration", med Alan M. Taylor, publicerad i European Review of Economic History 1997. Denna tabell, återgiven nedan, innehåller den kumulativa utvandringen 1870-1910 i procent av befolkningen. Här har Irland störst emigration, 36 procent, Italien näst störst, 31 procent, Norge tredje störst, 19 procent, och Sverige fjärde störst, 15 procent.


 

Olikheterna mellan de fyra toppländerna är uppenbara, vilket gör att jag alltid är skeptisk till förklaringar till t ex den svenska välfärdsstaten eller arbetarrörelsens uppgång som fokuserar på emigrationen. Om det nu var emigrationen i sig som gjorde det, varför såg inte Irland eller Italien samma utveckling? Här spelar scope conditions uppenbart en stor roll, eller kanske vad makroekonomerna kallar "the missing intercept problem" i identifikationsrevolutionens mikroekonomiska designer. 


Utifrån detta är det ju särskilt intressant ur ett svenskt perspektiv att kolla på forskningen om emigrationen från de andra länderna och inte minst då Irland och Italien. 2019 publicerade Rowena Gray (UC Merced), Gaia Narciso (Trinity College Dublin) och Gaspare Tortorici (då TCD, nu Luxemburgiska myndigheterna) en mycket intressant artikel om emigrationen från Italien. De fokuserar inte på emigrationens konsekvenser, som i studier av hur emigrationen påverkade löner eller politiken, utan på emigrationens drivkrafter. Närmare bestämt på effekterna av den jordbruksomställning som följde på inflödet till Västeuropa av billigt spannmål från Ryssland och Amerika på 1870- och 1880-talen, drivet av de nya, effektiva transportmetoderna järnvägar och ångbåtar. Intressant nog så är deras analys av spannmålschocken hade den exakt motsatta effekten på emigrationen som jag tänker mig att den hade i Sverige!

Gray, Narciso och Tortorici säger att spannmålschocken, som gjorde produktion av vete, råg och annat spannmål i Italien mindre lönsamt, minskade emigrationen genom att den gjorde att italiernarna i mer spannnmålsproducerande områden fick mindre pengar över och därför fick svårare att ha råd med en biljett med båten till USA. Det var alltså likviditetsproblem som styrde. Jag skulle förvänta mig det motsatta: att spannmålschocken skulle öka emigrationen från de mer drabbade områdena genom att skicka signaler om att det inte var värt att stanna.

Det finns tidigare studier av emigrationen på nivån 16 regioner -- Gomellini och Ó Gráda ("Migrations", kapitel i Oxford Handbook of the Italian Economy since Unification, 2013) -- och så en analys av Hatton och Williamson (The Age of Mass Migration, Oxford UP, 1998) som använder 69 provinser, men bara för två folkräkningsår, 1901 och 1911. Statistiken som de använder kommer från Direzione Generale di Statistica som finns från 1876 och framåt (en annan källa finns först från 1902). En lustig detalj är att italiensk lag sa att en migrant var tvungen att först söka om ett nulla osta, ett dokument som gjorde dem behöriga för att skaffa ett pass, och först i steg två fixade man ett faktiskt pass. Datat bygger på nulla osta-certifikat, så det kommer alltså finnas ett antal i serien som faktiskt aldrig fick ett pass och aldrig emigrerade. En annan databegränsning är att många italienska emigranter (många USA-emigranter över huvud taget, men särskilt många i Italien) återmigrerade hem igen. Detta mäts inte med DGS-datat. Men det är inte heller något stort problem för deras studie i och med att den är fokuserad på faktorerna bakom den ursprungliga emigrationen.

De kompletterar DGS-datat med data från Ellis Island, dit de flesta invandrarna till USA kom. De har 3,5 miljoner datapunkter mellan 1892 och 1912 och har genom bearbetning lyckats etablera ursprungsregion för 1,62 miljoner av dem. 

Kartorna i Figur 1 visar migrationsintensiteten för 1880-talet (vänster), 1890-tal (mitten) och 1900-talets första decennium (höger). Från början var emigrationen koncentrerad i nordost och centrala-södra Italien; i början av 1900-talet hade emigrationen i nordost avtagit och emigrationen var istället väldigt stor i ett långt bälte från Marche i centrala Italien till Kalabrien och Sicilien i Södern.  


 

Deras huvudsakliga oberoende variabel är varupriser, som de hämtar från den italienska importstatistiken. Italien, säger de, var ett litet fattigt land som inte kunde sätta priserna på den internationella marknaden, och importpriserna är alltså exogena till vad den italienska ekonomin gjorde. [1] Prisvariablerna kombineras sedan med det italienska jordbrukets koncentration på olika varor per provins: vete, majs, havre, vin, olivolja och ris, för åren 1876-1881. Produktionsspecialiseringen mäts alltså före den beroende variabeln, emigrationen, också detta för att undkomma endogenitet. "It is similar to the measures of local labor market exposure to import competition developed by Topalova (2007) and Autor et al. (2013)." De kollar inte bara på pristrenderna överlag utan också på volatiliten som i sig kan vara en variabel som driver på emigrationen.

De kontrollerar också för ett par saker som tidigare forskning, som Hatton och Williamson (1998), pekat på som viktiga för emigrationsflöden. Den första är ortens emigrationshistoria, som mäts med stocken av emigranter därifrån i destinationslandet. Den andra är jordägandeförhållanden: de mäter här med 1881 års folkräkning andelen sysselsatta i jordbrukssektorn som inte själva ägde jord. Italien hade ett höggradigt proletariserat jordbruk och andelen överlag är 85 procent! De kontrollerar också för den industriella sysselsättningen i regionen, eftersom lokal industrialisering kan ge jobbmöjligheter som minskar sannolikheten för emigration.

De ekonometriska resultaten säger att det finns en stark och positiv koppling mellan prisutveckling och emigration. En 1 procents ökning i det lokala produktprisindexet är associerat med något i stil med 1 procent mer emigration. Gray et al tolkar och kommenterar resultaten så här:

"Our finding is in line with Bazzi (2017) , who also explored the relationship between income and propensity to migrate in contemporary Indonesia and finds an inverted U-shaped relation between wealth and migration. Throughout our sample period, Italy remained a slowly-developing country where liquidity constraints prevailed despite negative price shocks making migration more appealing. This result is supported by Faini and Venturini (1994) who argue that Italy was indeed caught in a poverty trap that curbed out-migration. Spitzer and Zimran’s (2018) paper also suggested that migrants from poorer Italian provinces and those who were able to finance their own trips were more positively selected, consistent with the presence of significant liquidity constraints. Evidence of liquidity constraints have further been demonstrated in data on selection of migrants in Covarrubias et al. (2015) , who showed that for the period 1899–1932 across 39 countries that sent migrants to the US, when GDP increased, the average skill level of migrants decreased. Our results also fit with theory from Ciccarelli et al. (2018) who present a version of their model with liquidity constraints which shows that, in that case, areas with initially low wages could respond to increasing real incomes by migrating —they believe that this effect might be magnified in areas with more concentrated landholding or monopsonistic labor markets. Finally, Spain and Italy are often analyzed together as development and migration laggards. Sanchez-Alonso (1995, 2000) found that agricultural wages and migration rates were positively correlated at the province level for pre-1914 Spain."

När de inkluderar kontrollvariabler så är lokal industrialisering negativt associerad med emigration, som man skulle tro, och andelen icke jordägare inom jordbruket, interagerat med priserna, får en negativ koefficient, "indicating that small owners’ incomes might have been more responsive to price fluctuations. On the other hand, landless laborers might have benefited from food price reductions, being able to count on a higher income."

I Online Appendix gör de fler robustnss checks, med odlingsmönster från 1879-1883 eller 1891-94 istället för 1876-1881, med jordbrukspriser istället för importpriser, osv. 

 

referenser

Rowena Gray,  Gaia Narciso och Gaspare Tortorici (2019) "Globalization, agricultural markets and mass migration: Italy, 1881–1912", Explorations in Economic History 74:101276.

fotnoter

[1] Också: "We argue that international prices, which our measure proxies for, are driven by international 
demand and supply forces and are independent of changes in these factors at the province level. We expect that changes in supply costs dominated during these years, given the advances in shipping technology."

måndag 2 mars 2026

Inkomstojämlikheten i Italien på lång sikt

Ekonomisk-historikern Giacomo Gabbuti presenterade 2020 en ny långsiktig serie på den funktionella inkomstfördelningen i Italien. Huvudserien för löneandelen syns i diagrammet ovan: en nivå runt 50 procent 1895-1940 med undantag för kraftiga fluktuationer runt första världskriget (först ner, sen upp). Sedan ett trendbrott efter andra världskriget, då nivån ökade till runt 65 procent, en nivå som sedan var ganska konstant till 2015, då serien slutar. (Om än med en variation på så sätt att nivån var lite högre ca 1970-1985 och lägst ca 1990-2000.) Siffrorna från 1895 till 1950 är Gabbutis egna beräkningar; de från 1951 till 2015 är från Torrinis nationalräkenskaper.

Gabbuti säger i diskussionen av resultaten att den enorma ökningen från mitten av 1940-talet till mitten av 1950-talet nästan är större än man skulle kunna tro, men att den består med olika specifikationer. (s. 10-11) Han påpekar också att löneandelen före 1945 var påtagligt låg i Italien, lägre än i andra europeiska länder, vilket också har att göra med att lönenivåerna var låga. (s. 11) Han relaterar resultaten till tidigare forskning på ett intressant sätt:

"Starting from the pre-WWI period, labor shares are partly at odds with economic historians’ view of early Italian industrialization. Looking at indicators, such as personal income inequality, and drawing on theoretical insights such as factor prices convergence in the Atlantic economy, Toniolo (2003) stressed the “benevolent” aspects of an industrialization that had benefitted most of Italians. Amendola and Vecchi (2017) showed the absence of any Kuznets-like relationship in this period. In fact, neither wages nor labor shares followed the trend expected in a labor-abundant, emigration country such as Italy. According to Zamagni (1984), “the shift of the distribution of income in favor of profits is quite obvious” in the Giolittian period. Italian real wages in industry were on the rise, growing faster than in most other countries, but did not keep the pace of productivity, implying “an accelerated accumulation of profits”. Factor shares offer a “balanced” view, in between the optimistic reading based on personal income distribution, and the pessimistic evidence on industrial wages. Italian workers enjoyed a low, constant share of national income—despite the impressive migration flows of the period, and the increase in the strength of the trade unions." (s. 11)

Jag tänker att det låter rimligt att löneandelen kan varit särskilt låg under fascismen, med tanke på den italienska fascismens styrkemässiga ursprung i godsägarnas aktivism mot fackföreningar och strejker på 1910-talet, och fascismens betoning på nationell ekonomisk styrning och militarisering. Diskussionen om Kuznetskurvor och Toniolos (2003) optimistiska tolkning av industrialismens positiva effekter på inkomstfördelningen är så sett lite förvirrande för mig: jag tror absolut på att industrialismen minskade ojämlikheten i många kontexter (t ex den svenska), men om industrialiseringen sammanfaller i tid med en övergång till en fascistisk regim så tänker jag att det blir svårare att utläsa industrialismens effekter i sig.

I vilket fall, så övergår Gabbuti från denna makrodiskussion med fokus på det långa loppet, till en diskussion i sektion 5 av artikeln av kortsiktiga fluktuationer. För perioden före WW1 så talar löneandelarna emot Toniolos (2003) optimistiska tolkning, säger Gabbuti: löneandelen fluktuerade men runt en låg nivå. Under WW1 ökar löneandelen först men lider sedan en katastrofal minskning om 12 procentenheter, vilket inte är helt olikt helt andra ekonomier som Argentina, Danmark, Sverige, Spanien och Norge. Det är inte inflationen under kriget, säger Gabbuti, som förklarar löneandelens utveckling, för staten kontrollerade löner och priser och höll medvetet lönerna nere till vinsternas gunst. [1]

År 1919 börjar en ny period i löneandelens utveckling i Italien. 1919-20 inträffar de så kallade röda åren (biennio rosso), utmärkta av en skarp radikalisering av arbetarklassen, inte minst, säger Gabbuti, i protest just mot den skarpa sänkningen av lönerna och löneandelen under de föregående åren. Arbetarna strejkar och organiserar sig i fabriksråd och driver fram reformer som 8 timmars arbetsdag införd i februari 1919. 1921-22 uppnås den högsta nivån som löneandelen tar före 1945. Hösten 1922 tillträder dock Benito Mussolini som ny premiärminister, efter fascisternas paramilitära "marsch mot Rom", och ersätter den sittande liberala regeringen och inleder den fascistiska epoken i italiensk historia. Under 1920-talet faller löneandelarna igen (likt under Pinochets tid i Chile, säger Gabbuti med referens till Girardi och Bowles 2018), med en lågnotering om 44 procent år 1929, efter vilket löneandelen stiger inte på grund av någon positiv utveckling av lönerna, utan tvärtom på grund av att vinsterna föll oproportionerligt mycket i och med Depressionen. Under andra världskriget når löneandelen nya bottennivåer 1942-44, relaterat till den korporatistiskt och militaristiskt styrda ekonomin och arbetsmarknaden. (s. 14-15)

Den mycket kraftiga ökningen av löneandelen under 40-talets andra halva är som vi sett ovan den enskilt största händelsen i löneandelens historia i Italien sedan 1895. Så här ramar Gabbuti in diskussionen om denna utveckling:

"World War II was a catastrophe for Italy and its economy, but it marked the transition from fascism to democracy. Italy soon “returned to the pre-war levels of output”, despite the pessimistic expectations of the times. The country was rebuilt in a radically changed international environment: after years of autarky, Italy quickly dismantled controls, and returned very early to free trade (Boltho 2013). This could fit two of the main narratives on long-run increases in labor shares (Gollin 2002): at least in some key industries, Italy became able to adopt new technologies, while the increased international competition could have 
reduced the market power of capital owners. The immediate increase in real compensation would reflect an increased marginal product of labor. At the same time, the reopening of international trade promoted an increase of export sectors, characterized by higher productivity and remuneration, at the expense of sectors where labor accrued a lower share, generating a positive composition effect (Fenoaltea 2011, pp. 255–257). Due to unsatisfactory evidence, Giordano and Zollino (2017) ruled out, however, the possibility of reaching “strong conclusions” on the evolution of mark-ups in the 1940s. If anything, one of their estimates would suggest an increase in the first Republican decades.
An alternative, complementary explanation relies on institutional factors. Scholars working on the history of Italian institutions stressed that the Republican Constitution represented a fundamental break, not only with fascism, but also with the “liberal” period, especially in terms of workers’ protection. After the end of Fascism, Italian workers enjoyed new political and civil rights (Amendola et al. 2017, pp. 475–479). Indeed, the late 1940s were very intense in terms of industrial relations. As discussed by Musso (2011, 175-181), from March 1943—when major strikes occurred in Turin and Milan—big factories, whose employment share had grown during the war mobilization, became the main battlefield of the “home front”, accelerating the collapse of the fascist regime. Strikes and industrial conflict continued after the war, since summer 1945 (Musso 2011, 200–207). ..." (s. 15-16)

Det handlar alltså om två olika tolkningar: för det första en mer marknadsorienterad tolkning som bygger på den italienska ekonomins öppning mot världen i och med fascismens fall, för det andra en mer institutionell tolkning som fokuserar på demokratiseringen och fackets ökade styrka efter fascismens fall. Här pekar Gabbuti t ex på att 1949 efter 1962 och 1969 var det största strejkåret någonsin vad gäller arbetstimmar förlorade i strejker.

Diskussionen av 1950- och 60-talen börjar med en diskussion av arbetarhistorikers perspektiv på 1950-talet som svåra år för facken, efter att den tidigare enade fackföreningsrörelsen 1948 spluttrats i en socialistisk, en republikansk, en kristdemokratisk och en kommunistisk organisation. Men Torrini pekar på att löneandelen steg under perioden, eftersom arbetare flyttade från jordbruket där löneandelarna var låga till industrin där de var högre, och Gabbutis data bekräftar denna bild.


I nästa sektion diskuterar Gabbuti hur den funktionella och den personliga inkomstfördelningen samvarierat i Italien: han för samman sin löneandelsserie med Gini-koefficienter producerade av Amendola och Vecchi (2017, kap i Measuring Wellbeing: A History of Italian Living Standards) baserat på hushållsbudgetar. Den första grafen (Figur 7) som relaterar de två plottar dock inte de båda, utan extrapolerar Gini-estimaten för spridda år utifrån den årliga serien i löneandelen. Att döma av Gini-estimaten så var Ginin i alla fall runt 50 år 1901, därefter runt 45 1911, 1921 och 1931, och föll därefter till runt 40 år 1951.

I slutsatserna betonar Gabbuti att "In historical perspective, Italy emerges as a country where workers accrued a relatively small share of the national income, from the unification of the country in 1861 to World War II. Only after 1945, and very abruptly, labor shares converged to the European average." (s. 19) Han menar också att likt i Spanien, studerat av Prados de la Escosura (2008), så fångar variationerna i faktorandelarna antagligen större delen av variationen i ojämlikheten före 1945, medan ekonomin sedan dess blivit mer komplex och att skillnaderna inom löntagargruppen blivit viktigare. Mer generellt så menar han att "Compared to long-run estimates of personal income inequality, labor shares reveal the occurrence of “key distributive episodes”, in the sense of Atkinson (1997): most notably in the aftermaths of major shocks, such as the Great War, the March on Rome, and the Great Depression." Jag antar att man måste förstå denna kommentar mot bakgrunden att Amendola och Vecchis Gini-koefficienter före 1970 bara finns för vart tioende år 1901-1951 (och utan data för 1941) vilket gör att det blir svårt att analysera effekterna av specifika händelser och episoder, medan de årliga data som Gabbuti tagit fram tvärtom möjliggör sådan analys. Han säger också att: "Historically, Italian labor shares have been elastic to the evolution of capital-labor relationships, from unionization to reduction in worked hours, to the expansion of labor and social rights. Applied to medium-run analysis, labor shares reveal the impact of changes in labor market institutions and bargaining—that is, a fundamental political dimension of inequality." (s. 20) 

 

Fem år senare kom Gabbuti tillbaka med ännu en högrelevant studie av italiensk historisk inkomstfördelning. Denna gången tillsammans med María Gómez-León, och denna gång har de producerat Gini-koefficienter för varje år från 1901 till 1950, med hjälp av social tables-metoden. Deras artikel börjar så här:

"In recent years, scholars have debated the drivers of economic inequality, with key studies highlighting the “egalitarian” effects of major shocks—like wars and crises—in reducing inequality (Scheidel, 2018; Alfani, 2021). This view fits the interwar period, when advanced economies experienced a marked reduction in inequality following the two world wars and the Great Depression (Milanovic, 2016; Piketty, 2014). Yet, new evidence reveals substantial cross-country variation during this era, especially in right-wing authoritarian regimes, which often diverged from the expected egalitarian trend (Bartels 2019; Gomez-Leon and de Jong 2019). These patterns underscore the role of political context and power relations in shaping inequality (Alfani, 2021; Scheidel, 2024). Italy’s interwar experience —marked by the rise of Fascism amid major global shocks and domestic policy realignments—offers a striking case." (s. 1)

Vår studie, säger Gomez Leon och Gabbuti, bidrar med en studie av Italien som visar att ojämlikheten inte föll överlag som "the international debate" säger, utan att all minskning av ojämlikheten koncentrerades till två episoder: de två röda åren 1919-1920, och så åren efter 1945 och fascismens fall. Detta visar gentemot den krigsfixerade litteraturen att krig inte har någon ensidigt negativ effekt på ojämlikheten utan att krigens effekter beror på "the broader political and institutional context—such as how wars are financed, labor mobilization, and the balance of power between capital and labor." (s. 1-2) Studien visar också att fascismen, etablerad efter Marschen mot Rom 1922, hade regressiva effekter, först genom att gynna medelklassen och sedan genom att gynna kapitalinkomsterna. 

Litteraturöversikten börjar återigen med analysen att ojämlikheten föll i mitten av 1900-talet. de beskriver det så här: "There is a broad consensus that middle decades of the 20th century – marked by two world wars, the collapse of global trade after the Great Depression and the dissolution of empires – brought about a sustained reversal of the prior long-run rise in inequality, at least in advanced economies." Meningen slutar med en fotnot och i fotnoten refererar de överlag till Pikettys Capital (2014) och Milanovics Global Inequality (2018), samt mer specifikt till toppinkomstandelar hos Piketty, toppförmögenhetsandelar från Alvaredo, Atkinson och Morelli (2018) och Albers, Bartels och Schularick (2022) och förmögemhet-till-inkomst-ratios från Piketty och Zucman (2014). Men, säger de, fallstudier pekar på stora variationer: t ex Gomez-Leon och de Jongs (2019) studie av Storbritannien och Tyskland under mellankrigstiden, Bartels (2019) om toppinkomstandelar i Tyskland, Prados de la Escosura (2008) om inbördeskriget och Francoismen i Spanien, och Nikolic et al (2024) om Bulgarien och Tjeckoslovakien. 

Italien är ett passande case här, med dramatisk utveckling under första världskriget, två röda år 1919-1920, och därefter Mussolini-fascismen från 1922 och framåt. Så här beskriver de fascisternas fördelningspolitik:

"During its early years in power (1922–1930), the Fascist regime promoted pro-business and austerity policies, reversing many postwar reforms (Mattei, 2022). Privatizations and the dismantling of state controls from the war period boosted investor confidence and benefited large firms (Bel, 2011; Segreto, 2002). These policies were soon followed by a tightening of labor rights, suppression of independent unions and aggressive wage cuts (Zamagni, 1975; Musso, 2016), all of which restored profit margins and improved the relative position of the middle classes (Sylos Labini, 1974; Gabbuti, 2022).
A key turning point came in 1925–1926, with the Quota 90 policy, which abruptly revalued the lira (Cohen, 1972). While this harmed exporters, it was accompanied by wage deflation and a corporative labor regime that strongly favored employers (Segreto, 2002, p.83; Zamagni 1975, p.538).3 Additional legislation protected incumbent professionals, limited female labor participation—especially in the public sector—and helped preserve the social status of the self-employed and white-collar workers (De Grazia, 1992; Morris, 1996; Turi, 1994). Also during the 1930s, in response to the Great Depression, policies prioritized the industrial sector, channeling resources toward manufacturing (Gualerni, 1976) and implementing further wage reductions (Zamagni, 1975, p. 539; Mattesini and Quintieri, 2006).

In the 1930s, the invasion of Ethiopia (1935) and the subsequent international sanctions, while creating further profit occasions for Italian corporations (Turtur, 2024), led to the abandonment of the Gold Standard and the launch of autarkic policies. Rather than being 
centrally imposed, these measures were developed in close coordination with industrial elites and offered significant incentives to firms, including tax breaks and a growing domestic market (Bertilorenzi et al., 2022, p. 4; Segreto, 2002, p. 87).
During World War II, despite this support for industry, Italy lacked the necessary industrial and organizational capacity to replicate the wartime mobilization of World War I. Economic activity contracted from the early years of the conflict (Zamagni, 1998, pp. 213–214) and inflation surged dramatically. The collapse of the Fascist regime and the liberation of the country in 1945 marked a turning point, paving the way for institutional and social reforms. ..." (s. 2-3) 

Det är alltså intressant att forska om ojämlikhet i Italien under 1900-talets första halva, säger de, men existerande data ger inte hela inkomstfördelningen och ger bara ett fåtal år. Därför konstruerar de social tables.De följer Milanovic, Lindert och Williamson (2011) i att skapa en social table för den aktiva befolkningen, från folkräkningarna; överlag så representerar grupperna i deras tabeller 52 procent av hela befolkningen (tabellen saknar ju barn, pensionärer osv). De har gjort särskilda ansträngningar för att beräkna inkomsterna för egenföretagare, för män och kvinnor separat, och för att imputera kapitalinkomster som annars är bristfälligt representerade av hushållsbudgetar och skattekällor. En rad viktiga inkomstratios visas i Figur 1:


För att tolka de två diagrammen är det centralt att se på de olika y-axlarna -- från 0 till 18 i det vänstra diagrammet som representerar tre välbärgade grupper, och från 0 till 1 i det högra diagrammet som representerar fattigare grupper. I det högra ser vi t ex att lönearbetare låg runt 60-70 procent av den genomsnittliga inkomsten i landet ca 1910-1940, med vissa fluktuationer, och att åren 1940-1948 såg en enorm förbättring, från en bottennotering runt 50 procent till en toppnotering runt 90 procent. 

Baserat på sina social tables beräknar de Gini-koefficienter för 1901 till 1950. [2] Dessa visas som den röda linjen i Figur 2, som också presenterar Amendola och Vecchis (2017) Gini-koefficienter som de beräknat baserat på historical household budgets (HHB). Trots skillnader i källor och metod så är estimaten för överlappande år väldigt nära varann. Men ST-estimaten gör det också möjligt att se kortsiktiga fluktuationer. det ser ut som att ojämlikheten 1901-1950 hade en långsiktig fallande tendens i takt med industrialiseringen, men att "superimposed on this trend are several pronounced fluctuations and reversals, that coincide with major historical events and policy shifts": framför allt två ökningar ojämlikheten under WW1 och under fascismen.

 

 

För att kunna tolka utvecklingen mer precist så presenterar de i Figur 3 (inte återgiven här) också Gini-koefficienter uppdelat på skillnader inom löntagargruppen, och skillnader totalt, alltså med kapitalinkomster. Trenderna är väldigt lika varann men nivåerna skiljer sig rejält åt: när den totala Ginin är runt 50 i början av 1900-talet är den "bara" runt 30 inom löntagargruppen. Fascismen hade en stor ökande effekt på ojämlikheten både inom löntagargruppen och mellan löntagare och kapitalägare. [3]

För att analysera utvecklingen använder de också Growth Incidence Curves, som också jag och Diego använde i vårt Mexikopapper och som vi då lånade från Milanovic, men som Gomez Leon och Gabbuti ger cred för till Ravallion och Chen (2003). Här bryter de ner inkosmtfördelningen i inkomstgrupper på ett intressant sätt:

"The lower class (bottom 20 %) consists mainly of female wage-earners in agriculture and textile factories. The upper-lower class (P20–P50) includes female wage-earners in heavy industry and commerce, and male workers in agriculture and manufacturing. The lower-middle class (P50–P70) is composed of male wage-earners in heavy industry and commerce, and female workers in transport and services. The upper-middle class (P70–P90) includes self-employed and salaried males in industry, along with salaried professionals and public-sector workers, both male and female. Finally, the top-income group (top 10 %) consists of landowners, business owners in industry and trade, and high- salaried males employed in the liberal professions, public administration and transport."  (s. 9)

Med användning av dessa finner det att inkomstökningarna under Giolitti-perioden (-1914) var allra bäst för mitten av inkomstfördelningen, mellan percentil 40 och percentil 70, medan utvecklingen under första världskriget gynnade toppgrupperna. De två röda åren och recessionen 1921-22 drabbade tvärtemot toppgrupperna hårt, med kraftigt fallande kapitalinkomster. Under fascismens första fas 1922-1930 föll realinkomsterna för hela den nedre halvan av inkomstfördelningen medan inkomstökningen koncentrerades till den översta decilen. 1930-talet såg en ganska annorlunda bild med neutral utveckling för de lägsta två tredjedelarna, ökade inkomster runt percentilerna 80-90 och negativ för eliten. Andra världskriget-åren var en förlustaffär för alla italienare men minst för eliten.


 

 

referenser

Giacomo Gabbuti (2020) "Labor shares and inequality: insights from Italian economic history, 1895–1970", European Review of Economic History, pre-published online.

María Gómez-León och Giacomo Gabbuti (2025) "Wars, Depression, and Fascism: Income Inequality in Italy, 1901-1950", Explorations in Economic History 98: 101715.

fotnoter

[1] "According to Dogliani (2014), “during the Great War, Italy, more than other countries, experimented an authoritarian system of control, that forced civil society to military discipline without effective parliamentary control”. Wages declined until the end of the war, even if mass conscription made the economy almost “fully employed” (Galassi and Harrison 2005, p. 287), possibly because trade unions were not involved in the “Mobilization Committees” until 1917. The war effort was managed in an extremely disappointing way: inspectors were recruited “mainly from the limited population of managers, engineers, and industrialists”; procurement was managed “in arbitrary and mysterious ways” (even orally!), creating “favoritism, cronyism and corruption” (Galassi and Harrison 2005, pp. 279–286). According to Martinelli (2015), “the year 1917 was the truly critical year of the whole war for the Italian society”, and “unrest seemed to gain momentum”. The definite evidence on the real nature of the shock comes from private consumption, that collapsed even more abruptly than labor shares from 1914 to 1919 (figure 5). The slowdown in industrial production (peaking in 1917, before the military disaster of Caporetto) reflected the “physical” impossibility of expanding it further. This resounds in the letters by Italians soldiers, obsessively referring to the lack of food experienced in the trenches (ADN 2017)." (s. 13)

[2] Så här presenterar de metoden för att beräkna Ginis utifrån STs:


De sätter, förklarar de, ojämlikheten inom klasser till 0, och likaså överlappningskoefficienten L till 0. Dessa två antaganden är alltså att alla personer inom en klass/grupp har samma inkomst, och att det inte finns någon överlappning mellan klasser/grupper utan att högre rankade grupper alltid har högre inkomster än alla personer i lägre rankade grupper. I en fotnot motiverar de valet att sätta ojämlikheten inom grupper till noll: "As discussed by Modalsli (2015), this might result in the underestimation of the overall Gini, a bias we try to mitigate by including as many classes – salient groups – as possible. As argued by Milanovic (2018, p.1043), while this option is imperfect, it seems the best possible alternative to adopting arbitrary adjustments for the within-group distribution." (s. 6) Jag hade nog gärna sett en variant där man använder en parametrisk distribution inom varje grupp och visar hur stor skillnad det skulle göra för nivåerna i ojämlikhetsestimaten.

[3] Gomez-Leon och Gabbuti diskuterar det så här: " The March on Rome marked a significant turning point in Italian distributive history. In the early years of the regime (1922–1930), inequality among workers increased by 15 Gini percentage points, and overall inequality returned to prewar levels by 1925, suggesting a rapid redistribution in favor of capital. In the 1930s, overall inequality rose again, reaching a new peak. Despite a slight decline in within-labor inequality in the 1930s, income concentration continued to intensify. Fig. 3 shows that this was driven primarily by changes in owners’ incomes." (s. 8)