måndag 6 januari 2025

Problem med interaktionsmodeller

 
diagnostiska scatterplots som rekommenderas av Hainmueller, Mummolo och Xu 
för forskare som använder interaktionsmodeller
 

I kvantitativ samhällsvetenskap är det vanligt med interaktionsmodeller, regressioner där utfallsvariabeln (Y) inte bara beror på två olika förklarande variabler (D och X), utan också på samvariationen mellan D och X. Man kan, för att ta exempel från studier som jag bloggat om, argumentera som Hope och Martelli att inkomstojämlikheten påverkas både av informations- och kommunikationsteknologin som ökar efterfrågan på högutbildad arbetskraft, och av arbetsmarknadsinstitutioner som regleringar och fackföreningsstyrka, och av interaktionen mellan teknologi och institutioner: teknologin kommer ju inte implementeras på samma sätt i USA och i Sverige. Eller så kan man argumentera som Evans att implikationerna av ens klasstillhörighet för ens placering på vänster-höger-skalan kommer variera med ens grad av kyrklighet. Man kan också argumentera som Potrafke att globaliseringen av ekonomin skärper skillnaderna mellan vänster- och högerregeringar vad gäller offentliga utgifter. Det är bara tre exempel från 2000- och 2010-talens samhällsvetenskap; interaktionsmodeller har över huvud taget blivit mycket intensivt använda dessa decennier.

Det indikeras också av hur många citeringar ledande metodartiklar om interaktionsmodeller har: Brambor, Clark och Golders mycket inflytelserika artikel från 2006 har snart 7500 citeringar på Google Scholar. [1] Statsvetarna Jens Hainmueller (verksam vid Stanford), Jonathan Mummolo (Princeton) och Yiqing Xu (också Stanford) intervenerade i denna diskussion för fem år sedan med sin artikel "How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice". De börjar med att definiera interaktionsmodellen:

 Y = μ + αD + ηX + β (D · X ) + e

Här är α effekten av den ena förklarande variabeln vi är intresserade av, η är effekten av den andra förklaringsvariabeln, och β är interaktionseffekten: hur effekten av D varierar beroende på värdet på X.

Hainmueller, Mummolo och Xu (hädanefter sammanfattar jag dem som HMX) lägger fram två problem med interaktionsmodeller så som de används i statsvetenskap idag. Det första är att interaktionsmodellen låter effekten av D variera med värdet av X, men däremot antar man att själva interaktionseffekten β är linjär "and follows the functional form given by ∂Y /∂D = α + β X .". De kallar detta antagandet LIE, linear interaction effect, och menar att när de replikerar 46 interaktionseffekter i 22 artiklar i statsvetenskapliga topptidskrifter, så varierar effekten bara linjärt i 48 procent av fallen. Deras andra problem talar till mitt historiker-hjärta:

"Scholars using multiplicative interaction models routinely report the effect of D on Y across a wide range of X values by plugging the X values into the conditional marginal-effect formula ∂Y /∂D = α + β X . However, often little attention is paid as to whether there is sufficient common support in the data when computing the conditional marginal effects. Ideally, to compute the marginal effect of D at a given value of the moderator, x_o , there needs to be (1) a sufficient number of observations whose X values are close to x_o and (2) variation in the treatment, D , at x_o . If either of these two conditions fails, the conditional marginal-effect estimates are based on extrapolation or interpolation of the functional form to an area where there is no or only sparse data and therefore the effect estimates are fragile and model dependent (King and Zeng 2006). In our replications we find that this type of extrapolation is common in empirical practice." (s. 165)

Helt enkelt en poäng i den empiriska andan: vilken variation har du egentligen att utforska i X och Y? Hur samvarierar egentligen D och X -- om din estimerade β säger att effekten av D är mycket starkare när X är 60 än när X är 30, finns det egentligen några datapunkter i ditt dataset där värdet på X är 60, och bland dessa datapunkter, finns det verkligen variation i D, att det finns datapunkter med högt X och lågt D, och datapunkter med högt X och högt D? Utifrån sin replikation av de 22 artiklarna, så säger de att i praktiken så presenterar statsvetare ofta sina interaktionseffekter som om de hade full variation på X och full variation på D, även när så inte är fallet.

HMX artikel är hands on och hjälpsam: deras första sektion efter att de förklarat de två problemen, är att presentera diagnostiska verktyg som empiriska forskare kan använda för att förstå om deras data lider av problemen, (1) LIE-antagandet eller  (2) "lack of common support". Som så ofta är scatterplots av rådatat till hjälp. För en modell där D är binär (0 eller 1), "we recommend plotting the outcome Y against the moderator X separately for the sample of treatment group observations (D = 1) and the sample of control group observations (D = 0)." För båda samplen rekommenderar de att man ska köra en linjär regression och en LOESS fit. Dessa scatterplots är 1a och 1b i Figur 1 som jag klistrat in ovan. I 1a ser vi att effekten av X på Y är mycket starkare i gruppen där D = 0 än i gruppen där D = 1, så det finns en effekt av D * X. LOESS och linjär regression divergerar inte särskilt mycket, så β är något i stil med linjär. I panelerna 1b, uppe till höger, är interaktionseffekten i (det hypotetiska) datat ickelinjär, och vi ser att linjerna från en linjär modell (blå) och LOESS (röd) divergerar kraftigt. Men också här förändrar D relationen mellan X och Y.

För problem två, common support, rekommenderar de att "we can simply compare the distribution of X in both groups and examine the range of X values for which there are a sufficient number of data points for the estimation of marginal effects." (s. 169) De har också inkluderat box plots för att illustrera spridningen på ett effektivt sätt. I box plotsen är punkten medianen, slutpunkterna på de tjocka staplarna är 25:e och 75:e percentilen, och slutet på de tunna staplarna är 5:e och 95:e percentilerna. Här är ju D binär och det är relativt enkelt att illustrera spridningen av X för olika värden av D: om D är kontinuerlig så rekommenderar de en "simple binning approach", med tre grupper: låg X (lägsta tredjedelen), mellanhög X (andra tredjedelen) och hög X (tredje tredjedelen).  Dessa tre plots, för deras hypotetiska data med kontinuerlig D och en linjär interaktionseffekt, finns på 1c. De tre plottarna visar tydligt närvaron av en interaktion D * X eftersom Y varierar negativt med X när D är låg (vänstra plotten), men positivt när D är hög (högra plotten).

I följande sektion presenterar de hur man kan beräkna effekten av D på Y givet olika värden av X. För siatutionen när X är kontinuerlig rekommenderar de, i enlighet med approachen som gav plottarna i 1c, att man delar in datat i tre delar med avseende på värdet på X. (s. 170-173) Figur 2 visar både interaktionseffekter beräknade och visade så som Brambor, Clark och Golder (2006) rekommenderar -- en linjär interaktion från lägsta till högsta värdet på X -- och så som HMX rekommenderar, med effekten av D helt enkelt beräknad för tre grupper: de med lägst värde på X, de med mellanvärden, och de med högst värde. Ironiskt (?) nog skulle en ren HMX-plot, alltså utan linjen med skuggade konfidensintervall som kommer från BCG, nog se mindre "fancy" ut.


Deras andra variant på hur man kan beräkna interaktionseffekter är en kernel smoothing estimator, en semiparametrisk estimator där en serie lokala effekter beräknas. Denna är tyngre att beräkna än den enklare varianten med tre bins, och inte lika enkel att presentera resultaten ifrån. (s. 173-175)

I följande sektion går de igenom 22 artiklar publicerade i fem topptidskrifter inom statsvetenskap: he American Political Science Review (APSR), The American Journal of Political Science (AJPS), The Journal of Politics (JOP), International Organization (IO) and Comparative Political Studies (CPS). Från dessa 22 artiklar analyserar de 46 beräknade interaktionseffekter. HMX visar att större delen av dessa argument om interaktionseffekter lider av ett eller båda av de problem som diskuterats i artikeln. Figur 5, som jag klistrat in nedan, illustrerar problemet "Lack of common support", att X helt enkelt inte varierar tillräckligt mycket för de olika värdena på D för att man ska kunna dra slutsatser om att effekten av D beror på värdet på X. Den övre plotten (a) visar att datasetet har extremt få observationer med D=1, D är oftast 0, och att observationerna med D=1 är väldigt snävt klustrade runt låga värden på X. Därför blir det orimligt att extrapolera till hur effekten av D skulle vara när X är lågt eller högt.


Figur 6 visar liknande problem. Här är det en studie, utförd som ett experiment i Vietnam, om ifall transparens och publicitet gör parlamentariker mer hederliga och mer aktiva som politiker. Författarna hävdar att effekten av publiciteten (i form av granskande journalistik, variabel D här) varierar med hur stark tillgången till internet är i politikerns provins. Tillgången till internet är alltså X i notationen använd här, och politikerns arbetskvalitet är Y. Figur 6 visar uppe till vänster författarnas egna graf, gjord i Stata, som tycks visa en mycket elegant linjär effekt, med inga signifikanta effekter av D när värdet på X är ungefär 0 till 2,5, och därefter signifikanta och allt starkare effekter. Men HMX plott (b) visar att tillgången till internet -- X -- faktiskt varierar extremt lite, och har ett par extrema outliers. [2] Dessa droppas i (c), och vi ser att den skattade effekten blir väldigt mycket flackare och aldrig statistiskt signifikant. Också kernel-skattningen i (d) visar detta.

De diskuterar också en artikel som argumenterar att närheten i tid till ett presidentval (D) påverkar hur många partier som ställer upp i ett parlamentsval (Y), men att effekten varierar med antalet presidentkandidater (X). Också här finns det problem med brist på variation i datat. I 59 procent av observationerna var värdet på X 0, och bland dessa 59 procent fanns det ingen variation alls i Y. Alltså kunde inte HMX bin-strategi estimera någon interaktion för den lägsta tredjedelen vad gäller X. Det är inte heller så, som ursprungsartikeln argumenterar, att interaktionen D * X är linjärt ökande: för låga värden på X finns det som sagt ingen interaktion alls, eftersom det inte finns variation, och enligt HMX var interaktionen för resterande 41 procent av observationer ickelinjär. (s. 182) Kernel-estimaten ger ungefär samma bild, med mycket breda konfidensintervall för låga och höga värden för X, och få statistiskt signifikanta platser för β.

Från de illustrativa exemplena går HMX vidare till en översikt över de 46 interaktionseffekterna i de 22 artiklarna. De skapar ett enkelt poängsystem där varje interaktion för 0 eller 1 poäng för varje indikator: (1) inga statistiskt signifikant olika värden för β på "låga" och "höga" värden på X, (2) vad de kallar "severe extrapolation", och (3) ickelinjära interaktionseffekter. 0 poäng är alltså toppen, inga problem här, och 3 är inte alls bra. Medelvärdet för de 46 interaktionseffekterna blev 1,7, vilket indikerar rätt seriösa problem; bara 4 av 46 effekter fick ett perfekt resultat, 0 poäng. Däremot fick 7 effekter 3 poäng. (s. 184)

HMX artikel var alltså välbehövlig och starkt motiverad: det är också talande att den redan, fem år efter sin publicering, har över 1000 citeringar på Google Scholar -- forskarna verkar alltså varit ivriga att ta till sig insikterna om interaktionsmodellernas potentiella problem. Till succén hör nog också att författarna skrivit kod för R, paketet "interflex", som man kan använda för att göra precis de diagnostiska analyser som de rekommenderar. Föredömligt!


 

referens

Jens Hainmueller, Jonathan Mummolo och Yiqing Xu (2019) "How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice", Political Analysis vol 27 s. 163-192.

fotnoter

[1] Hainmueller, Mummolo och Xu sammanfattar Brambor, Clark och Golders artikel så här: " For example, Brambor, Clark, and Golder (2006) provide a simple checklist of dos and don’ts.2 They recommend that scholars should (1) include in the model all constitutive terms (D and X ) alongside the interaction term (D · X ), (2) not interpret the coefficients on the constitutive terms (α and η) as unconditional marginal effects, and (3) compute substantively meaningful marginal effects and confidence intervals, ideally with a plot that shows how the conditional marginal effect of D onY changes across levels of the moderator X." (s. 164) HMX kommenterar att de flesta statsvetenskapliga artiklar som publiceras idag med interaktionsmodeller, följer BCG:s råd.

[2] I författarnas egna graf vser vi att effekten av D ska vara stark och statistiskt signifikant när tillgången till internet, X, har värden runt 2,5 till 9. Men plott (b) visar ju att det i princip inte finns några sådana observationer i datat! James Anderson har gjort en liknande kritik av artikeln redan 2013: Andersons mer policyinriktade papper påpekade att författarnas beräkningar faktiskt föreslog att "transparens" (så som de mätte det) faktiskt hade en positiv men icke signifikant effekt i ungefär 80 procent av valdistrikten.

måndag 2 december 2024

Agrar ojämlikhet och politik i Spanien


Agrara samhällen kan ha väldigt olika sociala strukturer (klasstrukturer): det är stor skillnad mellan en socken där all jord ägs av en enda godsägare och där den övriga befolkningen sysselsätter sig med att arbeta åt godsägaren, och en socken där jorden delas mellan en större mängd småbönder. Vi kan tänka oss att i den godsdominerade socknen så utövar godsägaren inte bara ekonomisk makt -- makten att anställa och att avskeda -- utan också social och ideologisk makt. I denna tanketradition har historiker och samhällsvetare som Alexander Gerschenkron teoretiserat att den agrara ojämlikheten leder till en odemokratisk politisk kultur, med starkt begränsat folkligt deltagande och helt enkelt elitens dominans. Östra Preussen med dess junkrar är det arketypiska exemplet.

Ekonomisk-historikern Jordi Domènech och statsvetaren Ignacio Sánchez-Cuenca, båda verksamma vid Carlos III-universitetet i Getafe just utanför Madrid, går i en artikel från 2022 i dialog med denna tanketradition. De inleder dock sin artikel med en något annan inramning, om den historiska persistensen och ifall vi har en långsiktig persistens i regionala skillnader i politiskt beteende

"The historical and geographical persistence of patterns of political behaviour has been well documented (see, among others, Acharya, Blackwell and Sen 2016b; Charnysh 2015; Homola, Pereira and Tavits 2020; Lupu and Peisakhin 2017; Rodden 2019; Sanchez-Cuenca 2019; Tilley 2015; Voigtländer and Voth 2012; Wittenberg 2006). In many cases, the phenomenon of political persistence is conceptualized as a historical legacy, where the effect of an extinct cause survives vast economic, social and political transformations (Simpser, Slater and Wittenberg 2018)." (s. 1668)

Den agrara ojämlikheten kan då ses som ett specialfall av sådan persistens. De går tillbaka till mellankrigstiden i Europa, som enligt Lipset och Rokkan (1967) var tiden när det politiska systemet formerades, med klyftorna mellan stad och land, kapitalister och arbetare, och kyrka och sekularism. Domènech och Sánchez-Cuenca knyter an till Stefano Bartolinis klassiska bok The Political Mobilization of the European Left (2000) där Bartolini hävdar att länder som på 1920-30-talen fortfarande var agrara, och som hade "extreme inequality", fick ett politiskt mönster där lantarbetarna gick till den politiska vänstern. Om man förenar detta argument från Bartolini med Lipset och Rokkans argument om att klyftorna som strukturerar den politiska konflikten "frös" på 20-30-talen och bestod i flera decennier, så får vi alltså en position att de länder som på 20-30-talet var agrara och ojämlika flera decennier senare bör ha en vänsterdominerad landsbygd medan de andra länderna inte bör ha det.

Spanien är ett perfekt fall för att studera detta, säger Domènech och Sánchez-Cuenca: agrar klasskonflikt var en av de drivande faktorerna bakom den Andra Republikens fall och inbördeskriget 1936-1939, medan agrara klasskonflikter var mycket mindre viktiga efter Franco-diktaturens fall 1977. Ändå, säger de, finner vi en robust och positiv effekt av 20-30-talens agrara ojämlikhet på Vänsterns styrka i de spanska valen från 1977 till 2019. De föreslår att det finns två kausala mekanismer i spel här. Ett, att konflikterna om jord skapade beständiga politiska identiteter och lojaliteter som ännu sjuttio-hundra år senare gynnar vänstern. Två, att den agrara ojämlikheten har negativa effekter på socioekonomiska utfall -- välståndet, utbildningsutbudet -- vilket i sin tur gynnar vänstern. 

I teorisektionen konstaterar de att Lipset och Rokkan inte utvecklade analysen av den agrara klasskonflikten men att andra forskare, inklusive Urwin (1980) gjorde bidrag åt detta håll. Linz (1976, Comp Pol) urskilde 13 sociala klasser i jordbruket, med godsägare (latifundium) i toppen och jordbruksarbetare i botten. D och SC är framför allt intresserade av polariseringen i godsregioner och motsättningarna mellan godsägarna och lantarbetarna. Så här beskriver de dessa och deras implikationer för politiken:

"In countries with high levels of agrarian inequality, landowners sought to maintain their privileges and to neutralize the emergence of new industrial elites; consequently, they opposed democracy, which was perceived as a threat to the status quo (Ansell and Samuels 2014; Boix 2003; Moore 1967; Ziblatt 2008). Large landholdings are usually associated with various forms of labour coercion and, therefore, with strongly hierarchical social relations. In response, landless labourers resent their dependence on landowners, particularly if their jobs are only seasonal, and frequently support land redistribution. Politically, therefore, they lean towards the Left. Small farmers, by contrast, tend to be conservative, religious and traditionalist; they do not generally favour land redistribution." (s. 1670)
Med Bartolini (2000) säger de att denna sociala motsättning var viktig i länder där jordbruket var (a) viktigt och (b) ojämlikt. På förutsättningen (a) faller de tidigt industrialiserade länderna bort: de pekar på Storbritannien, Schweiz, Belgien, Nederländerna och, förvirrande nog med tanke på det klassiska Sonderweg-argumentet om junkrarnas betydelse i tysk 1900-talspolitik, Tyskland. På (b) gör de också en pikant utsortering av länder: "A similar diagnosis holds for countries with more egalitarian land distribution (the Nordic ones), regardless of the timing of industrialization." (s. 1670) Jag hade missat att läsa denna artikel innan Felix Kersting och jag skrev vårt working paper om agrar ojämlikhet och demokratisering i Sverige och Preussen men man kan väl helt enkelt konstatera att vårt argument om att folk underskattar den agrara ojämlikheten i Sverige, och drar felaktiga slutsatser om den politiska utvecklingen utifrån den felaktiga bedömningen av den agrara ojämlikheten, är ännu mer relevant än vad vi visste när vi skrev vårt utkast. I vilket fall, så menar Domènech och Sánchez-Cuenca att det är i länder där lantarbetarna var mellan 1/3 och 1/2 av arbetarklassen, som den agrara klasskonflikten blev central för politiken. (De jämställer "extrem agrar ojämlikhet och proletarisering, inget konstigt med det men intressant att notera, s. 1671.) De identifierar detta som södra Europa och i någon mån Frankrike. De beskriver situationen i detta mer polariserade Sydeuropa så här:

"the agrarian issue was key during the interwar period. Rural conflict polarized politics: leftist formations, particularly socialist parties, were less compromising and more tempted by revolution when agrarian workers had a greater presence in their ranks, in contrast to the reformist socialist or labour parties in early industrializing countries, which had a more homogeneous industrial and urban base (Bartolini 2000, 498–9; Luebbert 1991, 295–302). The agrarian basis of support for leftist parties (socialist, anarchist or communist) in Southern European countries is a well-known phenomenon (Urwin 1980: ch. 4). Moreover, in these countries, the agrarian issue was reinforced by the religious cleavage due to the coalition between large landowners and the Church (Manow 2015). Thus, anti-clerical violence was higher in areas of greater agrarian inequality, whereas in more egalitarian regions, small owners sided with the Church." (s. 1670)

De går över till att diskutera Spanien, som på 1930-talet fortfarande hade mer än hälften av sina sysselsatta i jordbruket, och som hade en ojämlik ägandestruktur i jordbruket, särskilt i den sydvästra delen av landet. Det finns inga "comprehensive estimates of landownership inequality" i det tidiga 1900-talet för Spanien, säger de, men med statistik från Vanhanen (2003) pekar de på att Spanien, liksom Portugal och Italien, hade en av de lägsta andelarna familjejordbruk i Europa. I de södra provinserna Cádiz, Sevilla och Córdoba utgjorde stora gods -- över 250 hektar -- mer än 40 procent av jorden, och i dessa andalusiska provinser spred sig den anarkistiska rörelsen bland lantarbetarna i det tidiga 1900-talet. [1]

Under 1920- och 30-talen ökade hettan i den agrara klasskonflikten ytterligare. Antalet medlemmar i den socialistiska lantarbetarfackföreningen ökade från runt 37 tusen år 1930 till nästan en halv miljon år 1933, och strejkerna i jordbruket ökade tjugofalt 1931-33. Efter att vänstern vann valet 1931 genomförde socialister och vänsterrepublikaner reformer av landsbygdens arbetsmarknad och arrendatorsförhållanden. I september 1932 försökte vänsterreringen genomföra en ambitiös jordreform, vilket ytterligare ökade polariseringen. Små och mellanstora bönder organiserade sig i Confederación Española de Derechas Autónomas, en högerkoalition med reaktionära partier, katolska grupper och monarkister. De små och mellanstora bönderna skulle inte direkt påverkas av jordreformen, eftersom de inte ägde tillräckligt mycket, men skulle indirekt bli påverkade av att lönerna skulle stiga när det fanns färre fattiga och desperata jordlösa arbetare att välja mellan, och detta hot drev bönderna i Högerns famn inför valet 1933. [2] När Folkfronten vann valet i februari 1936 skruvades reformtakten upp, men detta väns förstås snabbt när först regeringen möter en kupp och sedan ett inbördeskrig. Den segrande högersidan återställde alla exproprieringar av jord som vänstern genomfört, och på 1950-60-talet ledde snabb industrialisering i Baskien, Katalonien och Madrid-regionen till stor migration från de fattiga provinserna i södern till de nya fabrikerna. Jordbrukets andel av sysselsättningen i landet som helhet sjönk från 40 procent år 1960 till 16 procent år 1980. (s. 1672)

I Domènech och Sánchez-Cuencas empiriska analys är den huvudsakliga utfallsvariabeln vänsterns röstandel i de spanska valen 1977 till 2019, totalt 15 val. [3] Den första oberoende variabeln är andelen jordlösa lantarbetare i folkräkningen år 1860, som i Beltrán och Martínez-Galarraga (2018, Explorations). Denna är mätt på ganska grovhuggen nivå: de 50 provinserna, som skapades 1833 och finns kvar oförändrade idag. Den andra varianten är att använda en inkomplett jordräkning från 1920-talet, insamlad av en historiker på 1970-talet, och att räkna ut andelen av den totala beskattade jordbruksinkomsten som gick till ägare med inkomster över 5000 pesetas -- historikern Carrión (1975) menade att ungefär 1 procent av jordägarna i Spanien hade sådan inkomst eller mer, och att det var ungefär 2 procent av jordägarna i de ojämlika andalusiska provinserna. (s. 1674) Denna variabel finns för 882 kommuner, från provinserna Badajoz, Ciudad Real, Cáceres, Cádiz, Córdoba, Jaén, Málaga, Salamanca och Seville. I regressionerna utesluter de kommuner med färre än 1000 röster, eftersom de kan vara så volatila, och har då kvar 513 kommuner. (s. 1675) En tredje oberoende variabel, i en robustness check, är andelen i olika bondegrupper i 1920 års folkgrupper. Anledningen till att denna bara är en robustness check är att det är otydligt hur en småbonde räknas, i kategorin patronos eller no patronos.

Diskussionen om geografiska kontroller är extremt kort och ganska otydlig. I sin helhet lyder den: "Both in the provincial and municipal analyses, we add latitude and longitude to control for
hidden spatial patterns. We also control for the altitude of the province capital in the provincial
analysis and the altitude of the municipality in the municipal analysis." (s. 1674) De motiverar alltså inte alls varför det är relevant att inkludera latitud och longitud, eller hur högt provinshuvudstaden ligger över havet. 

Regressionsmodell 1 har på högersidan andelen jordlösa år 1860, geografiska kontroller, och dimmies för valåren. (Det är oklart om modellen har provins-fixed effects: enligt brödtexten innehåller den "the dummy for historical regions", men det finns inga sådana i tabellen, medan däremot valårs-fixed effects är tydligt redovisade.) Modell 2 använder istället andelen stora jordägare för de 882 kommunerna i de nio provinserna. Enligt modell 1 så medför en 10 procentenheters ökning av andelen jordlösa år 1860 4 procentenheters mer röster för vänstern under åren 1977-2019. I modell 2 är effekten svagare, vilket antagligen har att göra med att dessa data mest kommer från provinserna med hög agrar ojämlikhet. Koefficienten är 0,082 vilket innebär, säger Domènech och Sánchez-Cuenca, att en ökning om en standardavvikelse medför 2 procentenheter mer vänsterröster, vilket motsvarar 15 procent av en standardavvikelse i utfallsvariabeln. Den skattade effekten är robust till inkludering av provins-fixed effects.

Modell 3 lämnar den ekologiska inferensen -- studiet av mönster på kommun- och provinsnivå -- och studerar istället individdata, med en survey (som har omkring 9000 respondenter) från strax före 1977 års val. Det är en probit-modell där utfallsvariabeln är sannolikheten att rösta på ett vänsterparti, och använder andelen jordlösa år 1860 plus samtida socio-demografiska kontroller: arbetslösheten i regionen, utbildningsnivå, och sysselsättningsstrukturen jordbruk/industri/tjänster. Med alla andra variabler på sina medelvärden var sannolikheten att rösta vänster 35,1 procent i provinser där andelen jordlösa år 1860 var 30 procent, men i provinser där andelen jordlösa år 1860 var 70 procent, var sannolikheten att rösta för vänstern 59,6 procent.

I ytterligare en variant använder de en instrumentvariabel för den historiska ojämlikheten. Instrumentet är reconquistan från de muslimska härskarna i Spanien, från 700-talet till 1492. Denna gick i början långsamt och ledde till tätbefolkade samhällen med en större mängd bönder och relativt utbrett deltagande i bystyret, men från 1000-talet och framåt var det en strängare feodal ordning som skapades i de nyvunna regionerna:

"The initial period of the Reconquest was characterized by a relatively compact settlement, leading to egalitarian political institutions, free peasants and dispersed land-
ownership. In contrast, after Toledo fell into Christian hands in 1085, the aristocracy and the so-called ‘military orders’ were in charge of guaranteeing the protection of settlers in contested terrain south of the Tagus River."
Detta historiska arv, 500-1200 år gammalt, korrelerar förstås med en massa mellanliggande utfall, inte bara partival i valen 1977-2019, och författarna resonerar om hur den feodala ojämlikheten t ex leder till lägre socialt kapital och lägre utbildningsnivå (Baten och Hippe 2018, Baten och Juif 2014); därför kontrollerar de för andelen icke läskunniga år 1860 för att rensa bort effekten på politiken från det feodala arvet som verkar genom sociala förhållanden. [4]

Deras diskussion om kanalerna för den historiska persistensen är väldigt intressant. De menar att den historiska agrara ojämlikheten påverkar samtida politik genom två kanaler: en politisk, en ekonomisk. Den ekonomiska är att ojämlikheten enligt dem -- och detta tror jag inte gäller om man byter till en svensk kontext -- hindrade industrialiseringen, hejdade humankapitalbildningen, och ökade fattigdomen och arbetslösheten. (Greg Clark skulle inte heller hålla med om att ojämlikheten nödvändigtvis hindrar humankapital -- se hans och Rowena Grays studie av England.) I vilket fall, så är det ganska rättframt att testa betydelsen av de här variablerna. Den politiska kanalen är på något sätt mer komplex, och mer intressant. Domènech och Sánchez-Cuenca lägger här in två mellanstationer, tester av episoder som ligger emellan de historiska orsakerna och utfallen från 1977 till 2019. Den ena är stöd för Folkfronten i det polariserade valet februari 1936. Den andra är repressionen efter inbördeskriget. De använder för att testa detta litteraturen om "mediation analysis". De beskriver logiken så här:

"In the model, historical agrarian inequality has both an effect on the mediators (voting in the 1936 elections and Civil War violence) and on the intermediate confounders (the contemporary economic conditions of the provinces). The existence of intermediate confounders and post-treatment bias suggests that a causal mediation model should be adopted. In this sense, we follow Acharya, Blackwell and Sen (2016a) and use sequential g-estimation to isolate the two potential causal relationships." (s. 1677)
Det första steget är diagrammet med pilar som jag klistrat in nedan, en Directed Acyclic Graph, DAG. Till vänster finns "pre-treatment variables", alltså faktorer som föregick 1860 års agrara ojämlikhet: geografi, reconquistan, politik före 1860. Därefter kommer själva "treatment", alltså den huvudsakliga oberoende variabeln, 1860 års agrara ojämlikhet. Denna påverkar därefter utfallsvariabeln -- partival 1977-2019 -- på två olika vägar, en genom 1930-talets agrara politik, konflikter och inbördeskrig, en genom den ekonomiska utvecklingen.



För att beräkna detta ekonometriskt använder de s k g-estimation som är ett sätt att hantera longitudinella effekter där något som tidigare hänt (den oberoende variabeln) påverkar utfallsvariabeln direkt, men också indirekt genom mellanliggande variabler, confounders. G-estimation är en teknik som använts mycket i medicinsk forskning där man har data för samma individ över en längre tid, och något dåligt som hände personen tidigare påverkar utfall idag genom olika mekanismer. Psykologiforskarna Wen Wei Loh och Dongning Ren presenterar i en introduktion till g estimation följande exempel på en DAG:


Här är utfallsvariabeln Y -- som i deras exempel är ens välmående under dagen -- observerad vid tre tidpunkter, förmiddag, lunch och eftermiddag. Den oberoende variabeln X är om man har druckit kaffe eller inte, och confoundern L är trötthetsnivån. Som vi ser från pilarna så påverkar både förmiddagens humör (Y1) och förmiddagens energinivå (L1) om man dricker kaffe (X1), som påverkar humöret senare under dagen, Y2 och Y3. g estimation är då en metod för att beräkna hur Y3 bestämts av måendet tidigare under dagen (Y1 och Y2) och en oberoende variabel (X) och en confounder (L) som alla påverkas i sig av Y, och har ömsesidiga relationer.

Så här förklarar Domènech och Sánchez-Cuenca sin g-estimation-approach:

"To proceed with the sequential g-estimation, we first expand our baseline regressions to include the mediator variables and the intermediate confounders alternatively. One first snapshot of the relative importance of these channels can be simply grasped by gauging the change in the main coefficient on agrarian inequality when adding the mediators or the intermediate confounders to the baseline specification (Baron and Kenny 1986). For the mediators, we use the provincial percentage of the vote going to the Popular Front in the general election of February 1936 (the source is Alvarez Tardío and Villa [2017]). Regarding Civil War repression, we use the data from Espinosa (2010).15 For the analysis, we include only the number of civilians killed by the Rebels since the repression of the Republicans is associated with support for the Popular Front in the 1936 elections (it makes little sense to assume that Republican repression strengthens leftist allegiances). We ‘normalize’ the number of murdered civilians using the inverse hyperbolic sine function." (s 1677-1678)
Den första regressionen i g-estimation-analysen är samma som den första regressionen i pappret fast med de två medlande variablerna med: andelen röster på Folkfrontens partier år 1936 och höger-repression efter inbördeskriget. Båda de medlande variablerna har positiva och signifikanta effekter på vänsterröstning 1977-2019, och koefficienten för 1860 års andel jordlösa krymper från 0,406 till 0,107. I en annan variant, kolumn 3 i samma tabell, använder de istället de samtida confounders -- arbetslöshet, etc. Dessa minskar inte koefficienten för 1860 års ojämlikhet lika mycket som de medlande variablerna från 1930-talet gör, vilket författarna tolkar som att: "Although these estimations are affected by post-treatment bias, they suggest that the political mechanism is a more dominant channel than the intermediate economic confounders." (s. 1678)

Därefter gör de en sequential g-estimate med Stata-koden från Acharya, Blackwell och Sen (2016). De beskriver processen så här: 

"This procedure de-means the main variable to keep the intermediate confounders or the mediator constant, re-estimates the regression without post-treatment variables and bootstraps the standard errors of the coefficient of interest. In column 4, we present the results of the sequential g-estimation when the intermediate confounders (unemployment, education and industrialization) are fixed. The coefficient on agrarian inequality in 1860 captures the effect that goes through the political channel, in this case, the front-door pathway via our selected mediators. We obtain a very similar coefficient of land inequality to that of column 3. A one standard deviation increase in 1860 inequality (10.24 percentage points) is associated with a 2.94 percentage point increase in the leftist vote, which represents almost a third of the standard deviation in the leftist vote." (s. 1678)
Kolumn 2 kollar på den andra möjliga kanalen, med medelvärdet för 30-talets medlande variabler bortdragna från dem. Koefficienten ändras knappt jämfört med kolumn 1 vilket visar att båda kanalerna spelar roll, men den politiska mer än den ekonomiska. De gör också g-estimation-metoden med kommundatat.

Jag gillar verkligen hur fokuserade de är på att diskutera persistensens mekanismer, och från g-estimation-sektionen övergår de till en mer kvalitativ diskussion av mekanismerna. Hur kunde den ideologiska präglingen från 1920-30-talen överleva genom flera decennier av diktatur och fortfarande manifestera sig i den demokratiska politiken från 1977 och framåt? De ger en effektiv översikt över olika kanaler som forskningen diskuterat: "The literature on historical legacies has contemplated several transmission mechanisms: the Church (Wittenberg 2006), the school (Darden and Grzymala-Busse 2006) and the family (Acharya, Blackwell and Sen 2016b; Lupu and Peisakhin 2017; Voigtländer and Voth 2012)." (s. 1680) För den spanska kontexten med Francos diktatur bör familjen vara den viktigaste mekanismen: partier och fackföreningar till vänster var förbjudna, och kyrkan var regimtrogen. Skolorna styrdes likaså av kyrkan och regimen. Återstår gör familjen, som också forskningen från andra länder visat vara viktig. För att undersöka denna mekanism använder de en survey gjord 2008 där respondenterna blev tillfrågade både om sin egna politiska position, ens föräldrars politiska positionerl och vilken sida förfäderna tog under inbördeskriget.

Det är en rik artikel, med ambitiöst innehåll, och från mekanismdiskussionen går de över till att diskutera ifall relationen mellan agrar ojämlikhet och senare politiska utfall är sig lik också i andra europeiska demokratier. De kollar här på Italien och England, två länder med stor agrar ojämlikhet i det tidiga 1900-talet men där England var en tidig och Italien en sen industrialiserare. (I ett online-appendix kollar de också på Portugal.) För Italien är ojämlikhetsmåttet andelen jordlösa ("landless peasants") i befolkningen i folkräkningen 1931, och utfallsvariabeln är partival i 1976 års val. Korrelationen mellan den agrara ojämlikheten och vänsterns styrka är stark. (s. 1684) I England är det däremot inte så. Där är utfallsvariabeln stödet för Labour-partiet i 1970-talets fem parlamentsval, och de oberoende variablerna är olika indikatorer på rural fattigdom och konflikt på 1820- 1830- och 1870-talen. De tar en indikator på poor relief per person på 1820-30-talen från Blaug (1963) eftersom poor relief-utgifter var (negativt) korrelerade med bred tillgång till jord. Den andra oberoende variabeln är deltagande i Captain Swing-upploppen på 1830-talen, med data från Caprettini och Voth (2020). Den tredje oberoende variabeln är andelen av jordräntorna år 1873 som betalades till jordägare med mer än 800 acres jord. Till skillnad från i Spanien och Italien finns det i England ingen positiv korrelation mellan historisk agrar ojämlikhet och vänsterns styrka på 1970-talet.


 

referens

Jordi Domènech och Ignacio Sánchez-Cuenca (2022) "The Long Shadow of Agrarian Conflict: Agrarian Inequality and Voting in Spain", British Journal of Political Science 52: 1668-1688.

fotnoter

[1] Här har de några intressanta historiska referenser: T Kaplan (1977) Anarchists of Andalusia, 1868–1903 (Princeton); J Maurice (1990) Anarquismo Andaluz: Campesinos y Sindicalistas, 1868–1936. (Barcelona).

[2] Också här är de hsitoriska referenserna intressanta. De använder Malefakis klassiska studie från 1970 för jordreformen, och Luebbert (1991, s. 297), Manow (2015) och Simpson och Carmona (2020) för böndernas reaktion. 

[3] Eftersom vänsterpartierna förändrats över tid aggregerar de röstarna på alla vänsterpartier i varje aktuellt val. (s. 1672) 

[4] Mer precist så diskutear de det så här: "Feudal privilege is linked to other factors, like lower levels of social capital and education, which might also be correlated with contemporary political outcomes (Baten and Hippe 2018; Baten and Juif 2014), violating the exclusion restriction. We therefore add to our specification the rate of illiteracy in 1860 as an extra control blocking potential impacts of feudal privilege on political preferences other than inequality. By including illiteracy, the levels of human and social capital are taken into account, and the instrument captures agrarian inequality." (s. 1676)

fredag 29 november 2024

Demokratiskt kapital

 

Nationalekonomerna Torsten Persson (Stockholm) och Guido Tabellini (Bocconi) presenterar i sin artikel "Democratic Capital" från 2009 tre nya idéer om relationen mellan välstånd (mätt som BNP per capita) och demokrati. Vi vet att de två sakerna korrelerar, men varför, vad driver vad? Persson och Tabellinis första idé eller argument är att om demokrati förbättrar den ekonomiska utvecklingen, så kommer också förväntningar om en kommande demokrati påverka investeringsbeteendet i en autokratis slutfaser. Detta gör att ekonometriska skattningar av demokratiseringens effekt på ekonomin kommer underskatta de positiva effekterna, om folk redan börjat anpassa sig utifrån sina förväntningar, före demokratiseringen faktiskt sker. (99-100) Den andra idén är att för att demokratin konsolideras långsamt, "through a slow accumulation of a stock of civic and social assets that we call 'democratic capital.'" (s. 89) Persson och Tabellini menar att det demokratiska kapitalet ackumulerar ett samhälle antingen genom egen erfarenhet av demokrati, eller genom att ta inflytande från grannländer. [1] Dessa två argument kan kombineras till att förklara utvecklingen av en positiv spiral av demokrati och ekonomisk utveckling. Det tredje argumentet är att det inte är slumpmässigt vilka autokratier som demokratiseras, och att beräkningar av effekterna av demokratisering alltså kan vara biased.

Begreppet "demokratiskt kapital" är det som intresserar mig mest med Persson och Tabellinis undersökning. Angående detta så relaterar de till tidigare forskning så här:

"We are not the first to stress civic engagement and cultural attitudes in shaping the functioning of political institutions, and how some kind of “social capital” can be acquired over time. Important precursors include Seymour Martin Lipset (1959), Gabriel A. Almond and Sidney Verba (1963) and, more recently, Robert D. Putnam (1993), Axel Hadenius and Jan Teorell (2005), and Ronald Inglehart and Christian Welzel (2005). But our empirical methodology is very different from these studies.
In particular, democratic capital refers to variables that influence the stability of democratic regimes without direct effects on economic outcomes. The importance of culture in economic (as opposed to political) development is discussed from a different perspective in Guido Tabellini (2008a)." (s. 91)
Deras mått på BNP per capita kommer från Angus Maddison (2001). Måttet på politisk regim är binärt: 0 för autokrati, 1 för demokrati, och bygger först och främst på Polity IV som betygsätter politiska regimer från -10 (ren diktatur) till +10 (ren demokrati); Persson och Tabellini kodar landet som demokrati om värdet är över 0. [3] Deras alternativa mått på demokratisering kommer från Boix och Rosatos (2001) utbyggnad av Przeworski et als (2000) data. Detta är en binär variabel för "turnover of political power in free and fair elections". (s. 100) Persson och Tabellini beskriver fördelningen av länder som går från autokrati till demokrati, eller inte, eller fram och tillbaka flera gånger: 

"By both measures, political change varies a great deal across countries. Some nations, such as Afghanistan, China, and Morocco, never experience a transition into democracy. Others, like Australia and Canada, start out as democracies from independence, and never relapse into autocracy. Yet others, such as Costa Rica and Denmark, start out autocratic and make a single transition into democracy. Many countries have a more eventful history, however, with intermittent spells of democracy and autocracy. According to the Polity IV measure, Guatemala is the most extreme, having gone through six periods each of democracy and autocracy, since independence in 1839." (s. 100)

Hur kan man då mäta demokratiskt kapital, d, utifrån dessa data? Persson och Tabellini menar att det demokratiska kapitalet kommer i två former. Det första är inhemskt demokratiskt kapital (z), som växer över tid när medborgarna får fler erfarenheter av demokratiskt samhällsliv. Detta gör demokratin mer robust på flera sätt (genom flera mekanismer), som uppbyggnaden av formella och informella institutioner, som politiska partier och sociala normer. Tabellini (2008) har presenterat en formell modell för hur kulturella normer överförs mellan generationerna, och visar hur andra generationens invandrare i USA vars föräldrar kommer från mer demokratiska länder, idag har högre grad tillit, vilket är korrelerat med politiskt deltagande.

De säger att de är "agnostic about functional form" om hur z formeras, och börjar med en enkel modell där z ökar med antalet år som demokrati och vittrar med antalet år som autokrati. Om ∑ är från τ=0 till τ  = t−t_0 och t_0 är startåret, som antingen är år 1800 (när datat börjar) eller året när staten blir självständig, så:

 z (δ)_i,t = (1 − δ)   ∑  (1 − a_i,t−τ) δ^τ 

Diagrammet som jag klistrat in högst upp här illustrerar hur det demokratiska kapitalet utvecklades i Spanien och Sverige sedan 1800 om vi följer ekvationen här och sätter förslitningstakten 1-δ till 0,06. Länderna hade ganska olik politisk historia: Sverige blev demokratiskt först 1910 men förblev då demokratiskt, medan Spanien för första gången blev demokratiskt mycket tidigare, 1870, men också hade en mycket mer volatil historia därefter. Persson och Tabellini laborerar med två olika värden på δ, 0,94 eller 0,99, och med det lägre värdet på δ, alltså högre förslitningstakt på det demokratiska kapitalet, så går Sverige om Spanien i "demokratiskt kapital" runt 1930, snarare än runt 1950 som sker i modelleringen med δ på 0,99.

Den andra dimensionen av demokratiskt kapital är enligt Persson och Tabellini baserad på förhållanden i grannländerna. De definierar detta utländska demokratiska kapital f_i,t som:

 f (ρ)_i,t = ∑ (1 − a_j,t) ϖ (ρ)_t ^i,j
                j≠i
där a är ett mått på demokrati i närliggande landet j, och vikten ϖ tar in avståndet mellan land i (som vi är intresserade av) och landet j. ϖ faller till 0 när avståndet överskrider radius ρ utanför vilken förhållandena alltså inte förväntas påverka det demokratiska kapitalet i land i.

Man kan tycka att måtten är rätt yxiga -- t ex den medvetet naivt formulerade modellen att politiken i land i påverkas lika mycket av alla länder på samma geografiska avstånd, snarare än att detta medieras av land j:s befolkningsstorlek, ekonomiska styrka, militära styrka etc -- och Persson och Tabellini medger också att måtten d och f är "boldly constructed measures of democratic capital". (s. 104) De menar till måttens fördel att de båda är starkt korrelerade med graden till vilken medborgare värderar det demokratiska styrelsesättet i en stor uppsättning länder; på 1990-talet frågade World Value Surveys personer i 60 länder om de höll med om påståendet “Democracy may have problems, but it’s better than any other form of government.”, och benägenheten att hålla med är starkt korrelerad med Persson och Tabellinis mått d och f.

Den empiriska studien börjar med att beräkna sannolikheten för regimskifte: från autokrati till demokrati, eller tvärtom. Här undersöker de betydelsen av det demokratiska kapitalet, BNP per capita och BNP per capita givet politisk regim. Med maximum likelihood-metoder beräknar de rimliga värden på δ och ρ; δ hamnar mellan 0,94 och 0,99 och ρ hamnar på 1 vilket innebär att hela världens länder räknas in i den relevanta referensgruppen. (Vad jag inte fattar är hur en ρ på 1 kan kombineras med års-fixed effects, men men.) [4] Demokratiskt kapital minskar föga förvånande sannolikheten för en autokratisering, och högre inkomst minskar risken att en demokrati autokratiseras. (s. 111) Modellerna kan dock inte förklara majoriteten av sannolikheten att demokratiseras eller autokratiseras: de förklarar ungefär 22 procent av risken att autokratiseras, och hälften så mycket för risken att demokratiseras.

De har en utförlig diskussion om möjliga metodologiska problem med regressionerna, med till exempel random effects-modeller istället för fixed effects, och diskussion om dold heterogenitet med flera möjliga problem. (s. 114-115) Efter denna diskussion övergår artikeln, som är ganska lång, till bestämningsfaktorerna bakom den ekonomiska tillväxttakten, med fokus på demokratins roll. Att vara nära en övergång till autokrati igen har en negativ effekt på den ekonomiska tillväxten i demokratiska länder. (116-121) Att ha inhemskt "demokratiskt kapital" ackumulerat är bra för tillväxten.

Slutsatssektionen börjar med att beskriva det ömsesidiga beroendet mellan den ekonomiska tillväxten och demokratin:

"Our results suggest the possibility of a virtuous circle, of the type mentioned in the introduction. Having long-time democratic experience favors economic development through physical capital accumulation, which helps further consolidate democracy. This, in turn, leads to the accumulation of more democratic capital, with additional positive effects on income and democratic stability." (s. 123)

Det deskriptiva mönstret, när de klassificerar en stor mängd av världens länder i ett diagram med demokratisk erfarenhet på en axel och BNP per capita på den andra axeln, antyder att alla demokratier har ekonomisk utveckling, men att också en del autokratier har det. Demokrati är då en tillräckligt men inte nödvändig orsak till ekonomisk tillväxt. (s. 123)
 


referens

Torsten Persson och Guido Tabellini (2009) "Democratic Capital: The Nexus of Political and Economic Change", American Economic Journal: Macroeconomics, 1:2, s. 88-126.

fotnoter

[1] Ett annat sätt att tänka på den här frågan är att som Kadivar, Usmani och Bradlow fokusera på den folkliga mobiliseringen i en autokrati -- den folkliga mobilisering som i sig kan leda till demokratisering.

[2] Deras makroekonomiska modell ser mycket kort ut som följer. produktionen BNP per gammal person, y, beror på produktivitet A och kapitalintensiteten k. Produktiviteten är A i autokratier och A + θ i demokratier. Varje ung person har inkomsten w. De unga personer väljer att spara k i period t-1 utifrån förväntningar om avkastning som också beror på θ, alltså skillnaden i produktivitet mellan demokrati och autokrati, och p, sannolikheten att landet kommer vara en autokrati i period t. Sannolikheten för ett regimbyte är χ som tar ett värde mellan 0 och 1. Sannolikheten beror på hur många av de gamla medborgarna som engagerar sig för att försvara demokratin, som i sin tur beror på deras avkastning av detta, b som beror på d och θk. d är det demokratiska kapitalet, som "reflects cultural forces related to history or geography that lead to an appreciation of democracy." (s. 94) Sannolikheten för autokrati avtar alltså med d och θ. d har en effekt på kapitalackumulationen indirekt, genom sannolikheten för autokrati p, men inte direkt. 

De menar att länder "sorterar sig" till autokrati och demokrati beroende på om θ är positiv (sortering till demokrati) eller negativ (sortering till autokrati). (s. 96-97) 

[3] De påpekar att den underliggande genomsnittliga förändringen i Polity IV när de kodar ett regimskifte (från 0 till 1 eller 1 till 0) är 8. (s. 100) Med så stora skiften är dikotomiseringen mindre kontroversiell än om skiftena hade varit mindre, om det hade varit en mängd fall som rörde sig från 0 till 1 eller liknande. 

[4] I introduktionen till regressionerna så beskriver de specifikationerna så här: "Some specifications include a number of fixed and time varying controls, xi,t, to reflect country- and time-specific probabilities of a coup or an uprise, corresponding to parameter χ in the model." (s. 107)

onsdag 27 november 2024

Ökar demokratisering den ekonomiska tillväxten?


En av 2000-talets stora debatter är ifall 1990-talets demokratiseringsvåg stannat av och kanske till och med vänts om: lever vi i ett autokratiseringens tidevarv? Det är inte minst det auktoritära Kina och dess framgångsrika ekonomiska utveckling som sätter dessa frågor på agendan. Nationalekonomerna Daron Acemoglu (MIT), Suresh Naidu (Columbia), Pascual Restrepo (Boston) och James A. Robinson (U Chicago) börjar sin artikel från 2019 med den väldigt tydliga rubriken "Democracy Does Cause Growth" med exempel på debattörer som uttrycker skepsis mot att demokrati skulle leda till förbättrad levnadsstandard och ekonomisk tillväxt. De citerar New York Times-krönikören Thomas Friedman från 2009: “one-party nondemocracy certainly has its drawbacks. But when it is led by a reasonably enlightened group of people, as China is today, it can also have great advantages. That one party can just impose the politically difficult but critically important policies needed to move a society forward in the 21st century.” Och de citerar den legendariske nationalekonomen Robert Barro från 1997: “More political rights do not have an effect on growth.”

Acemoglu med medförfattare hävdar förstås -- se artikeltiteln -- det motsatta. De studerar en panel med länder från 1960 till 2010 och menar att en övergång från ickedemokrati till demokrati leder till att BNP per capita är 20 procent högre 25 år senare, än vad den hade varit om landet hade förblivit en ickedemokrati. [1]

De använder en rad olika metodologiska approacher för att visa att detta huvudresultat inte är känsligt för specifikation. Den första strategin är att använda en linjär, dynamisk modell med land-fixed effects och autoregressiv dynamik, alltså med laggade värden från BNP-tillväxten själv. Den andra strategin är en semiparametrisk regression där själva övergången till demokrati också görs till ett utfall av tidigare BNP-tillväxt. Den tredje strategin använder en instrumentvariabel-approach för att komma undan problemet med endogenitet och uteslutna variabler som varierar över tid. Deras IV-strategi bygger på faktumet att demokratisering tenderar att ske i vågor, som Huntington (1991) påpekade, där vad som händer i den omgivande regionen påverkar vad som sker i landet.

De gör också en mekanismanalys där de undersöker genom vilka mekanismer demokratin påverkar tillväxten. Resultaten är inte lika starka som för BNP självt, men antyder att det sker genom ökade investeringar, ekonomiska reformer, bättre skola och sjukvård, och minskade sociala konflikter.

Vad är då demokrati och demokratisering i deras modeller? De menar att olika demokratiseringsindex har mätfel och att det därför är bättre att använda ett index av index. Detta tar de från Papaioannou och Siourounis (2008), och det tar in information från olika källor som Freedom House och Polity IV, och klassificerar ett land bara som demokratiskt när det är klassat som sådant i flera av källorna. Grundsteget är att Freedom House klassar landet som "free" eller "partially free" och att landet har ett positivt värde på demokrati i Polity IV. Om någon eller båda av dessa källor saknar information, så använder de dataset från Cheibub, Gandhi, and Vreeland (2010) eller från Boix, Miller, and Rosato (2012).

Med deras mått var 31,5 procent av de 184 länderna i samplet år 1960 demokratier, och år 2010 var andelen 64,1 procent. Samplet innehåller 122 demokratiseringar och 71 tillbakagångar. [2] De gör en intressant poäng om sin relativt omfattande kodning av demokratisering, som de exemplifierar med Argentina. Argentina demokratiserades 1973 men 1976 inträffade en militärkupp och militärjuntan hade därefter makten från 1976 till 1983, efter vilket landet demokratiserades igen.Papaioannou och Siourounis kodar i sitt dataset bara 1983 som demokratisering i Argentina, eftersom den blev varaktig, men Acemoglu et al kodar både 1973 och 1983, med 1976 kodat som en tillbakagång.

Deras första "dynamiska" modell är:

y_ct = βD + ∑ γ_j y_ct-j + α_c + δ_t + e_ct

där y_ct är logaritmerad BNP per capita (y) i land c år t och D_ct är det dikotoma måttet om landet är demokrati eller inte. α_c är land-fixed effects och δ_t är års-fixed effects. ∑ av γ innehåller p antal laggar av BNP per capita. (Jag lyckades inte få in p i layouten av ekvationen, men ∑ går alltså från j=1 till p.) Här för de ett intressant resonemang om hur länder som demokratiseras och inte demokratiseras har olika trender av BNP per capita innan demokratiseringen sker eller inte sker. Detta beror både på att demokratisering blir mer sannolikt efter en ekonomisk kris, och eftersom både demokratisering och BNP per capita påverkas av faktorer som varupriser, jordbruksproduktivitet och teknologi. Faktumet att approachen med instrumentvariabler ger liknande resultat som den linjära dynamiska modellen stödjer i alla fall, säger de, slutsatsen att de lyckas få bort problemen med "selektion till demokratisering" genom sitt användande av laggar av BNP och land-fixed effects. (s. 58) [3]

De dynamiska regressionerna visar, föga förvånande, att BNP per capita är en starkt persistent variabel: koefficienten för BNP p/c föregående år på BNP p/c i år är 0.973. Demokrativariabeln har också en positiv och signifikant koefficient, om 0.973 den med men med större standardfel. De tolkar detta som att en bestående övergång till demokrati ökar BNP per capita med 1,97 procent året efter, med 2,9 procent två år efter, och så vidare. De beräknar den totala kumulativa effekten av en permanent övergång som:

β

--

1 -  ∑ ^p _j=1 γ_j

där de plockar β och γ ur beräkningarna i tabell 1, modellen med en lagg. Med dessa beräkningar ger ekvationen att en permanent övergång till demokrati ökar BNP per capita med 35,6 procent på lång sikt, och efter 25 år med 17,8 procent med standardfelet 5,7 procent. Om de istället tar β och γ ur en regression med två laggar så blir den beräknade långsiktiga effekten av bestående demokratisering 19,6 procent. De föredrar dock en regression med fyra laggar, där koefficienten β är 0,787 och den långsiktiga effekten är 21,2 procents ökning av BNP per capita med ett standardfel om 7,2 procent. Figur 2, som jag klistrat in ovan, visar dessa beräkningar. [4]

De har en mängd robustness checks. En är att skilja på länder beroende på deras initiala BNP per capita, alltså nivån som rådde år 1960. De delar in samplet i kvintiler utifrån denna nivå men effekterna håller. Nästa robustness check är att försäkra sig att resultaten inte drivs av specifika utvecklingar kring Sovjets fall. Detta kontrollerar de för genom interaktioner med en dummy för Sovjet och Sovjets satellitstater. Också med denna koll är resultaten liknande: den långsiktiga effekten av demokratisering blir 24,9 procent. (s. 70) Robustness ckeck tre och fyra är att kontrollera för föregående handelschocker, finanskriser och demografiska chocker. I ett Online Appendix har de också ytterligare robustness checks, inklusive ifall resultaten håller med andra mått på demokrati, vilket jag tycker är väldigt intressant. (s. 71) I Appendix gör de också en Appendix där de tar bort outliers, definierat som standardiserad residual över 1.96 eller under -1.96, eller med Cook's distance över 4/N.

Artikeln har egentligen ganska lite substantiell diskussion om demokrati, vad det betyder och varför det spelar roll för ekonomisk tillväxt, och väldigt mycket metodologisk diskussion. De kritiserar sin egen huvud-approach för att vila för tungt på antagnadet om linjära förhållanden mellan variablerna, och går därför i sektion IV vidare med semi-parametriska estimat. (s. 72ff) I sektion V använder de en instrumentvariabel-approach som, som nämnt ovan, bygger på de regionala vågorna av demokratisering. (s. 78ff)

Efter 10 sidor av instrumentvariabelberäkningar, kommer artikeln till mekanismerna. Här beräknar de modeller som:

 m_ct = βD + ∑ γ_j y_ct-j + ∑ η_j m_ct-j + α_c + δ_t + e_ct

 där m_ct är en eller annan mekanism genom vilken demokrati kan påverka BNP: investeringarnas andel av BNP, TFP, Giuliano et als (2013) index på ekonomiska reformer som är på en skala mellan 0 och 100, handelns andel av BNP, andelen skatter i BNP, andelen barn som går i grundskolan eller högstadiet, barnadödlighet, och social oro. De kör modellerna med sin within-estimator, med 2SLS, och en IV-estimator. I alla varianter får de fram att demokratin ökar sannolikheten för ekonomiska reformer, höjer skatteuttaget, ökar barnens skolgång, och minskar barnamortaliteten. De kommenterar: "Overall, these results suggest that democracy might be working through a number of channels. In particular, democracies seem to enact economic reforms that are conducive to growth. Democracies also seem to raise more taxes and invest more on public goods related to health and schooling,
which may contribute to growth. In addition, democracy seems to reduce social unrest, which could also have a positive impact on economic growth." (s. 89)

Sektion VII vänder på steken och ser på ifall demokratin bara har en positiv effekt på ekonomisk utveckling givet att man redan har en viss nivå av ekonomisk och social utveckling: proxyn för detta är andelen av befolkningen som har secondary school-utbildning. Det finns en positiv interaktion här men den är svårtolkad, säger de. De föredrar tolkningen att med mer humankapital minskar fördelningskampen, vilket gör demokratin mer stabil. (s. 93-96)

I slutsatssektionen, som är mycket kort, betonar de studiens relativt preliminära status och pekar på behovet av mer forskning:

"Taken together, our results suggest that democracy is more conducive to economic growth than its detractors have argued and that there are many complementarities between democratic institutions and proximate causes of economic development. Work using cross-country and within-country variation to shed more light on how democracy alters economic incentives and organizations and to pinpoint what aspects of democratic institutions are more conducive to economic success is an obvious fruitful area for future research. An exploration of the possibly more complex interactions between political regimes and economic outcomes, incorporating, among other things, nonlinear dynamics, multiple regime types, and richer heterogeneous effects, is another important area of future inquiry." (s. 96-97)

 

referens

Daron Acemoglu, Suresh Naidu, Pascual Restrepo och James A. Robinson (2019) "Democracy Does Cause Growth", Journal of Political Economy 127 (1).

fotnot

[1] De åberopar (s. 49-50) fyra metodologiska problem för att dra sådana här slutsatser. Ett, "existing democracy indices are subject to considerable measurement error, leading to spurious changes in democracy scores that do not correspond to real changes in democratic institutions." Två, icke observerade skillnader mellan demokratier och ickedemokratier gör att man inte kan dra kausala slutsatser utifrån tvärsnittsregressioner som Barro (1996, 1999) gjorde, utan man behöver difference-in-differences-metoden eller paneldata med fixed effects. Tre, en demokratisering föregås ofta av en dipp i BNP-tillväxten, och detta måste man ta hänsyn till i sin ekonometriska specifikation; t ex så bryts ju därmed antagandet om parallella trender som man gör i DID-metoden. Fyra, lite otydligt så säger de att "even if we control for country fixed effects and GDP dynamics, changes in democracy could be driven by time-varying unobservables related to future economic conditions, potentially leading to biased estimates."  

Längre fram i artikeln när de diskuterar hur artikeln relaterar till tidigare forskning fäster de verkligen stor vikt vid den till synes väldigt enkla frågan om att ha med laggar i regressionen:

"More recent work, including Rodrik and Wacziarg (2005), Persson and Tabellini (2006), Papaioannou and Siourounis (2008), and Bates, Fayad, and Hoeffler (2012), estimate positive effects using panel data techniques, although Murtin and Wacziarg (2014), Burkhart and Lewis-Beck (1994), and Giavazzi and Tabellini (2005) estimate insignificant effects on growth using similar strategies. These and other papers in this literature differ in their measure of democracy and choice of specifications and neither systematically control for the dynamics of GDP nor address the endogeneity of democratizations. Although some of the papers in this literature control for lags of GDP in some of their specifications (e.g., Persson and Tabellini 2006; Papaioannou and Siourounis 2008; Murtin and Wacziarg 2014), they do not emphasize the importance of GDP dynamics and the bias that results from not appropriately controlling for the dip in GDP shown in figure 1. The failure to recognize this point may, in fact, explain the divergent results in the literature: because growth rates are less serially correlated than GDP, contributions that focus on growth as the dependent variable tend to find positive effects, while studies that estimate models in levels generally find no effects—unless they model the dynamics of GDP as we do." (s. 52) 

[2] En intressant teknisk men också substantiell fråga är: "The major difference between our measure of democracy and that of Papaioannou and Siourounis (2008) is that theirs considers only permanent transitions to democracy. By considering only democratizations that are not reversed, their index encodes information on the future state of democratic institutions, which exacerbates the endogeneity concerns when it is included as a right-hand-side variable in growth regressions. Instead, we code both permanent and transitory transitions to democracy and nondemocracy. For example, our measure of democracy indicates that Argentina had a short spell of democracy from 1973 to 1976, when it held general elections for the first time in 10 years. This spell was inter-rupted by a military coup in 1976, which put a series of military dictators in power until 1983—a period we code as nondemocratic. Argentina returned to democracy again in 1983, when the collapse of the military junta gave way to general elections. While we code all such transitions, Papaioannou and Siourounis code only the permanent transition to democracy in 1983." (s. 55)

[3] Det är något roligt med hur grundligt skriven om enkla saker artikeln är ibland, som att den är läroboksmaterial. De säger att "Under assumption 1 and stationarity, equation (1) can be estimated
with the standard within estimator", och i en fotnot förklarar de ganska utförligt within-estimatorn -- som alltså undersöker variationen inom landet över tid, eftersom land-fixed effects tar bort variationen mellan länder. (s. 58)

[4] De diskuterar Nickell bias i panelerna och presenterar också GMM-estimat baserade på Arellano och Bond (1991). Dessa ytterligare beräkningar är inte särskilt intressant här. (s. 62-65)

fredag 15 november 2024

Mekanisering av jordbruket

 
mekaniserad bearbetning av jorden, från Vidya Vemireddy och Anjali Choudharys rapport  
technologies", CENTRE FOR MANAGEMENT IN AGRICULTURE, Indian Institute of Management 
Ahmedabad, maj 2023.

I fattiga ekonomier arbetar en stor del av arbetskraften i jordbruket, i småskalig, arbetsintensiv produktion som ofta styrs av familjemedlemmar. Att mekanisera och professionalisera jordbruket är en central del av att bli ett rikt land. Nationalekonomerna Julieta Caunedo (Cornell) och Namrata Kala (MIT) börjar ett working paper med dessa grundläggande fakta.

Utifrån detta förstår vi att det är viktigt att studera mekanisering av jordbruket, och det är vad Caunedo och Kala gör i sitt paper. De gör ett experiment med mekanisering i Indien, och visar hur mekaniseringen påverkar olika variabler: efterfrågan på olika typer av arbetskraft (anställda vs obetalda familjearbetare), produktiviteten och familjernas val av arbete och fritid. 

Intressant nog så säger de med motiveringen att hyrmarknader för maskiner var centrala för mekaniseringen av de ekonomier som idag är rika, att de använder ett hyrmarknadsexperiment i sin egen forskning. De har samarbetat med ett företag i Indien som hyr ut jordbruksutrustning, och experimentet omfattar 7100 bönder i 190 byar i delstaten Karnataka. Bönderna fick vara med i ett lotteri där de kunde vinna pengar till hyrning, i en omfattning som skulle täcka 1/3 av arbetstimmarna i jordbrukssäsongen. Det är småbrukare vi talar om: median-gårdsstorleken är 2 acres (ungefär 1 hektar), och medelvärdet 3,3 acres. Bönderna odlar mest ris, bomull och majs.

 Bönderna som vann lotteriet var 30 procentenheter mer sannolika att hyra maskiner, vilket ökade mekaniseringen med 0,12 standardavvikelser. Mekaniseringen skedde helt och hållet i skedet när bönderna arbetar med jorden för att förbereda den för odling, alltså plogning och relaterat arbete. Detta minskade behovet av arbetare inte minst senare i processen, som kvinnors arbete med att rensa ogräs. (Den noggrannare plogningen minskar mängden ogräs.) Kvinnor påverkades alltså särskilt, och framför allt då daglönare under skörden, medan familjemedlemmars arbete frigjordes mer kontinuerligt över odlingssäsongen. Bönderna hade en starkt uppdelad arbetsfördelning, både mellan könen och mellan familjemedlemmar och anställda; 90 procent av det övervakande arbetet gjordes av män i familjen. Mekaniseringen ökade andelen anställdas arbete jämfört med familjemedlemmarnas, den frigjorde alltså tid inte minst för kvinnor i bondefamiljerna. Caunedo och Kala fann också en positiv effekt på bondefamiljernas inkomster, men effekten var svag.

Utöver experimentet i Indien så använder Caunedo och Kala också en strukturell modell. Hushållen har en mängd arbetskraft som beror på hur många de är i hushållet, och utöver det så väljer de att anställda folk om de behöver. Skuggpriset på hushållsmedlemmarnas tid beror på både hur många de är och ifall de också har en icke-jordbruks-aktivitet igång. Det övervakande arbetet görs av familjemedlemmar på grund av problem med moral hazard hos de anställda arbetarna. Resultaten av modellen säger att hushållens välfärd ökar med 7,6 procent av mekaniseringen, varav 1/3 beror på stigande inkomster, och 2/3 på ökad ledighet.

De säger att pappret relaterar till tre litteraturer. Ett, kausala belägg om mekaniseringens effekter, och vikten av att ha tillgång till hurmarknader. Kapitalintensitetens betydelse för produktiviteten i jordbruket har studerats i Caunedo och Keller (2021) och Chen (2020), men dessa har inte skattat elasticiteten för produktivitet mot mekanisering på mikronivå. Två, en litteratur om att kausalt skatta kapitalets marginalnytta i utvecklingsekonomier. Tre, studier av Acemoglu och Guerrieri (2008) och Alvaraz-Cuadrado et al (2017) har teoretiserat kapitalfördjupningens betydelse för jordbruket och strukturomvandlingen ut ur jordbruket, men inte studerat det empiriskt.


För mig är det intressant att tänka på det samtida indiska fallet i relation till svensk historia. Caunedo och Kala beräknar effekten av mekaniseringen på fyra sorters arbete: manliga familjearbetare, kvinnliga familjearbetare, manliga lönearbetare, och kvinnliga lönearbetare. Denna typ av uppdelning är nog rimlig också i en svensk kontext för sisådär hundra år sedan: vi hade en stor mängd obetalda familjearbetare i form av lantbrukarhustrur och lantbrukarnas hemmavarande vuxna barn, och detta fick inte betalt utan var en del av familjeekonomin, medan vi också hade en ganska stor grupp lönearbetare i jordbruket, framför allt på de större gårdarna. Excel-diagrammet som jag klistrat in ovan visar andelen som dessa två grupper, samt torpare och tjänare, utgjorde av alla sysselsatta vart tionde år 1870-1950. Vi ser att gruppen lönearbetare i jordbruket minskar från 14-16 procent 1870 och 1880 till runt 8 procent 1900-1950, medan gruppen familjearbetare minskar från 11-12 procent 1870 och 1890 till bara 4 procent år 1940. Det är alltså en omfattande minskning, samtidigt som en mekanisering av jordbruket pågår.

 
antal hästar och traktorer i svenskt jordbruk åren 1930-1980, från Harald A:son Moberg, Jordbruksmekanisering i Sverige under tre sekel (Stockholm, 1989)


 

referens

Julieta Caunedo och Namrata Kala (2022) "Mechanizing Agriculture", NBER Working Paper 29061, juli 2022 (reviderad version).

torsdag 14 november 2024

Jordbrukets utveckling och den ekonomiska tillväxten

 
illustration från Carl Johan Gadds bok Den agrara revolutionen, kapitel 26, 
"Jordbrukets begynnande mekanisering". Fritt tillgänglig här.
 

När jag undervisar om Sveriges ekonomiska historia så brukar jag föreläsa om den agrara revolutionen ca 1720-1850, när Sverige bröt sig ur den malthusianska fällan och befolkningen kunde öka (faktiskt fördubblas på 100 år) utan att den genomsnittliga levnadsstandarden försämrades. Jag säger då, med stöd i läroböcker bland annat av Lars Magnusson (Sveriges ekonomiska historia, 1996) och Carl-Johan Gadd (Den agrara revolutionen, 2001) att den agrara revolutionen var en förutsättning för industrialiseringen, som för dagens svenskar är mer omedelbart uppenbart intressant. Jag stöttar mig då bland annat på detta uttalande av Gadd:

"Västeuropas agrara revolution på 1700- och 1800-talen var viktig, bland annat då den var en förutsättning för industrialiseringen. Den allt högre produktiviteten inom jordbruket gjorde det möjligt att förse övriga samhällssektorer med livsmedel och arbetskraft. Delar av jordbrukarbefolkningen blev tämligen välbärgad och kunde utgöra en marknad för industriprodukter. Med ökad massproduktion inom industrin och därmed billigare industrivaror, drogs med tiden även de fattigare skikten av jordbrukarbefolkningen in i marknadsutbytet." (Gadd, Den agrara revolutionen, s. 12)

Ur det svenska ekonomisk-historiska perspektivet är det ganska självklart att den agrara utvecklingen är central för den industriella utvecklingen: genom att öka produktiviteten frigörs arbetskraft som blir tillgänglig för industrin, och när inkomsterna för bönder och andra i jordbruket stiger, växer marknaden för industriellt tillverkade varor.

 


Hos utvecklingsekonomerna är relationen mellan jordbrukets produktivitet och den ekonomiska utvecklingen mer av en öppen fråga. Detta snappar jag upp från Douglas Gollins introduktionskapitel "Agricultural Productivity and Economic Growth" i Handbook of Agricultural Economics, volym 4. Gollin lär mig om det "agro-pessimistiska" perspektivet som ser jordbruket som en sektor med låg produktivitet, som man inte ska satsa på; under vissa antaganden så är jordbrukstillväxt negativt för den ekonomiska tillväxten. Hur kan detta vara?

Gollins diskussion börjar med övergripande fakta. I hela världen är det ungefär 40 procent av de anställda som arbetar i jordbruket, och i fattiga länder är andelen högre, 65 procent i de länder som FN klassificerar som "least developed". (Om man ser separat på kvinnor så är andelen ännu högre.) Sett till andel av BNP så står jordbruket i många utvecklingsekonomier för 25-30 procent av BNP, och i en del fattiga länder i Afrika och Sydasien för mer än 40 procent. Både jordbrukets andel av sysselsättningen och av BNP är starkt negativt korrelerad med BNP per capita; diagrammet som jag klistrat in ovan illustrerar den förstnämnda av de två korrelationerna. Diagrammet ovan bygger på ett tvärsnitt av länder runt år 2000, men korrelationen håller också om man istället kollar på tidsserier från dagens rika länder. 

Att jordbrukets andel av sysselsättningen är så mycket större än andelen av BNP påvisar att produktiviteten är lägre i jordbruket än i den övriga ekonomin, och Gollin illustrerar detta vidare genom att jobba med makrodatat. Det är osannolikt att skillnaden beror på mätfel; levnadsstandarden i utvecklingsekonomier är typiskt lägre på landsbygden än i städerna, vilket syns i hushållssurveys såväl som antroprometriska studier av hälsotillstånd. (s. 3835) Däremot kan den lägre produktiviteten i jordbruket teoretiskt bero på en särskilt lågutbildad arbetskraft där, eller att företag i jordbruket är särskilt illa styrda, eller att klimatet arbetar emot jordbruket i fattiga länder.

Utöver produktiveten i sig är ett annat skäl att intressera sig för jordbruket, säger Gollin, att jordbruket helt enkelt står för befolkningens mat. Få utvecklingsekonomier, säger han, importerar mer än 10 procent av sina kalorier; i Uganda är andelen bara 2 procent. (s. 3835) [1] Den relativt lågproduktiva produktionen i jordbruket och importens lilla roll innebär att mat är dyrt i utvecklingsekonomier, och reallönen låg; arbetarna lägger en stor del av sina inkomster på mat. Utifrån dessa olika presenterade fakta konstaterar Gollin att:

"In a proximate sense, it is clear that a major cause of low incomes and slow growth in the developing world is the low level and the slow growth of agricultural productivity. This does not necessarily imply that agriculture should be targeted for remedial investments; after all, perhaps a better strategy is to import larger quantities of food or even to provide food aid on a more systematic basis. But it appears essential to look at developing economies in ways that disaggregate by sector." (s. 3836)

Specifikt så ställer situationen några frågor: "Why are so many people in the developing world “stuck” in the subsistence agricultural sector, using little improved technology and essentially unable to benefit from the division of labor? Given the income and productivity differences across sectors, why do we not observe more people migrating out of subsistence agriculture and moving to cities?" (s. 3837)

Denna idéhistoriska och analytiska bakgrund ger han till frågorna:

"As early as Adam Smith, economists recognized that economic growth is accompanied by a sectoral transformation that leads to the movement of labor and other resources out of agriculture and into other activities.4 The nature of this transition—and the direction of causation—have attracted much discussion and generated a surprising degree of controversy. For example, economic historians have debated whether or not agricultural productivity improvements preceded the Industrial Revolution, and development economists have argued over whether foreign assistance should give priority to agricultural development or industrial development. The stylized facts, however, are not in dispute. Kuznets (1966) initially documented the nature of the structural transformation in both time-series and cross-section data; other early empirical work includes Chenery and Syrquin (1975), Syrquin (1988), and similar studies that documented patterns of sectoral change within and across countries." (s. 3837)
Den tidiga utvecklingsekonomiska litteraturen, säger Gollin, gav två konkurrerande perspektiv på jordbrukets roll i utvecklingen. Lewis, Rosenstein-Rodan (1943) och Rostow såg den moderna ekonomiska tillväxten som ett resutltat av industrialiseringen. I detta rätt negativa perspektiv -- förutom Lewis (1955) så refererar Gollin till Fei och Ranis (1964) -- sågs "subsistence agriculture as a default source of employment and as a pool of reserve labor." (s. 3838) 

Det andra perspektivet var att likt TW Schultz (1953) se på "the food problem" som att många fattiga länder är i en situation av "high food drain", där inkomstnivån är så låg att en stor mängd av hushållsutgifterna går åt till mat, vilket gör att hushållen inte kan köpa särskilt mycket industrivaror. Schultz fick inflytande över en stor utvecklingslitteratur "which held that an agricultural surplus is a necessary condition for a country to begin the development process"; Gollin referaar här Johnston och Mellor (1961), Johnston (1970), Johnston och Kilby (1975) med flera. I denna diskussion utvecklades den så kallade Mellor-hypotesen, " a narrative model that outlined a set of general equilibrium impacts that were claimed to result from agricultural productivity growth": förbättrad levnadsstandard för bönderna och de fattiga på landsbygden, fallande matpriser, sänkta nominallöner i takt med priserna vilket ger sjunkande kostnader, ökad inhemsk efterfrågan på industrivaror, och ökad konkurrenskraft. Mellor (1995, 1996) har presenterat ramverket utförligt, men inte formaliserat modellen, menar Gollin.

På 1990-talet kom en stor litteratur med två-sektor-modeller. Bland dessa fanns en rad studier specifikt av strukturomvandlingen (Echevarira 1995, 1997; Kogel och Prskawetz 2001; osv). Andra har uttryckligen testat Harris och Todaros (1970) dualismmodell med arbetslöshet (Temple 2005, Vollrath 2004, 2008) eller med andra rigiditeter som hindrar marknaden från att cleara (Caselli och Coleman 2001). Enligt dessa modeller blir en viktig policyrekommendation att få bort rigiditeter som förhindrar strukturomvandlingen, alltså överföringen av arbetare och kapital från jordbruk till andra sektorer. 

En annan uppsättning tillväxtpapers, säger Gollin och refererar bl.a. till egna artiklar (2002, 2007), följer Schultz i att fokusera på att fattiga länder hindras i sin tillväxt process av att de måste binda upp en så stor del av arbetskraften och andra resurser i att producera mat: "These papers show that the transition to modern “Solow”-type growth can be slowed dramatically when countries must feed themselves." (s. 3846. Detta är ju för övrigt helt förenligt med Gadds och andra svenska historikers perspektiv på den agrara revolutionen i Sverige.) Helt i enlighet med Schultz (1964) argumenterar dessa papers för att en stor ökning av jordbruksproduktiviteten kan ha stora positiva effekter på den ekonomiska utvecklingen; Gollin presenterar i sitt kapitel en modell över detta från Gollin, Parente och Rogerson (2002, AER P & P). I dessa modeller antar man en stängd ekonomi, där det alltså inte importeras mat utan ekonomin måste vara självförsörjande på mat. Matsuyama (1992) arbetar istället med en öppen ekonomi-modell med två sektorer, jordbruk och industri, och där ett land som koncentrerar sig på jordbruket kan utveckla en konkurrensfördel där, och så fastna i en sektor med låg potential för teknologiska framsteg, vilket på sikt blir en tillväxtfälla. Motsvarande så modellerar Hansen och Prescott ("Malthus to Solow", AER, 2002) en ekonomi med bara en sektor och visar hur ekonomin med högre produktivitet i "den traditionella sektorn", jordbruket, kan få en försenad övergång till en modern Solow-ekonomi och Solow-tillväxt.

Från dessa konkurrerande teoretiska modeller övergår Gollin till empiriska studier av konsekvenserna av jordbruksomvandling. Dessa har lidit av svårigheter att hitta en riktigt bra kausal design, säger han. Man har kanske studerat ett land som importerat en viss jordbruksteknik som fått stor effekt, och jämfört med länder som inte importerade tekniken samtidigt. Men då har man ju problemet med att landet som importerar tekniken skiljer sig åt från de andra länderna också på andra sätt. Gollin är inte heller övertygad av den sorts argument som jag använder när jag undervisar om den agrara revolutionen i Sverige:

"Supporters of agricultural development generally look at successful countries and argue that they have almost all experienced significant agricultural development. This is a specious argument. Almost by definition, any country that has developed has undergone a structural transformation that involves some growth in the agricultural sector. As a result, these countries appear to show a positive relationship between agricultural development and growth; but this relationship could be spurious." (s. 3848)

Här säger han i och för sig ingenting om ifall dessa "supporters" anger några kausala mekanismer, det gör ju Gadd, Magnusson och andra ekonomisk-historiker som jag bygger min undervisning i frågan på. Det verkar vara en enklare korrelations-slutsatsdragning som han opponerar sig emot, också när han refererar motståndare till jordbruksfokus som pekar på länder särskilt i Afrika söder om Sahara som satsat på jordbruksutveckling och inte fått några stora tillväxteffekter. (3849)

Från enkla före-och-efter-jämförelser går han över till studier som använder regressionsanalyser för en uppsättning länder, i tvärsnitt eller paneldata. På 1990-talet och 2000-talets första decennium kom det ett par sådana studier, som visar att BNP-tillväxten är positivt korrelerad med utvecklingen i jordbruket, men det är förstås regressioner som lider av endogenitetsproblem. Humphries och Knowles (1998) avänder därför klimatvariabler som förväntas påverka jordbruket, men inte andra sektorer, som instrumentvariabler för jordbruksutvecklingen och skattar också då en positiv "effekt" av jordbrukets utveckling. En annan approach har varit att använda Grangerkausalitetsmodeller för att utläsa effekten av jordbruket på den övriga ekonomin. Vanligare är att studera effekten av jordbrukets produktivitet på minskningar av graden fattigdom, som Datt och Ravaillon (1996), Thirtle et al (2001), Irz et al (2002) med flera studier. De flesta av dessa studier menar att jordbrukets utveckling har större positiv effektivitet på fattigdomsminskningen än vad andra ekonomiska variabler har; Mellor (2000, "Faster more equitable growth: The relation between growth in agriculture and poverty reduction", CAER II Discussion Paper) uttrycker denna hållning allra kraftigast, och karaktäriserades av Hasan och Quibria (2004) som "agricultural fundamentalism". Gollin sammanfattar den empiriska litteraturen baserad på regressioner som att den överlag stöttar idén att jordbruket är centralt för den ekonomiska utvecklingen, men att studierna metodologiskt inte är stringenta nog.

Från detta vänder han sig till en litteratur som använder en ganska annorlunda metod, growth accounting i Solows (1957) tradition. Jag är väldigt intresserad av denna litteratur och citerar därför långt: 

"Several papers in this literature argue that productivity growth has been higher in agriculture than in manufacturing. This result was obtained in Jorgenson, Gollop, and Fraumeni for the U.S. time series (1987) and Jorgenson and Gollop (1992); Jorgenson and Stiroh (2000) found a similar result for a more recent data period, with agriculture among the sectors with the highest TFP growth. Mundlak (2005) similarly finds that TFP growth accounts for essentially all of agriculture’s productivity growth in the period 1940–90 in the US.

Looking at a broader set of countries, including a number of developing countries, Martin and Mitra (2001) find that TFP growth in agriculture exceeds that in manufacturing. Bernard and Jones (1996) find that agricultural TFP growth is higher than nonagricultural TFP growth in a sample of 14 OECD countries for the period from 1970–1987.

In a recent study focusing on two rapidly growing large economies, Bosworth and Collins (2008) find that agricultural TFP growth has been a major source of economic growth for both India and China during the past 25 years, though not so important as industrial growth in China or growth in services in India. This study also notes the important role that has been played in both countries by sectoral reallocations of labor out of (low productivity) agriculture into higher productivity industry and services. The results of this paper are echoed to a large extent in Gulati et al. (2005), who find that China’s growth was heavily influenced by agricultural reforms, with strong accompanying effects on poverty reduction. Gulati and his coauthors argue that China has been more successful than India at reducing the poverty headcount, and they attribute this performance to the agricultural roots of Chinese reforms." (s. 3851)

Detta är ju superintressant! Gollin säger att det visserligen är en välkänd begränsning för growth accounting-litteraturen att den bara kan ange proximate orsaker till tillväxt: ökade faktorinputs (arbete, jord, kapital) eller totalfaktorproduktiviteten. Men ändå! En mer problematisk punkt är att tillväxtbokföringen kan missta verkan för orsak om en dynamisk sektor lockar arbetskraft ur den mindre produktiva sektorn, som då får högre arbetsproduktivitet genom större kapitalintensitet: då är orsakssambandet ju att sektor X påverkat sektor Y, men utfallet blir högre produktivitet i sektor Y. (Landon-Lane och Robertson 2003.)

En utveckling av denna litteratur är development accounting, eller levels accounting, som använder metoder från tillväxtbokföringen men också vill ta in skillnader mellan länder. Denna litteratur började med Klenow och Rodríguez-Clare (1997) och Hall och Jones (1999), med ensektormodeller, men från och emd Caselli (2005) i Handbook of Economic Growth så infördes också multisektormodeller, och Caselli fann att produktivitetsskillnader i just jordbruket var en mycket viktig orsak till skillnader i medelinkomst mellan fattiga och rika länder. Cordoba och Ripoll (2007) invände och menade att en stor del av skillnaden i output mellan sektorer förklaras av att urbana arbetare har mer humankapital, så är mer produktiva, än arbetare i den rurala sektorn. Restuccia, Yang och Zhu (2008) fortsatte på denna debatten och hävdade, med ett bygge på "business cycle accounting", att inputvaror i jordbruket -- jag antar att det är maskiner och så -- tenderar att vara relativt dyra i fattiga länder, vilket gör att de inte används så mycket, och att en alltför stor del av arbetskraften allokeras till jordbruket, vilket tyder på något slags rigiditeter som hejdar arbetskraftens rörlighet till mer produktiva sektorer. En rad forskare har fortsatt på diskussionerna om felallokering av arbetskraft, t ex Vollrath (2009) om "dual economy effects".

En annorlunda approach är att använda allmänna jämviktsmodeller, computable general equilibrium models. [2] En standard CGE-modell för jordbruket presenteras i ett working paper från FN-affilierade The International Food Policy Research Institute skrivet av Hans Löfgren, Rebecca Lee Harris och Sherman Robinson. Så här diskuterar Gollin för- och nackdelarna med denna approach:

"Models of this kind offer the advantages of clean causal identification—at least relative to the econometric approaches described earlier. However, CGE models depend fundamentally on the underlying elasticity estimates, functional specifications, and coefficients. For this reason, their results are sometimes accused of lacking transparency. Nevertheless, a number of CGE models have been developed that offer the best available estimates of specific productivity improvements—for example, for the introduction of improved sweet potatoes in Uganda." (s. 3854)
Ännu en inriktning i forskningen är mer historisk, och handlar om frågan som jag började blogginlägget med: jordbrukets betydelse eller ej för den industriella revolutionen i Europa. Crafts (1985) citeras som exempel på en analys som sätter just den förbättrade jordbruksproduktiviteten före den industriella revolutionen och menar att sambandet är kausalt; Gollin tar också upp Bezemer och Headeys artikel i World Development 2008 som exempel. Det motsatta perspektivet säger att Storbritannien inte hade särskilt hög produktivitet i jordbruket på 1700-talet, jämfört med övriga Europa, och att utvecklingen i jordbruket därför inte kan förklara varför den industriella revolutionen började just i Storbritannien. Dercon (2009) presenterar detta perspektiv, som bygger på ekonomisk-historisk forskning bland annat av Allen (1999) och Clark (1998, 2002). Gollin motiverar historikens betydelse för nutida debatter så här:

"Although this debate focuses on events that took place several centuries ago, the implications for current thinking about agricultural development could be significant. If agricultural productivity growth was not an essential part of the Industrial Revolution, perhaps it is even less necessary for today’s developing economies, which after all have access to robust international markets for most agricultural goods." (s. 3856)

Han pekar dock på att det egentligen inte är någon av forskarna i den ekonomisk-historiska debatten som hävdar att jordbrukets produktivitet inte spelade någon roll alls för den industriella revolutionen. Frågan är bara hur mycket och när.

Från dessa diskussioner går Gollin över till diskussionen om "agro-pessimismen", alltså hållningen att jordbruket kanske inte var så avgörande. Alice Amsden (1989) hävdar till exempel att Korea industrialiserades utan någon föregående jordbruksrevolution, och motsvarande argument har gjorts också i Kina, eller i vilket fall att jordbruket bara spelade en mindre roll, tidigt i tillväxtprocessen. Dercon (2009) menar att kausaliteen kan vara omvänd (lite som i Allens analys i Enclosure and the Yeoman): det är den ekonomiska tillväxten i andra sektorer som effektiviserar jordbruket, inte tvärtom. Att stötta det småskaliga jordbruket kan vara att stötta den mest produktiva sektorn i hela ekonomin, säger Dercon: det är bättre att främja de mer specialiserade och produktiva exportsektorerna istället. Åtminstone för länder med kust och hamnar menar han att import av mat, och intern migration från landsbygden till städerna, är ett fullgott alternativ till att satsa på det inhemska jordbruket. Detta stämmer också överens med Paul Colliers (2008) argument att biståndspolitiken delvis präglats av en "romantisk populism" som har ett rosigt perspektiv på småskaligt jordbruk, ett perspektiv som leder fel.

För att sätta ihop debatten mellan Mellor-hypotesen och agro-pessimismen lägger Gollin fram en enkel modell (en "heuristic device"), baserad på Gollin och Rogerson (2009). Varje individ i ekonomin har en smak för två sorts varor:

u(a-ã) + v (m + ~m)

där u är smaken för jordbruksvaror och v den för industrivaror. Både u och v är positiva värden, liksom ã och ~m. Detta gör att inkomstelasticiteten för jordbruksvaror är <1 och den för industrivaror >1. Industrivaran produceras:

m = A_m * n_m

där n_m är antal arbetare i industrin. Jordbruksvaran produceras:

a = A_a * L^θ * n_a^1-θ

där n_a är mängden arbetare i jordbruket och L är jorden.

Ekonomin producerar tillräckligt mycket a så att varje konsument har åtminstone _a. "We assume that land ownership is equally distributed across the population." Det optimala mängden arbetare i jordbruket är:

n_a = [ _a / A_a ]^1/(1-θ)

Gollin förklarar:

"The key implication of this model is that in a closed economy in which food is a necessity, there is a powerful negative relationship between agricultural TFP and employment in agriculture. In particular, a 1% decrease in agricultural TFP A_a will lead to an even larger percentage increase in employment in agriculture, equal to 1/1(1-θ)." (s. 3859)
Modellen driver hem en enkel men viktig poäng: andelen anställda i jordbruket, och jordbrukets arbetsproduktivitet, kommer vara starkt negativt korrelerade, så länge inte det är en öppen ekonomi med ett viktigt inslag av export av jordbruksvaror. Förutsättningarna för handel, t ex infrastrukturen och transportkostnaderna, kommer alltså också vara viktiga. Detta visar att det agro-pessimistiska argumentet har en poäng förutsatt att landet är en öppen ekonomi med kapacitet att importera tillräckligt mycket mat för att försörja en befolkning som arbetar utanför jordbruket. (s. 3860) Här kan vi väl konstatera, om man går tillbaka till fallet Sverige ca 1750-1850, att de förutsättningarna helt enkelt inte fanns då, eftersom det inte fanns någon stort utbud av mat att importera. Däremot kan importen till exempel av billigt kanadensiskt bacon och av spannmål från Ryssland, Kanada och USA absolut ha spelat en roll för industrialiseringsprocessen ca 1880-1914. Gollin säger också i sina slutsatser att agro-pessimismen helt enkelt inte kan vara relevant för alla u-länder idag, inte till exempel för Kongo där den inhemska matproduktionen kommer fortsätta vara viktig. Det sista Gollin säger i översiktsartikeln är att jordbruket kommer fortsätta vara viktigt för utvecklingsekonomin, och att det också för med sig en särskild roll för staten eftersom både växtförädling och transportinfrastruktur är verksamheter av public goods-karaktär, där den samhälleliga avkastningen är större än den privata, och som alltså kräver offentliga investeringar.

Utifrån Gollins översiktskapitel så tänker jag att jag med gott samvete kan fortsätta berätta för studenterna om hur nödvändig den agrara revolutionen var för Sveriges industrialisering. På den tiden fanns inte möjligheten att exportera mat i tillräckligt hög grad för att försörja befolkningen, så för att möjliggöra arbetsdelningen som industrialiseringen innebär, var en kraftigt expanderad jordbruksproduktivitet nödvändig.


referenser

Douglas Gollin (2010), "Agricultural Productivity and Economic Growth", i Handbook of Agricultural Economics, Volume 4, red. Prabhu Pingali och Robert Evenson. Amsterdam: Elsevier.

fotnoter

[1] Här blir jag lite förvånad, bara för att när Rysslands krig i Ukraina började så varnades det en del för att det fanns fattiga länder i Afrika som var beroende av import av ukrainskt vete, och att utbudschocken orsakad av kriget skulle orsaka stora prisökningar och kanske t o m svält i länder som Tanzania. Jag hittar också en studie från Kiel-institutet från förra året som säger ungefär det: importerna är ganska små överlag, men koncentrerade till viktiga varor som spannmål, och därför kan kriget ändå ha stora effekter på konsumenter i Afrika söder om Sahara.

[2] Här hänvisar Gollin också till Handbook of Agricultural Economics vol 2a, sektion 4. Där finns relevanta kapitel av Thomas W. Hertel, Maurice Schiff och Alberto Valdés, Pier Giorgio Ardeni och John Freebairn, och av C. Peter Timmer.