söndag 23 februari 2025

Ogilvie om ekonomiska institutioner i förindustriella Europa

Samhälleliga institutioner -- definierade av Nobelpristagaren Douglass North som "the rules of the game in a society or, more formally . . . the humanly devised constraints that shape human interaction’" -- är sedan fyra decennier eller så centrala beståndsdelar i den nationalekonomiska och ekonomisk-historiska instituioner. Det tydligaste belägget för detta är kanske att först North, 1991, och sedan Acemoglu-Johnson-Robinson, 2024, tilldelades Riksbankens pris till Nobels minne för sina institutionella analyser av ekonomisk utveckling.

Ekonomisk-historikern Sheilagh Ogilvie, då i Cambridge, nu i Oxford, höll 2006 års Tawney Lecture på den årliga Economic History Society-konferensen på temat ekonomiska institutioner. Hon välkomnade de institutionella perspektiven och institutionella förklaringarnas uppsving, men varnade för att ekonomernas förklaring i nästa led, av varför institutionerna blir som de blir, var bristfälliga. Mer specifikt så formulerade hon sin varning så här: "The dead end I find most worrying is the tendency to explain institutions as an efficient and beneficial response to the needs of the economy—the view that ‘whatever is, is right’." (s. 651) [1] [2]

Den första förindustriella institutionen som tolkades på detta sätt av nationalekonomer, säger Ogilvie, varr träldomen. Douglass North och hans medförfattare Robert Paul Thomas hävdade i deras epokgörande bok The Rise of the Western World (1973), en del av 1970-talets kliometriska revolution som förenade nationalekonomisk teori och metod med historiska material, att träldomen var ‘an efficient solution to the existing problems’ i medeltida ekonomier—ett frivilligt kontrakt mellan bönder och godsherrar, där bönderna erbjöd sitt arbete i utbyte för ‘the public good of protection and justice’. (cit. 653) I North och Thomas analys var detta ett effektivt kontrakt med den relation mellan tillgång på arbete och tillgång på jord som rådde då, men att när denna relation förändrades, var träldomen inte längre en effektiv institution, och försvann. [3]

Den andra stora förindustriella institutionen som omtolkades var bygemenskapen. Här var det kliometrikern Deirdre McCloskey som 1976 argumenterade att den medeltida byn och dess tegskifte var en effektiv institution för att sprida riskerna mellan byns alla medlemmar: när var och en hade en mängd små plättar på olika ställen i byn, stod man inte och föll med en viss del av byn och dess mikroklimat, jord, etc. [4]

Den tredje institutionen som omtolkades var hantverksgillena. Här handlar det om tolkningar som pekar på hur skråna t ex kunde lindre informationsassymmetrier mellan producenter och konsumenter om produktkvlaiteten, eller att skråna på andra sätt minskade transaktionskostnaderna. "Epstein pointed out many weaknesses in these other theories, but claimed that craft guilds ‘prospered for more than half a millennium’ because they were the cost-minimizing institution ‘to allocate skilled labour efficiently’ and ‘provide an ideal market structure for innovation’." (s. 654)

Den fjärde institutionen är arrangemang som köpmansgillen som var till för att hantera handel. "Thus Greif, Milgrom, and Weingast argued that merchant guilds, by threatening collective boycotts of rulers who failed to provide commercial security, sustained ‘the efficient level of trade’ from the twelfth to the fifteenth century.27 Separately, Greif also concluded that merchant guilds ‘enhanced efficiency by supporting inter-community impersonal exchange’ through what he termed the ‘community responsibility system." (s. 654)

Ogilvie pekar på en rad andra, mindre viktiga institutioner -- inklusive lynchjustis! -- som ekonomer och ekonomisk-historiker idag har tolkat som uttryck för effektivitet "So by now economic historians have reinterpreted pretty well every pre-modern institution in terms of efficiency as a beneficial solution to one or more obstacles to possible transactions." (s. 655)


Referens

Sheilagh Ogilvie (2007) "‘Whatever is, is right’? Economic institutions in pre-industrial Europe", Economic History Review, 60, 4 (2007), pp. 649–684

Fotnoter

[1] Citatet ‘whatever is, is right’ kommer från Alexander Popes "Essay on Man" från 1732.

[2] Det här, det som Ogilvie kritiserar, kan man väl kalla en funktionalistisk approach till institutioner. Se Pierson (2004, Politics in Time), kapitel 4, särskilt s. 122-124, för en analys från statsvetenskapen om problemen med nationalekonomers funktionalistiska förklaringar av institutionella förhållanden, och särskilt skillnaden mellan snävt ekonomiska institutioner med tydligare avkastning och mer avgränsade syften, och mer komplexa samhälleliga och politiska institutioner vilkas plasticitet är betydligt mindre.

[3] Ogilvie menar att effektivitetsanalysen av träldomen lever kvar i 90-00-talens revisionistiska perspektiv på den "andra träldomen" öster om Elbe, som i WW Hagens Ordinary Prussians: Brandenburg Junkers and Villages 1500-1840 (Cambridge UP, 2002). 

[4] Ogilvie pekar på att McCloskeys analys 1993 fick stöd av Townsend i MEdieval Village Economy, och att Richardson, "Prudent village", och Nafziger i sina studier av Ryssland också stöttat den.

torsdag 6 februari 2025

Antikens ekonomi och antikens kliometri

 
en gallisk-romersk relief som avbildar skördearbete 
 

Vad vet ekonomisk-historiker om Antikens Rom? Och hur vet de det? Vad för källor, metoder och teorier använder historiker och andra för att kartlägga antikens ekonomier? Arkeologen och klassicisten Kim Bowes från University of Pennsylvania har en superintressant artikel om detta i tidskriften Capitalism: A Journal of History and Economics från år 2021. Artikeltiteln är "When Kuznets Went to Rome" och utgångspunkten är ett skifte på detta fält, under 1990-talet, från en mer substantivistisk, antropologisk approach till antikens ekonomier, till en mer nationalekonomisk eller kliometrisk approach. 

Tidigare, säger hon, dominerades fältet av substantivistiska analysmodeller som de som Moses Finley (1912-1986), lärare och professor i Cambridge 1956-1982, arbetade med. Finley menade att man inte ska använda moderna nationalekonomiska begrepp för att förklara antikens ekonomi, eftersom antikens människor saknade sådana begrepp själva -- de saknade för den delen också begreppet "ekonomi" i dagens bemärkelse, som en avskild samhällssfär. Så här sammanfattar Wikipedia perspektivet som Finley lägger fram i sin klassiska bok The Ancient Economy från 1973:

"Finley interpreted the economy from 1000 BC to AD 500 sociologically rather than through use of economic models (as did Michael Rostovtzeff). Finley viewed the ancient economy as largely a by-product of status, with economic relations being embedded in ancient institutions that are very much unlike those present in modern times.

He viewed the ancient economy as largely stagnant since, among other things, the scope of economic action was not directed to economic or productive growth as is so often the case in modern times: technological innovations therefore went without adoption, large projects were executed for prestige rather than practical benefit, and economic development, or profit maximisation. Such views, and the uncritical acceptance of elite ancient writers' economic mentalités, have been challenged and overturned by archaeological discoveries through the late 20th century."

Detta är verkligen ett klassiskt substantivistiskt perspektiv: att hävda att det -- kontra nationalekonomi 101 -- inte finns någon universell mikroekonomi av nyttomaximerande individer i olika samhällen över tid och rum, utan istället att varje typ av samhälle har sin egen mikroekonomi, ungefär. [1] Jag tror att den teoretiker som mest av allt associeras med perspektivet är den ekonomiske antropologen Karl Polanyi, och det är också slående att Finleys Ancient Economy publiceras samma år som antropologen Marshall Sahlins mycket inflytelserika The Stone Age Economy, som lägger fram en egen tolkning av stenålderns nationalekonomi.

Men detta perspektiv vände sig alltså en del antikhistoriker ifrån på 1990-talet och 2000-talet, säger Bowes: hon pekar på Walter Scheidel och Sitta von Redens antologi The Ancient Economy (2002) och Scheidel, Ian Morris och Richard Sallers Cambridge Economic History of the Greco-Roman World (2007). I denna forskning ställer man frågor om "BNP per capita" i Antikens Rom, om produktivitet, tillväxt och inkomstfördelning; forskningen relaterar till bredare, icke-antika projekt som Angus Maddisons forskning om BNP i historien och Branko Milanovics forskning om inkomstfördelning. Så här kontextualiserar Bowes den kliometriska breddningen:

"The 2008 financial crisis, growing concerns about long-term inequality, and a sense that non-state, non-elite economic actors might also merit a place in Rome’s economic history have all put these calculations on a broader stage, both in the field of Roman economic history and beyond. Estimates of Roman GDP or Gini coefficients for income in equality have been applied to subjects as varied as Roman slave demographics, the economic well-being of Roman artisans, and Piketty’s models for long-term capital distribution." (s. 9)
Jag läser det som att Bowes omfamnar den ämnesmässiga breddningen, men är kritisk till den kliometriska metodologin:

"Historians and economists alike have rushed to calculate Roman GDP and place it on a graph with  those of other pre-modern economies, using the resulting numbers to make sweeping assessments about progress or its absence, or to affirm a natural, historical law driving wealth inequality. In the process, the calculations used to estimate Roman GDP or inequality have seen very  little criticism. In particular, the efforts’ calculative heuristics, the imputed relationship between macroeconomic measurements and economic well-being, and their assumptions about the very nature of history all have yet to be properly interrogated. While some of this work on GDP has had the salutatory effect of making the Roman world relevant and accessible, the data that has been used to do so is largely a fiction, and the resultant histories, stripped of nuance and complexity, are rendered into Kuznets’s worst nightmare—simplistic teleologies of growth or stagnation." (s. 9)
Bowes essä ägnas åt en ingående kritisk granskning av just dessa metodologier och data, och vad för slutsatser de egentligen leder till i fråga om antika Roms historia och samhälle. 

 
ekvation ur Keith Hopkins artikel "Taxes and Trade in the Roman Empire" från 1980
 

Framför allt så handlar det om hur forskare beräknat BNP per capita, och hur de beräknat inkomstfördelningen. De första beräkningarna av romersk BNP gjordes av Keith Hopkins år 1980, och de var då en bi-effekt av hans egentliga syfte, som avar att illustrera relationen mellan beskattning och ekonomiska flöden. Han beräknade romersk BNP helt enkelt som befolkningen gånger en beräknad vetekonsumtion gånger priset på vete. Resultatet var 8244 miljoner sesterces (förkortas av Bowes som HS), enligt Hopkins själv snarast en metafor, men taget på allvar av senare forskare.

Senare skattningar av romersk BNP har snarare haft intresset att jämföra levnadsstandarden i Rom med den i andra delar av världen och senare tider. Dessa moderna historiker och ekonomer har jobbat lite väl galant med källorna, menar Bowes; hon betonar att källäget egentligen är sparsmakat och problematiskt:

"What exists instead are a very  limited range of wheat prices (some thirty, ranging from the second century BCE through the early third century CE) and wage series (some sixty, ranging from the second century BCE through the early third century CE), the vast majority and most reliable of which come from Roman Egypt, along with a handful of literary references to slave and army rations. As has been noted by the scholars most attentive to the limitations of these data, most of these data points are circumscribed by particular contextual exigencies: Roman Egypt may or may not be representative of the rest of the Roman world; the limited wage and wheat price series may be affected by instances of short-term scarcity that make averages problematic; the data from the capital city is almost certainly biased by price-setting for wheat and by high costs of living for wages, and so on. Literary sources in which price is a signal aspect of the rhetorical toolkit are hard to lay next to papyri that record wheat and wage prices in unemotional but locally framed contexts. And the Roman population headcount is hotly debated, with estimates differing by an order of magnitude." (s. 12)

Hon säger att det är ekonomer som har "kört bilen" medan historikerna, mer intresserade av kontext och källkritik, suttit i passagerarsätet. Beräkningar av BNP från utgiftssidan har således gjorts på ett väldigt pragmatiskt sätt, med data på vetepriser multiplicerat med ett antagande om hur mycket vete gemene man och kvinna konsumerade, för att få fram grund-levnadsstandarden. Antagandena om hur mycket man åt har tagits inte från faktiska uppskattningar av konsumtion, utan från ett antagande om hur många kalorier man behövde för att överleva, eller romerska ransoner för slavar och soldater, eller från uppgifter från bönder i Aten på 400-talet f Kr. [2] Ett annat sätt att beräkna BNP är från inkomstsidan, och då har forskare som Goldsmith (ROIW, 1984), Temin och Scheidel och Friesen (J of Roman Studies, 2009) använt t ex en löneuppgift för lågutbildade arbetare multiplicerat med antal arbetsdagar per år i ett modernt dataset, multiplicerat med en siffra för genomsnittlig sysselsättning i ett modernt dataset, plus icke-löneinkomster från olika källor. Många lantarbetare och bönder i antikens Rom hade förstås inte särskilt mycket penninglöner, och då kringgår forskarna detta problem genom att helt enkelt utgå från att löneserierna motsvarar en överlevnadsnivå (utan överskott) som också bönderna bör ha legat på. (s. 13-14) 

De resulterande BNP per capita-skattningarna varierar från 166 till 380 HS, vilket är fattigare än 1500-talets Europa och i de mer pessimistiska varianterna motsvarar moderna ekonomier som Uganda och Rwanda.

Beräkningarna har också använts för att skatta inkomstfördelningen. Flera forskare -- Goldsmith (1984), Milanovic, Lindert och Williamson (2011) -- har använt en approach där man börjar med att identifera ett par elitgrupper och beräkna en genomsnittlig inkomst per grupp. I det romerska fallet är de fyra elitgrupperna "senatorial elite, the equestrian or knight class, the decurion or town councilors", och övriga eliter. De har i detta fall gjort inkomstberäkningen per elitgrupp i två steg: först en beräkning av medelförmögenheten för gruppen, och sedan denna multiplicerad med 0,06 för att få fram en tänkt årlig inkomst med 6 procents avkastning på kapital. Resten av BNP fördelas därefter med en genomsnittlig inkomst för hela icke-eliten. 

 
från Scheidel och Friesens "The Size of the Economy and the Distribution 
of Income in the Roman Empire", Journal of Roman Studies, 2009

En alternativ approach används av Scheidel och Friesen som använder en Pareto-fördelning för att distribuera BNP inom eliten, de översta 3 procenten av befolkningen. De övriga 97 procenten delar de in i nio lika stora inkomstgrupper, för vilka de tilldelar inkomste utifrån två olika scenarios: ett "optimistiskt" och ett "pessimistiskt". De får fram att 90 procent av Roms befolkning levde på eller runt existensminimum, medan 6-12 procent levde på vad de definierar som en "respektabel" nivå. Den högsta 1,5 procentens andel av inkomsterna beräknar de till 15-25 procent. Gini-koefficienten blir 0,42 till 0,44, alltså i sig inte särskilt högt. (s. 15)

Från denna redogörelse går Bowes vidare till sin källkritiska och metodologiska kritik. Hon talar om hur kliometrikerna plockar upp några data här och några uppgifter där och sedan "smetar ut" (smear) dessa över flera decennier och olika regioner -- Grekland, Egypten, Italien...

"A limited number of contextually contingent price data, like wheat prices, are smeared—their chronological and geographic fixity stripped away so they can be effectively averaged to form the “wheat price” constant. This happens, too, with most of the data used for subsistence consumption constants. The repeated use of 175 kilograms of wheat per year per person as a precise subsistence amount actually derives from an attempt— itself full of assumptions and contingencies—to calculate the production and consumption levels of fourth-century BCE Athenian farmers. This very specific, and also very hypothetical, figure becomes untethered from the chora of ancient Athens and smeared over the whole of the ancient world to represent how the majority ate,—which is thus rendered fixed and unchanging. Just so, the slave wages recommended by Cato are part of a carefully composed literary effort to bridge the gap between the ideal of a peasant farmer and the reality of slave-run estates in which slaves are simply an extension of the master’s hand." (s. 16)

Det finns en mängd olika problem här: dels "smetandet", att låta Aten på 300-talet f Kr också stå för Italien eller Egypten 200 år senare, dels källorna i sig: tendenser så som Polybius syften när han skriver om den romerska armén, eller Catos egna syften med sin text, eller bristfällig information eller tolkning som när man fokuserar helt på vetet även om Cato också skriver om vin och fikon. Bowes säger dock att än värre än "smetandet" är vad hon kallar "data sucking", när man tar data från en kontext och applicerar dem på en helt annan kontext -- som att ta konsumtionsdata från 1900-talet och låta dem representera antikens Rom. Mer specifikt så kritiserar Bowes bland annat hur Walter Scheidel använder Robert Allens konsumtionskorg som baseras på kejsare Diocletianus prisedikt från tidiga 300-talet e Kr, och beräknar dess pris utifrån egyptiska priser från första till tredje århundradet e Kr. I denna korg ingår bland annat tvål och ljus, som inte användes i antikens Rom. Här menar Bowes också att  den avkontextualiserade användningen av data tenderar att reproducera tidigare resultat, eftersom man väljer data för en "fattig ekonomi" som saknar data, från en annan "fattig ekonomi", och sedan drar slutsatser om den datalösa "fattiga ekonomin", och kanske då helt enkelt komma fram till att den var fattig.

Detta hävdar hon också angående BNP-skattningarna som är en del av Angus Maddisons projekt: enligt Bowes var Maddison övertygad om att förindustriella ekonomier var lika varann och inte hade någon varaktig ekonomisk tillväxt, så data väljs för att reproducera denna bild, så att antikens Rom får ungefär samma BNP per capita som förmoderna Neapel eller Bysans under medeltiden. [3] Ett centralt antagande i denna process är det om konsumtionsnivån på existensminimum: en människa behöver en viss mängd kalorier för att överleva, och de förindustriella människorna antas i denna litteratur framför allt ha fått sina kalorier från spannmål. Om konsumtionen av spannmål är konstant i förindustriella ekonomier, och mat stod för 60-70 procent av konsumtionen, så förklarar detta mycket varför BNP/capita stagnerade enligt beräkningarna.

Löneserierna är mer reella än vad konsumtionsdatat är, säger hon, men fortfarande problematiska, inte minst genom antagandet om att många var löntagare i antikens Rom, vilket inte är fallet. (s. 20) Utöver att anta att många var löntagare, så kan man också, som Scheidel och Milanovic, anta att lönerna helt enkelt sattes utifrån existensminimum -- och då är man tillbaka på den föregående punkten. Här kritiserar hon särskilt Scheidel och Friesen (2009) för deras metod när de beräknar Roms BNP per capita och inkomstfördelning. [4]

Så här rundar Bowes av sin kritik om BNP, löner och ojämlikhet i antikens Rom, med en verklig bredsida:

"The purpose of this somewhat belabored critique is not to suggest that specific calculations of  either GDP or in equality for the Roman world arewrong, although they probably are. Rather, it is to suggest that  there is very little about them that is Roman. To counter stubborn data lacunae or apply a similar data yardstick to a broad range of economies—in short, motivated by the desire to compare rather than to actually measure— these authors’ various estimates for Roman GDP and the concomitant effort to measure inequality are largely predetermined by a reiterated and reinserted series of pre-modern data constants. In their attempt to place the Roman world, the Byzantine empire, and the French Ancien Régime on the same graph, these models are forced to resort to a kind of extreme economic formalism, assuming, in effect, that economic and cultural behaviors can be so completely dissociated that the latter might change while the former remain constant and thus allowing the scholar to infill Roman lacunae with data— for consumption, wage practices, price ratios, and wealth distribution—from other periods. The results may or may not resemble actual Roman economic well-being; in a way, that was never the  actual goal. The purpose of these calculations—all but Hopkins’s, at any rate— was to re- inscribe the Roman world into a pre-modern economic monolith, not to reveal anything about the exigencies of life experienced by the Roman majority." (s. 21-22)
Jag tycker nog att hon är lite orättvis, att kliometrikernas pragmatism med källor ändå är befogad när källäget är svårt, men det är inte desto mindre en intressant kritik. Hon menar också att kritiken tidigare uteblivit, eftersom antikhistoriens socialhistoriker -- källnära -- knappt läser vad Bowes kallar kliometriska "GDP boys". Därför har antikens kliometri, teknisk som den är, också kunnat användas i böcker med större genomslag, som Scheidels The Great Leveller (2017) eller Pikettys Capital in the 21st Century (2014). Så här karaktäriserar Bowes elegant hur Maddison och andra siffror från antiken används i Pikettys narrativ:

"While ideologically worlds apart, Piketty’s long- term capital project, when it extends its r>g model further backwards in time, not only depends upon Maddison’s numbers for the Roman and medieval worlds, but also uses them to hammer home the evitability of capital-driven inequality in slow-growth environments. For at the heart of Maddison’s and Piketty’s (and Milanovic’s) projects is a particular conception of modernity as a time when things happen—growth, exploding inequality—defined in opposition to a static, longue durée “pre-modernity” when nothing happens—glacial growth, “natural” inequality. In a way, the Roman-specific critiques I’ve laid out above anchor the origins of this presumed modern versus pre-modern binary, a binary that relies on manufactured data for
subsistence in order to create a metahistorical arc of extremely slow growth followed by modern progress or its opposite." (s. 23)
Från denna diskussion går hon vidare till hur BNP per capita-skattningarna använts i stora narrativ om den ekonomiska utvecklingen och specifikt om Roms roll i detta. Här menar Bowes att den antika kliometrin inkorporerats i nya stora narrativ om imperiernas uppgång och fall, en typ av historieskrivning som trillade ur modet på 1970-80-talen men som kommit tillbaka idag. [5] Bowes menar att detta är en mansdominerad forskningsgenre som går tillbaka till 1800-talets heroiska narrativ -- "It is telling, and important, that the Gibbon for our age is the rise and decline of economic development" -- men nu med diagram:

"Tellingly, quantitative data has taken the place of purple passages culled from primary sources. This data is displayed in carefully constructed graphs—for coin circulation, femur length, lead pollution, wheat prices, Lorenz curves—that make historical causation manifest through rising or falling numbers.  These graphs merit a study in themselves, so prominent have they become in these new histories and so layered in their never-stated generative assumptions about data correlation and historical causality. In them we can see quantitative demonstrations that the advent of Roman rule produced radical economic in equality from a plot of British  house sizes; that periods of Roman economic and political florescence can be directly read off changing lead levels in the Greenland ice sheet; that changes in human femur length document an increase in standards of living; or that differences in wheat prices reveal the economic devastation caused by plague in the late
empire." (s. 27; femur betyder lårben)

 Från detta går Bowes till sitt eget, mer positiva program för vägen framåt. Det hon vill ta med sig från den kliometriska revolutionen i den romersk-historiska forskningen är fokuset på vanligt folk, bortom eliterna, och användningen av kvantitativa data för att dra bredare slutsatser om hur livet var i antikens Rom. Hon vill ha mer romerska data, mindre extrapolering från andra kontexter och mer faktisk information från det romerska imperiet. Här handlar det mycket om hushållsdata, som berättar vad folk faktiskt konsumerade, bortom den vetecentriska kliometrin om historiska levnadsstandarder, och om pengar. För levnadsstandarden vill hon se bortom en "unskilled wage" och se på mer komplext sammansatta inkomster för de många småbönderna; här refererar hon bl.a. till sin egna Roman Peasant Project. Så här lanserar hon sin egen approach relativt till kliometrikernas:

"At the moment, in an attempt to participate in the longue-durée comparative effort, Romanists have tried to run before they can walk, and in  doing so, they’ve probably totally misrepresented welfare and in equality as well as overall economic performance. We need to keep the urgency to tell big stories, but use thick, small-scale data to tell them, returning to a place we actually know quite well—the household—and exploiting both well-known and new datasets in the context of lives lived—not
trends already assumed. " (s. 32)

 

 

referens

Kim Bowes (2021) "When Kuznets Went to Rome: Roman Economic Well-Being and the Reframing of Roman History", Capitalism: A Journal of History and Economics, Volume 2, Number 1, Winter
2021, pp. 7-40.

fotnoter

[1] Den formuleringen, minus "ungefär", lånar jag från den marxistiske historikern Robert Brenner. “[E]very historically evolved type of society – what Marx called mode of production – has its own microeconomics”, citerat från Brenner, "Property and Progress: Where Adam Smith Went Wrong", i Chris Wickham (red.) Marxist History-writing for hte Twenty-first Century (Oxford UP, 2007).

[2] Kalori-minima: Hopkins; slav- och soldatransoner: Goldsmith; Atens bönder: Temin, “Estimating GDP in the Early Roman Empire.” 

[3] Angående att Bowes menar att dessa ekonomer/kliometriker väljer antaganden för att få de resultat de vill ha, så skriver hon bl.a. att: "For most of the economists involved in these debates, of course, the point was not to ask  whether the Roman world was, in fact, a world of subsistence farmers, but to demonstrate the relatively static quality of all such economies compared to industrially driven growth."  (s. 19)

[4] Hon skriver bl.a. att: "despite a pretense of internal checks, Scheidel and Friesen’s inequality exercise is a largely cir-
cular one in which pre-modern or ahistorical data both drive the GDP calculations at its base and determine the distribution of the resultant overall wealth." (s. 21) 

[5] Hennes exempel är Harpers Fate of Rome och Scheidels Great Leveler och Escape from Rome. Hon sammanfattar Harpers och Scheidels narrativ om Rom så här: "Thus, one can read, on the one hand, that the expansion of monetization driven by foreign plunder fueled a Roman economic “revolution”; that innovation in water-driven machines produced a mini-industrial revolution so expansive that its effects are registered in lead pollution on the Greenland ice-sheet; and that economic growth driven by urbanization, agricultural intensification, and trade resulted in historically unprecedented health and physical well-being as mea sured in the human skeletal record. On the other hand, one can also read that a volcanic eruption and a succession of plagues in the late empire created catastrophic economic impacts that ultimately led to the empire’s political collapse; and
finally and most expansively, that the Roman economy experienced no real per capita growth and was so unequal in its wealth distribution that only its catastrophic collapse could equalize wealth and unleash innovation and growth in the Middle Ages." (s. 24)

måndag 6 januari 2025

Problem med interaktionsmodeller

 
diagnostiska scatterplots som rekommenderas av Hainmueller, Mummolo och Xu 
för forskare som använder interaktionsmodeller
 

I kvantitativ samhällsvetenskap är det vanligt med interaktionsmodeller, regressioner där utfallsvariabeln (Y) inte bara beror på två olika förklarande variabler (D och X), utan också på samvariationen mellan D och X. Man kan, för att ta exempel från studier som jag bloggat om, argumentera som Hope och Martelli att inkomstojämlikheten påverkas både av informations- och kommunikationsteknologin som ökar efterfrågan på högutbildad arbetskraft, och av arbetsmarknadsinstitutioner som regleringar och fackföreningsstyrka, och av interaktionen mellan teknologi och institutioner: teknologin kommer ju inte implementeras på samma sätt i USA och i Sverige. Eller så kan man argumentera som Evans att implikationerna av ens klasstillhörighet för ens placering på vänster-höger-skalan kommer variera med ens grad av kyrklighet. Man kan också argumentera som Potrafke att globaliseringen av ekonomin skärper skillnaderna mellan vänster- och högerregeringar vad gäller offentliga utgifter. Det är bara tre exempel från 2000- och 2010-talens samhällsvetenskap; interaktionsmodeller har över huvud taget blivit mycket intensivt använda dessa decennier.

Det indikeras också av hur många citeringar ledande metodartiklar om interaktionsmodeller har: Brambor, Clark och Golders mycket inflytelserika artikel från 2006 har snart 7500 citeringar på Google Scholar. [1] Statsvetarna Jens Hainmueller (verksam vid Stanford), Jonathan Mummolo (Princeton) och Yiqing Xu (också Stanford) intervenerade i denna diskussion för fem år sedan med sin artikel "How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice". De börjar med att definiera interaktionsmodellen:

 Y = μ + αD + ηX + β (D · X ) + e

Här är α effekten av den ena förklarande variabeln vi är intresserade av, η är effekten av den andra förklaringsvariabeln, och β är interaktionseffekten: hur effekten av D varierar beroende på värdet på X.

Hainmueller, Mummolo och Xu (hädanefter sammanfattar jag dem som HMX) lägger fram två problem med interaktionsmodeller så som de används i statsvetenskap idag. Det första är att interaktionsmodellen låter effekten av D variera med värdet av X, men däremot antar man att själva interaktionseffekten β är linjär "and follows the functional form given by ∂Y /∂D = α + β X .". De kallar detta antagandet LIE, linear interaction effect, och menar att när de replikerar 46 interaktionseffekter i 22 artiklar i statsvetenskapliga topptidskrifter, så varierar effekten bara linjärt i 48 procent av fallen. Deras andra problem talar till mitt historiker-hjärta:

"Scholars using multiplicative interaction models routinely report the effect of D on Y across a wide range of X values by plugging the X values into the conditional marginal-effect formula ∂Y /∂D = α + β X . However, often little attention is paid as to whether there is sufficient common support in the data when computing the conditional marginal effects. Ideally, to compute the marginal effect of D at a given value of the moderator, x_o , there needs to be (1) a sufficient number of observations whose X values are close to x_o and (2) variation in the treatment, D , at x_o . If either of these two conditions fails, the conditional marginal-effect estimates are based on extrapolation or interpolation of the functional form to an area where there is no or only sparse data and therefore the effect estimates are fragile and model dependent (King and Zeng 2006). In our replications we find that this type of extrapolation is common in empirical practice." (s. 165)

Helt enkelt en poäng i den empiriska andan: vilken variation har du egentligen att utforska i X och Y? Hur samvarierar egentligen D och X -- om din estimerade β säger att effekten av D är mycket starkare när X är 60 än när X är 30, finns det egentligen några datapunkter i ditt dataset där värdet på X är 60, och bland dessa datapunkter, finns det verkligen variation i D, att det finns datapunkter med högt X och lågt D, och datapunkter med högt X och högt D? Utifrån sin replikation av de 22 artiklarna, så säger de att i praktiken så presenterar statsvetare ofta sina interaktionseffekter som om de hade full variation på X och full variation på D, även när så inte är fallet.

HMX artikel är hands on och hjälpsam: deras första sektion efter att de förklarat de två problemen, är att presentera diagnostiska verktyg som empiriska forskare kan använda för att förstå om deras data lider av problemen, (1) LIE-antagandet eller  (2) "lack of common support". Som så ofta är scatterplots av rådatat till hjälp. För en modell där D är binär (0 eller 1), "we recommend plotting the outcome Y against the moderator X separately for the sample of treatment group observations (D = 1) and the sample of control group observations (D = 0)." För båda samplen rekommenderar de att man ska köra en linjär regression och en LOESS fit. Dessa scatterplots är 1a och 1b i Figur 1 som jag klistrat in ovan. I 1a ser vi att effekten av X på Y är mycket starkare i gruppen där D = 0 än i gruppen där D = 1, så det finns en effekt av D * X. LOESS och linjär regression divergerar inte särskilt mycket, så β är något i stil med linjär. I panelerna 1b, uppe till höger, är interaktionseffekten i (det hypotetiska) datat ickelinjär, och vi ser att linjerna från en linjär modell (blå) och LOESS (röd) divergerar kraftigt. Men också här förändrar D relationen mellan X och Y.

För problem två, common support, rekommenderar de att "we can simply compare the distribution of X in both groups and examine the range of X values for which there are a sufficient number of data points for the estimation of marginal effects." (s. 169) De har också inkluderat box plots för att illustrera spridningen på ett effektivt sätt. I box plotsen är punkten medianen, slutpunkterna på de tjocka staplarna är 25:e och 75:e percentilen, och slutet på de tunna staplarna är 5:e och 95:e percentilerna. Här är ju D binär och det är relativt enkelt att illustrera spridningen av X för olika värden av D: om D är kontinuerlig så rekommenderar de en "simple binning approach", med tre grupper: låg X (lägsta tredjedelen), mellanhög X (andra tredjedelen) och hög X (tredje tredjedelen).  Dessa tre plots, för deras hypotetiska data med kontinuerlig D och en linjär interaktionseffekt, finns på 1c. De tre plottarna visar tydligt närvaron av en interaktion D * X eftersom Y varierar negativt med X när D är låg (vänstra plotten), men positivt när D är hög (högra plotten).

I följande sektion presenterar de hur man kan beräkna effekten av D på Y givet olika värden av X. För siatutionen när X är kontinuerlig rekommenderar de, i enlighet med approachen som gav plottarna i 1c, att man delar in datat i tre delar med avseende på värdet på X. (s. 170-173) Figur 2 visar både interaktionseffekter beräknade och visade så som Brambor, Clark och Golder (2006) rekommenderar -- en linjär interaktion från lägsta till högsta värdet på X -- och så som HMX rekommenderar, med effekten av D helt enkelt beräknad för tre grupper: de med lägst värde på X, de med mellanvärden, och de med högst värde. Ironiskt (?) nog skulle en ren HMX-plot, alltså utan linjen med skuggade konfidensintervall som kommer från BCG, nog se mindre "fancy" ut.


Deras andra variant på hur man kan beräkna interaktionseffekter är en kernel smoothing estimator, en semiparametrisk estimator där en serie lokala effekter beräknas. Denna är tyngre att beräkna än den enklare varianten med tre bins, och inte lika enkel att presentera resultaten ifrån. (s. 173-175)

I följande sektion går de igenom 22 artiklar publicerade i fem topptidskrifter inom statsvetenskap: he American Political Science Review (APSR), The American Journal of Political Science (AJPS), The Journal of Politics (JOP), International Organization (IO) and Comparative Political Studies (CPS). Från dessa 22 artiklar analyserar de 46 beräknade interaktionseffekter. HMX visar att större delen av dessa argument om interaktionseffekter lider av ett eller båda av de problem som diskuterats i artikeln. Figur 5, som jag klistrat in nedan, illustrerar problemet "Lack of common support", att X helt enkelt inte varierar tillräckligt mycket för de olika värdena på D för att man ska kunna dra slutsatser om att effekten av D beror på värdet på X. Den övre plotten (a) visar att datasetet har extremt få observationer med D=1, D är oftast 0, och att observationerna med D=1 är väldigt snävt klustrade runt låga värden på X. Därför blir det orimligt att extrapolera till hur effekten av D skulle vara när X är lågt eller högt.


Figur 6 visar liknande problem. Här är det en studie, utförd som ett experiment i Vietnam, om ifall transparens och publicitet gör parlamentariker mer hederliga och mer aktiva som politiker. Författarna hävdar att effekten av publiciteten (i form av granskande journalistik, variabel D här) varierar med hur stark tillgången till internet är i politikerns provins. Tillgången till internet är alltså X i notationen använd här, och politikerns arbetskvalitet är Y. Figur 6 visar uppe till vänster författarnas egna graf, gjord i Stata, som tycks visa en mycket elegant linjär effekt, med inga signifikanta effekter av D när värdet på X är ungefär 0 till 2,5, och därefter signifikanta och allt starkare effekter. Men HMX plott (b) visar att tillgången till internet -- X -- faktiskt varierar extremt lite, och har ett par extrema outliers. [2] Dessa droppas i (c), och vi ser att den skattade effekten blir väldigt mycket flackare och aldrig statistiskt signifikant. Också kernel-skattningen i (d) visar detta.

De diskuterar också en artikel som argumenterar att närheten i tid till ett presidentval (D) påverkar hur många partier som ställer upp i ett parlamentsval (Y), men att effekten varierar med antalet presidentkandidater (X). Också här finns det problem med brist på variation i datat. I 59 procent av observationerna var värdet på X 0, och bland dessa 59 procent fanns det ingen variation alls i Y. Alltså kunde inte HMX bin-strategi estimera någon interaktion för den lägsta tredjedelen vad gäller X. Det är inte heller så, som ursprungsartikeln argumenterar, att interaktionen D * X är linjärt ökande: för låga värden på X finns det som sagt ingen interaktion alls, eftersom det inte finns variation, och enligt HMX var interaktionen för resterande 41 procent av observationer ickelinjär. (s. 182) Kernel-estimaten ger ungefär samma bild, med mycket breda konfidensintervall för låga och höga värden för X, och få statistiskt signifikanta platser för β.

Från de illustrativa exemplena går HMX vidare till en översikt över de 46 interaktionseffekterna i de 22 artiklarna. De skapar ett enkelt poängsystem där varje interaktion för 0 eller 1 poäng för varje indikator: (1) inga statistiskt signifikant olika värden för β på "låga" och "höga" värden på X, (2) vad de kallar "severe extrapolation", och (3) ickelinjära interaktionseffekter. 0 poäng är alltså toppen, inga problem här, och 3 är inte alls bra. Medelvärdet för de 46 interaktionseffekterna blev 1,7, vilket indikerar rätt seriösa problem; bara 4 av 46 effekter fick ett perfekt resultat, 0 poäng. Däremot fick 7 effekter 3 poäng. (s. 184)

HMX artikel var alltså välbehövlig och starkt motiverad: det är också talande att den redan, fem år efter sin publicering, har över 1000 citeringar på Google Scholar -- forskarna verkar alltså varit ivriga att ta till sig insikterna om interaktionsmodellernas potentiella problem. Till succén hör nog också att författarna skrivit kod för R, paketet "interflex", som man kan använda för att göra precis de diagnostiska analyser som de rekommenderar. Föredömligt!


 

referens

Jens Hainmueller, Jonathan Mummolo och Yiqing Xu (2019) "How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice", Political Analysis vol 27 s. 163-192.

fotnoter

[1] Hainmueller, Mummolo och Xu sammanfattar Brambor, Clark och Golders artikel så här: " For example, Brambor, Clark, and Golder (2006) provide a simple checklist of dos and don’ts.2 They recommend that scholars should (1) include in the model all constitutive terms (D and X ) alongside the interaction term (D · X ), (2) not interpret the coefficients on the constitutive terms (α and η) as unconditional marginal effects, and (3) compute substantively meaningful marginal effects and confidence intervals, ideally with a plot that shows how the conditional marginal effect of D onY changes across levels of the moderator X." (s. 164) HMX kommenterar att de flesta statsvetenskapliga artiklar som publiceras idag med interaktionsmodeller, följer BCG:s råd.

[2] I författarnas egna graf vser vi att effekten av D ska vara stark och statistiskt signifikant när tillgången till internet, X, har värden runt 2,5 till 9. Men plott (b) visar ju att det i princip inte finns några sådana observationer i datat! James Anderson har gjort en liknande kritik av artikeln redan 2013: Andersons mer policyinriktade papper påpekade att författarnas beräkningar faktiskt föreslog att "transparens" (så som de mätte det) faktiskt hade en positiv men icke signifikant effekt i ungefär 80 procent av valdistrikten.

måndag 2 december 2024

Agrar ojämlikhet och politik i Spanien


Agrara samhällen kan ha väldigt olika sociala strukturer (klasstrukturer): det är stor skillnad mellan en socken där all jord ägs av en enda godsägare och där den övriga befolkningen sysselsätter sig med att arbeta åt godsägaren, och en socken där jorden delas mellan en större mängd småbönder. Vi kan tänka oss att i den godsdominerade socknen så utövar godsägaren inte bara ekonomisk makt -- makten att anställa och att avskeda -- utan också social och ideologisk makt. I denna tanketradition har historiker och samhällsvetare som Alexander Gerschenkron teoretiserat att den agrara ojämlikheten leder till en odemokratisk politisk kultur, med starkt begränsat folkligt deltagande och helt enkelt elitens dominans. Östra Preussen med dess junkrar är det arketypiska exemplet.

Ekonomisk-historikern Jordi Domènech och statsvetaren Ignacio Sánchez-Cuenca, båda verksamma vid Carlos III-universitetet i Getafe just utanför Madrid, går i en artikel från 2022 i dialog med denna tanketradition. De inleder dock sin artikel med en något annan inramning, om den historiska persistensen och ifall vi har en långsiktig persistens i regionala skillnader i politiskt beteende

"The historical and geographical persistence of patterns of political behaviour has been well documented (see, among others, Acharya, Blackwell and Sen 2016b; Charnysh 2015; Homola, Pereira and Tavits 2020; Lupu and Peisakhin 2017; Rodden 2019; Sanchez-Cuenca 2019; Tilley 2015; Voigtländer and Voth 2012; Wittenberg 2006). In many cases, the phenomenon of political persistence is conceptualized as a historical legacy, where the effect of an extinct cause survives vast economic, social and political transformations (Simpser, Slater and Wittenberg 2018)." (s. 1668)

Den agrara ojämlikheten kan då ses som ett specialfall av sådan persistens. De går tillbaka till mellankrigstiden i Europa, som enligt Lipset och Rokkan (1967) var tiden när det politiska systemet formerades, med klyftorna mellan stad och land, kapitalister och arbetare, och kyrka och sekularism. Domènech och Sánchez-Cuenca knyter an till Stefano Bartolinis klassiska bok The Political Mobilization of the European Left (2000) där Bartolini hävdar att länder som på 1920-30-talen fortfarande var agrara, och som hade "extreme inequality", fick ett politiskt mönster där lantarbetarna gick till den politiska vänstern. Om man förenar detta argument från Bartolini med Lipset och Rokkans argument om att klyftorna som strukturerar den politiska konflikten "frös" på 20-30-talen och bestod i flera decennier, så får vi alltså en position att de länder som på 20-30-talet var agrara och ojämlika flera decennier senare bör ha en vänsterdominerad landsbygd medan de andra länderna inte bör ha det.

Spanien är ett perfekt fall för att studera detta, säger Domènech och Sánchez-Cuenca: agrar klasskonflikt var en av de drivande faktorerna bakom den Andra Republikens fall och inbördeskriget 1936-1939, medan agrara klasskonflikter var mycket mindre viktiga efter Franco-diktaturens fall 1977. Ändå, säger de, finner vi en robust och positiv effekt av 20-30-talens agrara ojämlikhet på Vänsterns styrka i de spanska valen från 1977 till 2019. De föreslår att det finns två kausala mekanismer i spel här. Ett, att konflikterna om jord skapade beständiga politiska identiteter och lojaliteter som ännu sjuttio-hundra år senare gynnar vänstern. Två, att den agrara ojämlikheten har negativa effekter på socioekonomiska utfall -- välståndet, utbildningsutbudet -- vilket i sin tur gynnar vänstern. 

I teorisektionen konstaterar de att Lipset och Rokkan inte utvecklade analysen av den agrara klasskonflikten men att andra forskare, inklusive Urwin (1980) gjorde bidrag åt detta håll. Linz (1976, Comp Pol) urskilde 13 sociala klasser i jordbruket, med godsägare (latifundium) i toppen och jordbruksarbetare i botten. D och SC är framför allt intresserade av polariseringen i godsregioner och motsättningarna mellan godsägarna och lantarbetarna. Så här beskriver de dessa och deras implikationer för politiken:

"In countries with high levels of agrarian inequality, landowners sought to maintain their privileges and to neutralize the emergence of new industrial elites; consequently, they opposed democracy, which was perceived as a threat to the status quo (Ansell and Samuels 2014; Boix 2003; Moore 1967; Ziblatt 2008). Large landholdings are usually associated with various forms of labour coercion and, therefore, with strongly hierarchical social relations. In response, landless labourers resent their dependence on landowners, particularly if their jobs are only seasonal, and frequently support land redistribution. Politically, therefore, they lean towards the Left. Small farmers, by contrast, tend to be conservative, religious and traditionalist; they do not generally favour land redistribution." (s. 1670)
Med Bartolini (2000) säger de att denna sociala motsättning var viktig i länder där jordbruket var (a) viktigt och (b) ojämlikt. På förutsättningen (a) faller de tidigt industrialiserade länderna bort: de pekar på Storbritannien, Schweiz, Belgien, Nederländerna och, förvirrande nog med tanke på det klassiska Sonderweg-argumentet om junkrarnas betydelse i tysk 1900-talspolitik, Tyskland. På (b) gör de också en pikant utsortering av länder: "A similar diagnosis holds for countries with more egalitarian land distribution (the Nordic ones), regardless of the timing of industrialization." (s. 1670) Jag hade missat att läsa denna artikel innan Felix Kersting och jag skrev vårt working paper om agrar ojämlikhet och demokratisering i Sverige och Preussen men man kan väl helt enkelt konstatera att vårt argument om att folk underskattar den agrara ojämlikheten i Sverige, och drar felaktiga slutsatser om den politiska utvecklingen utifrån den felaktiga bedömningen av den agrara ojämlikheten, är ännu mer relevant än vad vi visste när vi skrev vårt utkast. I vilket fall, så menar Domènech och Sánchez-Cuenca att det är i länder där lantarbetarna var mellan 1/3 och 1/2 av arbetarklassen, som den agrara klasskonflikten blev central för politiken. (De jämställer "extrem agrar ojämlikhet och proletarisering, inget konstigt med det men intressant att notera, s. 1671.) De identifierar detta som södra Europa och i någon mån Frankrike. De beskriver situationen i detta mer polariserade Sydeuropa så här:

"the agrarian issue was key during the interwar period. Rural conflict polarized politics: leftist formations, particularly socialist parties, were less compromising and more tempted by revolution when agrarian workers had a greater presence in their ranks, in contrast to the reformist socialist or labour parties in early industrializing countries, which had a more homogeneous industrial and urban base (Bartolini 2000, 498–9; Luebbert 1991, 295–302). The agrarian basis of support for leftist parties (socialist, anarchist or communist) in Southern European countries is a well-known phenomenon (Urwin 1980: ch. 4). Moreover, in these countries, the agrarian issue was reinforced by the religious cleavage due to the coalition between large landowners and the Church (Manow 2015). Thus, anti-clerical violence was higher in areas of greater agrarian inequality, whereas in more egalitarian regions, small owners sided with the Church." (s. 1670)

De går över till att diskutera Spanien, som på 1930-talet fortfarande hade mer än hälften av sina sysselsatta i jordbruket, och som hade en ojämlik ägandestruktur i jordbruket, särskilt i den sydvästra delen av landet. Det finns inga "comprehensive estimates of landownership inequality" i det tidiga 1900-talet för Spanien, säger de, men med statistik från Vanhanen (2003) pekar de på att Spanien, liksom Portugal och Italien, hade en av de lägsta andelarna familjejordbruk i Europa. I de södra provinserna Cádiz, Sevilla och Córdoba utgjorde stora gods -- över 250 hektar -- mer än 40 procent av jorden, och i dessa andalusiska provinser spred sig den anarkistiska rörelsen bland lantarbetarna i det tidiga 1900-talet. [1]

Under 1920- och 30-talen ökade hettan i den agrara klasskonflikten ytterligare. Antalet medlemmar i den socialistiska lantarbetarfackföreningen ökade från runt 37 tusen år 1930 till nästan en halv miljon år 1933, och strejkerna i jordbruket ökade tjugofalt 1931-33. Efter att vänstern vann valet 1931 genomförde socialister och vänsterrepublikaner reformer av landsbygdens arbetsmarknad och arrendatorsförhållanden. I september 1932 försökte vänsterreringen genomföra en ambitiös jordreform, vilket ytterligare ökade polariseringen. Små och mellanstora bönder organiserade sig i Confederación Española de Derechas Autónomas, en högerkoalition med reaktionära partier, katolska grupper och monarkister. De små och mellanstora bönderna skulle inte direkt påverkas av jordreformen, eftersom de inte ägde tillräckligt mycket, men skulle indirekt bli påverkade av att lönerna skulle stiga när det fanns färre fattiga och desperata jordlösa arbetare att välja mellan, och detta hot drev bönderna i Högerns famn inför valet 1933. [2] När Folkfronten vann valet i februari 1936 skruvades reformtakten upp, men detta väns förstås snabbt när först regeringen möter en kupp och sedan ett inbördeskrig. Den segrande högersidan återställde alla exproprieringar av jord som vänstern genomfört, och på 1950-60-talet ledde snabb industrialisering i Baskien, Katalonien och Madrid-regionen till stor migration från de fattiga provinserna i södern till de nya fabrikerna. Jordbrukets andel av sysselsättningen i landet som helhet sjönk från 40 procent år 1960 till 16 procent år 1980. (s. 1672)

I Domènech och Sánchez-Cuencas empiriska analys är den huvudsakliga utfallsvariabeln vänsterns röstandel i de spanska valen 1977 till 2019, totalt 15 val. [3] Den första oberoende variabeln är andelen jordlösa lantarbetare i folkräkningen år 1860, som i Beltrán och Martínez-Galarraga (2018, Explorations). Denna är mätt på ganska grovhuggen nivå: de 50 provinserna, som skapades 1833 och finns kvar oförändrade idag. Den andra varianten är att använda en inkomplett jordräkning från 1920-talet, insamlad av en historiker på 1970-talet, och att räkna ut andelen av den totala beskattade jordbruksinkomsten som gick till ägare med inkomster över 5000 pesetas -- historikern Carrión (1975) menade att ungefär 1 procent av jordägarna i Spanien hade sådan inkomst eller mer, och att det var ungefär 2 procent av jordägarna i de ojämlika andalusiska provinserna. (s. 1674) Denna variabel finns för 882 kommuner, från provinserna Badajoz, Ciudad Real, Cáceres, Cádiz, Córdoba, Jaén, Málaga, Salamanca och Seville. I regressionerna utesluter de kommuner med färre än 1000 röster, eftersom de kan vara så volatila, och har då kvar 513 kommuner. (s. 1675) En tredje oberoende variabel, i en robustness check, är andelen i olika bondegrupper i 1920 års folkgrupper. Anledningen till att denna bara är en robustness check är att det är otydligt hur en småbonde räknas, i kategorin patronos eller no patronos.

Diskussionen om geografiska kontroller är extremt kort och ganska otydlig. I sin helhet lyder den: "Both in the provincial and municipal analyses, we add latitude and longitude to control for
hidden spatial patterns. We also control for the altitude of the province capital in the provincial
analysis and the altitude of the municipality in the municipal analysis." (s. 1674) De motiverar alltså inte alls varför det är relevant att inkludera latitud och longitud, eller hur högt provinshuvudstaden ligger över havet. 

Regressionsmodell 1 har på högersidan andelen jordlösa år 1860, geografiska kontroller, och dimmies för valåren. (Det är oklart om modellen har provins-fixed effects: enligt brödtexten innehåller den "the dummy for historical regions", men det finns inga sådana i tabellen, medan däremot valårs-fixed effects är tydligt redovisade.) Modell 2 använder istället andelen stora jordägare för de 882 kommunerna i de nio provinserna. Enligt modell 1 så medför en 10 procentenheters ökning av andelen jordlösa år 1860 4 procentenheters mer röster för vänstern under åren 1977-2019. I modell 2 är effekten svagare, vilket antagligen har att göra med att dessa data mest kommer från provinserna med hög agrar ojämlikhet. Koefficienten är 0,082 vilket innebär, säger Domènech och Sánchez-Cuenca, att en ökning om en standardavvikelse medför 2 procentenheter mer vänsterröster, vilket motsvarar 15 procent av en standardavvikelse i utfallsvariabeln. Den skattade effekten är robust till inkludering av provins-fixed effects.

Modell 3 lämnar den ekologiska inferensen -- studiet av mönster på kommun- och provinsnivå -- och studerar istället individdata, med en survey (som har omkring 9000 respondenter) från strax före 1977 års val. Det är en probit-modell där utfallsvariabeln är sannolikheten att rösta på ett vänsterparti, och använder andelen jordlösa år 1860 plus samtida socio-demografiska kontroller: arbetslösheten i regionen, utbildningsnivå, och sysselsättningsstrukturen jordbruk/industri/tjänster. Med alla andra variabler på sina medelvärden var sannolikheten att rösta vänster 35,1 procent i provinser där andelen jordlösa år 1860 var 30 procent, men i provinser där andelen jordlösa år 1860 var 70 procent, var sannolikheten att rösta för vänstern 59,6 procent.

I ytterligare en variant använder de en instrumentvariabel för den historiska ojämlikheten. Instrumentet är reconquistan från de muslimska härskarna i Spanien, från 700-talet till 1492. Denna gick i början långsamt och ledde till tätbefolkade samhällen med en större mängd bönder och relativt utbrett deltagande i bystyret, men från 1000-talet och framåt var det en strängare feodal ordning som skapades i de nyvunna regionerna:

"The initial period of the Reconquest was characterized by a relatively compact settlement, leading to egalitarian political institutions, free peasants and dispersed land-
ownership. In contrast, after Toledo fell into Christian hands in 1085, the aristocracy and the so-called ‘military orders’ were in charge of guaranteeing the protection of settlers in contested terrain south of the Tagus River."
Detta historiska arv, 500-1200 år gammalt, korrelerar förstås med en massa mellanliggande utfall, inte bara partival i valen 1977-2019, och författarna resonerar om hur den feodala ojämlikheten t ex leder till lägre socialt kapital och lägre utbildningsnivå (Baten och Hippe 2018, Baten och Juif 2014); därför kontrollerar de för andelen icke läskunniga år 1860 för att rensa bort effekten på politiken från det feodala arvet som verkar genom sociala förhållanden. [4]

Deras diskussion om kanalerna för den historiska persistensen är väldigt intressant. De menar att den historiska agrara ojämlikheten påverkar samtida politik genom två kanaler: en politisk, en ekonomisk. Den ekonomiska är att ojämlikheten enligt dem -- och detta tror jag inte gäller om man byter till en svensk kontext -- hindrade industrialiseringen, hejdade humankapitalbildningen, och ökade fattigdomen och arbetslösheten. (Greg Clark skulle inte heller hålla med om att ojämlikheten nödvändigtvis hindrar humankapital -- se hans och Rowena Grays studie av England.) I vilket fall, så är det ganska rättframt att testa betydelsen av de här variablerna. Den politiska kanalen är på något sätt mer komplex, och mer intressant. Domènech och Sánchez-Cuenca lägger här in två mellanstationer, tester av episoder som ligger emellan de historiska orsakerna och utfallen från 1977 till 2019. Den ena är stöd för Folkfronten i det polariserade valet februari 1936. Den andra är repressionen efter inbördeskriget. De använder för att testa detta litteraturen om "mediation analysis". De beskriver logiken så här:

"In the model, historical agrarian inequality has both an effect on the mediators (voting in the 1936 elections and Civil War violence) and on the intermediate confounders (the contemporary economic conditions of the provinces). The existence of intermediate confounders and post-treatment bias suggests that a causal mediation model should be adopted. In this sense, we follow Acharya, Blackwell and Sen (2016a) and use sequential g-estimation to isolate the two potential causal relationships." (s. 1677)
Det första steget är diagrammet med pilar som jag klistrat in nedan, en Directed Acyclic Graph, DAG. Till vänster finns "pre-treatment variables", alltså faktorer som föregick 1860 års agrara ojämlikhet: geografi, reconquistan, politik före 1860. Därefter kommer själva "treatment", alltså den huvudsakliga oberoende variabeln, 1860 års agrara ojämlikhet. Denna påverkar därefter utfallsvariabeln -- partival 1977-2019 -- på två olika vägar, en genom 1930-talets agrara politik, konflikter och inbördeskrig, en genom den ekonomiska utvecklingen.



För att beräkna detta ekonometriskt använder de s k g-estimation som är ett sätt att hantera longitudinella effekter där något som tidigare hänt (den oberoende variabeln) påverkar utfallsvariabeln direkt, men också indirekt genom mellanliggande variabler, confounders. G-estimation är en teknik som använts mycket i medicinsk forskning där man har data för samma individ över en längre tid, och något dåligt som hände personen tidigare påverkar utfall idag genom olika mekanismer. Psykologiforskarna Wen Wei Loh och Dongning Ren presenterar i en introduktion till g estimation följande exempel på en DAG:


Här är utfallsvariabeln Y -- som i deras exempel är ens välmående under dagen -- observerad vid tre tidpunkter, förmiddag, lunch och eftermiddag. Den oberoende variabeln X är om man har druckit kaffe eller inte, och confoundern L är trötthetsnivån. Som vi ser från pilarna så påverkar både förmiddagens humör (Y1) och förmiddagens energinivå (L1) om man dricker kaffe (X1), som påverkar humöret senare under dagen, Y2 och Y3. g estimation är då en metod för att beräkna hur Y3 bestämts av måendet tidigare under dagen (Y1 och Y2) och en oberoende variabel (X) och en confounder (L) som alla påverkas i sig av Y, och har ömsesidiga relationer.

Så här förklarar Domènech och Sánchez-Cuenca sin g-estimation-approach:

"To proceed with the sequential g-estimation, we first expand our baseline regressions to include the mediator variables and the intermediate confounders alternatively. One first snapshot of the relative importance of these channels can be simply grasped by gauging the change in the main coefficient on agrarian inequality when adding the mediators or the intermediate confounders to the baseline specification (Baron and Kenny 1986). For the mediators, we use the provincial percentage of the vote going to the Popular Front in the general election of February 1936 (the source is Alvarez Tardío and Villa [2017]). Regarding Civil War repression, we use the data from Espinosa (2010).15 For the analysis, we include only the number of civilians killed by the Rebels since the repression of the Republicans is associated with support for the Popular Front in the 1936 elections (it makes little sense to assume that Republican repression strengthens leftist allegiances). We ‘normalize’ the number of murdered civilians using the inverse hyperbolic sine function." (s 1677-1678)
Den första regressionen i g-estimation-analysen är samma som den första regressionen i pappret fast med de två medlande variablerna med: andelen röster på Folkfrontens partier år 1936 och höger-repression efter inbördeskriget. Båda de medlande variablerna har positiva och signifikanta effekter på vänsterröstning 1977-2019, och koefficienten för 1860 års andel jordlösa krymper från 0,406 till 0,107. I en annan variant, kolumn 3 i samma tabell, använder de istället de samtida confounders -- arbetslöshet, etc. Dessa minskar inte koefficienten för 1860 års ojämlikhet lika mycket som de medlande variablerna från 1930-talet gör, vilket författarna tolkar som att: "Although these estimations are affected by post-treatment bias, they suggest that the political mechanism is a more dominant channel than the intermediate economic confounders." (s. 1678)

Därefter gör de en sequential g-estimate med Stata-koden från Acharya, Blackwell och Sen (2016). De beskriver processen så här: 

"This procedure de-means the main variable to keep the intermediate confounders or the mediator constant, re-estimates the regression without post-treatment variables and bootstraps the standard errors of the coefficient of interest. In column 4, we present the results of the sequential g-estimation when the intermediate confounders (unemployment, education and industrialization) are fixed. The coefficient on agrarian inequality in 1860 captures the effect that goes through the political channel, in this case, the front-door pathway via our selected mediators. We obtain a very similar coefficient of land inequality to that of column 3. A one standard deviation increase in 1860 inequality (10.24 percentage points) is associated with a 2.94 percentage point increase in the leftist vote, which represents almost a third of the standard deviation in the leftist vote." (s. 1678)
Kolumn 2 kollar på den andra möjliga kanalen, med medelvärdet för 30-talets medlande variabler bortdragna från dem. Koefficienten ändras knappt jämfört med kolumn 1 vilket visar att båda kanalerna spelar roll, men den politiska mer än den ekonomiska. De gör också g-estimation-metoden med kommundatat.

Jag gillar verkligen hur fokuserade de är på att diskutera persistensens mekanismer, och från g-estimation-sektionen övergår de till en mer kvalitativ diskussion av mekanismerna. Hur kunde den ideologiska präglingen från 1920-30-talen överleva genom flera decennier av diktatur och fortfarande manifestera sig i den demokratiska politiken från 1977 och framåt? De ger en effektiv översikt över olika kanaler som forskningen diskuterat: "The literature on historical legacies has contemplated several transmission mechanisms: the Church (Wittenberg 2006), the school (Darden and Grzymala-Busse 2006) and the family (Acharya, Blackwell and Sen 2016b; Lupu and Peisakhin 2017; Voigtländer and Voth 2012)." (s. 1680) För den spanska kontexten med Francos diktatur bör familjen vara den viktigaste mekanismen: partier och fackföreningar till vänster var förbjudna, och kyrkan var regimtrogen. Skolorna styrdes likaså av kyrkan och regimen. Återstår gör familjen, som också forskningen från andra länder visat vara viktig. För att undersöka denna mekanism använder de en survey gjord 2008 där respondenterna blev tillfrågade både om sin egna politiska position, ens föräldrars politiska positionerl och vilken sida förfäderna tog under inbördeskriget.

Det är en rik artikel, med ambitiöst innehåll, och från mekanismdiskussionen går de över till att diskutera ifall relationen mellan agrar ojämlikhet och senare politiska utfall är sig lik också i andra europeiska demokratier. De kollar här på Italien och England, två länder med stor agrar ojämlikhet i det tidiga 1900-talet men där England var en tidig och Italien en sen industrialiserare. (I ett online-appendix kollar de också på Portugal.) För Italien är ojämlikhetsmåttet andelen jordlösa ("landless peasants") i befolkningen i folkräkningen 1931, och utfallsvariabeln är partival i 1976 års val. Korrelationen mellan den agrara ojämlikheten och vänsterns styrka är stark. (s. 1684) I England är det däremot inte så. Där är utfallsvariabeln stödet för Labour-partiet i 1970-talets fem parlamentsval, och de oberoende variablerna är olika indikatorer på rural fattigdom och konflikt på 1820- 1830- och 1870-talen. De tar en indikator på poor relief per person på 1820-30-talen från Blaug (1963) eftersom poor relief-utgifter var (negativt) korrelerade med bred tillgång till jord. Den andra oberoende variabeln är deltagande i Captain Swing-upploppen på 1830-talen, med data från Caprettini och Voth (2020). Den tredje oberoende variabeln är andelen av jordräntorna år 1873 som betalades till jordägare med mer än 800 acres jord. Till skillnad från i Spanien och Italien finns det i England ingen positiv korrelation mellan historisk agrar ojämlikhet och vänsterns styrka på 1970-talet.


 

referens

Jordi Domènech och Ignacio Sánchez-Cuenca (2022) "The Long Shadow of Agrarian Conflict: Agrarian Inequality and Voting in Spain", British Journal of Political Science 52: 1668-1688.

fotnoter

[1] Här har de några intressanta historiska referenser: T Kaplan (1977) Anarchists of Andalusia, 1868–1903 (Princeton); J Maurice (1990) Anarquismo Andaluz: Campesinos y Sindicalistas, 1868–1936. (Barcelona).

[2] Också här är de hsitoriska referenserna intressanta. De använder Malefakis klassiska studie från 1970 för jordreformen, och Luebbert (1991, s. 297), Manow (2015) och Simpson och Carmona (2020) för böndernas reaktion. 

[3] Eftersom vänsterpartierna förändrats över tid aggregerar de röstarna på alla vänsterpartier i varje aktuellt val. (s. 1672) 

[4] Mer precist så diskutear de det så här: "Feudal privilege is linked to other factors, like lower levels of social capital and education, which might also be correlated with contemporary political outcomes (Baten and Hippe 2018; Baten and Juif 2014), violating the exclusion restriction. We therefore add to our specification the rate of illiteracy in 1860 as an extra control blocking potential impacts of feudal privilege on political preferences other than inequality. By including illiteracy, the levels of human and social capital are taken into account, and the instrument captures agrarian inequality." (s. 1676)

fredag 29 november 2024

Demokratiskt kapital

 

Nationalekonomerna Torsten Persson (Stockholm) och Guido Tabellini (Bocconi) presenterar i sin artikel "Democratic Capital" från 2009 tre nya idéer om relationen mellan välstånd (mätt som BNP per capita) och demokrati. Vi vet att de två sakerna korrelerar, men varför, vad driver vad? Persson och Tabellinis första idé eller argument är att om demokrati förbättrar den ekonomiska utvecklingen, så kommer också förväntningar om en kommande demokrati påverka investeringsbeteendet i en autokratis slutfaser. Detta gör att ekonometriska skattningar av demokratiseringens effekt på ekonomin kommer underskatta de positiva effekterna, om folk redan börjat anpassa sig utifrån sina förväntningar, före demokratiseringen faktiskt sker. (99-100) Den andra idén är att för att demokratin konsolideras långsamt, "through a slow accumulation of a stock of civic and social assets that we call 'democratic capital.'" (s. 89) Persson och Tabellini menar att det demokratiska kapitalet ackumulerar ett samhälle antingen genom egen erfarenhet av demokrati, eller genom att ta inflytande från grannländer. [1] Dessa två argument kan kombineras till att förklara utvecklingen av en positiv spiral av demokrati och ekonomisk utveckling. Det tredje argumentet är att det inte är slumpmässigt vilka autokratier som demokratiseras, och att beräkningar av effekterna av demokratisering alltså kan vara biased.

Begreppet "demokratiskt kapital" är det som intresserar mig mest med Persson och Tabellinis undersökning. Angående detta så relaterar de till tidigare forskning så här:

"We are not the first to stress civic engagement and cultural attitudes in shaping the functioning of political institutions, and how some kind of “social capital” can be acquired over time. Important precursors include Seymour Martin Lipset (1959), Gabriel A. Almond and Sidney Verba (1963) and, more recently, Robert D. Putnam (1993), Axel Hadenius and Jan Teorell (2005), and Ronald Inglehart and Christian Welzel (2005). But our empirical methodology is very different from these studies.
In particular, democratic capital refers to variables that influence the stability of democratic regimes without direct effects on economic outcomes. The importance of culture in economic (as opposed to political) development is discussed from a different perspective in Guido Tabellini (2008a)." (s. 91)
Deras mått på BNP per capita kommer från Angus Maddison (2001). Måttet på politisk regim är binärt: 0 för autokrati, 1 för demokrati, och bygger först och främst på Polity IV som betygsätter politiska regimer från -10 (ren diktatur) till +10 (ren demokrati); Persson och Tabellini kodar landet som demokrati om värdet är över 0. [3] Deras alternativa mått på demokratisering kommer från Boix och Rosatos (2001) utbyggnad av Przeworski et als (2000) data. Detta är en binär variabel för "turnover of political power in free and fair elections". (s. 100) Persson och Tabellini beskriver fördelningen av länder som går från autokrati till demokrati, eller inte, eller fram och tillbaka flera gånger: 

"By both measures, political change varies a great deal across countries. Some nations, such as Afghanistan, China, and Morocco, never experience a transition into democracy. Others, like Australia and Canada, start out as democracies from independence, and never relapse into autocracy. Yet others, such as Costa Rica and Denmark, start out autocratic and make a single transition into democracy. Many countries have a more eventful history, however, with intermittent spells of democracy and autocracy. According to the Polity IV measure, Guatemala is the most extreme, having gone through six periods each of democracy and autocracy, since independence in 1839." (s. 100)

Hur kan man då mäta demokratiskt kapital, d, utifrån dessa data? Persson och Tabellini menar att det demokratiska kapitalet kommer i två former. Det första är inhemskt demokratiskt kapital (z), som växer över tid när medborgarna får fler erfarenheter av demokratiskt samhällsliv. Detta gör demokratin mer robust på flera sätt (genom flera mekanismer), som uppbyggnaden av formella och informella institutioner, som politiska partier och sociala normer. Tabellini (2008) har presenterat en formell modell för hur kulturella normer överförs mellan generationerna, och visar hur andra generationens invandrare i USA vars föräldrar kommer från mer demokratiska länder, idag har högre grad tillit, vilket är korrelerat med politiskt deltagande.

De säger att de är "agnostic about functional form" om hur z formeras, och börjar med en enkel modell där z ökar med antalet år som demokrati och vittrar med antalet år som autokrati. Om ∑ är från τ=0 till τ  = t−t_0 och t_0 är startåret, som antingen är år 1800 (när datat börjar) eller året när staten blir självständig, så:

 z (δ)_i,t = (1 − δ)   ∑  (1 − a_i,t−τ) δ^τ 

Diagrammet som jag klistrat in högst upp här illustrerar hur det demokratiska kapitalet utvecklades i Spanien och Sverige sedan 1800 om vi följer ekvationen här och sätter förslitningstakten 1-δ till 0,06. Länderna hade ganska olik politisk historia: Sverige blev demokratiskt först 1910 men förblev då demokratiskt, medan Spanien för första gången blev demokratiskt mycket tidigare, 1870, men också hade en mycket mer volatil historia därefter. Persson och Tabellini laborerar med två olika värden på δ, 0,94 eller 0,99, och med det lägre värdet på δ, alltså högre förslitningstakt på det demokratiska kapitalet, så går Sverige om Spanien i "demokratiskt kapital" runt 1930, snarare än runt 1950 som sker i modelleringen med δ på 0,99.

Den andra dimensionen av demokratiskt kapital är enligt Persson och Tabellini baserad på förhållanden i grannländerna. De definierar detta utländska demokratiska kapital f_i,t som:

 f (ρ)_i,t = ∑ (1 − a_j,t) ϖ (ρ)_t ^i,j
                j≠i
där a är ett mått på demokrati i närliggande landet j, och vikten ϖ tar in avståndet mellan land i (som vi är intresserade av) och landet j. ϖ faller till 0 när avståndet överskrider radius ρ utanför vilken förhållandena alltså inte förväntas påverka det demokratiska kapitalet i land i.

Man kan tycka att måtten är rätt yxiga -- t ex den medvetet naivt formulerade modellen att politiken i land i påverkas lika mycket av alla länder på samma geografiska avstånd, snarare än att detta medieras av land j:s befolkningsstorlek, ekonomiska styrka, militära styrka etc -- och Persson och Tabellini medger också att måtten d och f är "boldly constructed measures of democratic capital". (s. 104) De menar till måttens fördel att de båda är starkt korrelerade med graden till vilken medborgare värderar det demokratiska styrelsesättet i en stor uppsättning länder; på 1990-talet frågade World Value Surveys personer i 60 länder om de höll med om påståendet “Democracy may have problems, but it’s better than any other form of government.”, och benägenheten att hålla med är starkt korrelerad med Persson och Tabellinis mått d och f.

Den empiriska studien börjar med att beräkna sannolikheten för regimskifte: från autokrati till demokrati, eller tvärtom. Här undersöker de betydelsen av det demokratiska kapitalet, BNP per capita och BNP per capita givet politisk regim. Med maximum likelihood-metoder beräknar de rimliga värden på δ och ρ; δ hamnar mellan 0,94 och 0,99 och ρ hamnar på 1 vilket innebär att hela världens länder räknas in i den relevanta referensgruppen. (Vad jag inte fattar är hur en ρ på 1 kan kombineras med års-fixed effects, men men.) [4] Demokratiskt kapital minskar föga förvånande sannolikheten för en autokratisering, och högre inkomst minskar risken att en demokrati autokratiseras. (s. 111) Modellerna kan dock inte förklara majoriteten av sannolikheten att demokratiseras eller autokratiseras: de förklarar ungefär 22 procent av risken att autokratiseras, och hälften så mycket för risken att demokratiseras.

De har en utförlig diskussion om möjliga metodologiska problem med regressionerna, med till exempel random effects-modeller istället för fixed effects, och diskussion om dold heterogenitet med flera möjliga problem. (s. 114-115) Efter denna diskussion övergår artikeln, som är ganska lång, till bestämningsfaktorerna bakom den ekonomiska tillväxttakten, med fokus på demokratins roll. Att vara nära en övergång till autokrati igen har en negativ effekt på den ekonomiska tillväxten i demokratiska länder. (116-121) Att ha inhemskt "demokratiskt kapital" ackumulerat är bra för tillväxten.

Slutsatssektionen börjar med att beskriva det ömsesidiga beroendet mellan den ekonomiska tillväxten och demokratin:

"Our results suggest the possibility of a virtuous circle, of the type mentioned in the introduction. Having long-time democratic experience favors economic development through physical capital accumulation, which helps further consolidate democracy. This, in turn, leads to the accumulation of more democratic capital, with additional positive effects on income and democratic stability." (s. 123)

Det deskriptiva mönstret, när de klassificerar en stor mängd av världens länder i ett diagram med demokratisk erfarenhet på en axel och BNP per capita på den andra axeln, antyder att alla demokratier har ekonomisk utveckling, men att också en del autokratier har det. Demokrati är då en tillräckligt men inte nödvändig orsak till ekonomisk tillväxt. (s. 123)
 


referens

Torsten Persson och Guido Tabellini (2009) "Democratic Capital: The Nexus of Political and Economic Change", American Economic Journal: Macroeconomics, 1:2, s. 88-126.

fotnoter

[1] Ett annat sätt att tänka på den här frågan är att som Kadivar, Usmani och Bradlow fokusera på den folkliga mobiliseringen i en autokrati -- den folkliga mobilisering som i sig kan leda till demokratisering.

[2] Deras makroekonomiska modell ser mycket kort ut som följer. produktionen BNP per gammal person, y, beror på produktivitet A och kapitalintensiteten k. Produktiviteten är A i autokratier och A + θ i demokratier. Varje ung person har inkomsten w. De unga personer väljer att spara k i period t-1 utifrån förväntningar om avkastning som också beror på θ, alltså skillnaden i produktivitet mellan demokrati och autokrati, och p, sannolikheten att landet kommer vara en autokrati i period t. Sannolikheten för ett regimbyte är χ som tar ett värde mellan 0 och 1. Sannolikheten beror på hur många av de gamla medborgarna som engagerar sig för att försvara demokratin, som i sin tur beror på deras avkastning av detta, b som beror på d och θk. d är det demokratiska kapitalet, som "reflects cultural forces related to history or geography that lead to an appreciation of democracy." (s. 94) Sannolikheten för autokrati avtar alltså med d och θ. d har en effekt på kapitalackumulationen indirekt, genom sannolikheten för autokrati p, men inte direkt. 

De menar att länder "sorterar sig" till autokrati och demokrati beroende på om θ är positiv (sortering till demokrati) eller negativ (sortering till autokrati). (s. 96-97) 

[3] De påpekar att den underliggande genomsnittliga förändringen i Polity IV när de kodar ett regimskifte (från 0 till 1 eller 1 till 0) är 8. (s. 100) Med så stora skiften är dikotomiseringen mindre kontroversiell än om skiftena hade varit mindre, om det hade varit en mängd fall som rörde sig från 0 till 1 eller liknande. 

[4] I introduktionen till regressionerna så beskriver de specifikationerna så här: "Some specifications include a number of fixed and time varying controls, xi,t, to reflect country- and time-specific probabilities of a coup or an uprise, corresponding to parameter χ in the model." (s. 107)

onsdag 27 november 2024

Ökar demokratisering den ekonomiska tillväxten?


En av 2000-talets stora debatter är ifall 1990-talets demokratiseringsvåg stannat av och kanske till och med vänts om: lever vi i ett autokratiseringens tidevarv? Det är inte minst det auktoritära Kina och dess framgångsrika ekonomiska utveckling som sätter dessa frågor på agendan. Nationalekonomerna Daron Acemoglu (MIT), Suresh Naidu (Columbia), Pascual Restrepo (Boston) och James A. Robinson (U Chicago) börjar sin artikel från 2019 med den väldigt tydliga rubriken "Democracy Does Cause Growth" med exempel på debattörer som uttrycker skepsis mot att demokrati skulle leda till förbättrad levnadsstandard och ekonomisk tillväxt. De citerar New York Times-krönikören Thomas Friedman från 2009: “one-party nondemocracy certainly has its drawbacks. But when it is led by a reasonably enlightened group of people, as China is today, it can also have great advantages. That one party can just impose the politically difficult but critically important policies needed to move a society forward in the 21st century.” Och de citerar den legendariske nationalekonomen Robert Barro från 1997: “More political rights do not have an effect on growth.”

Acemoglu med medförfattare hävdar förstås -- se artikeltiteln -- det motsatta. De studerar en panel med länder från 1960 till 2010 och menar att en övergång från ickedemokrati till demokrati leder till att BNP per capita är 20 procent högre 25 år senare, än vad den hade varit om landet hade förblivit en ickedemokrati. [1]

De använder en rad olika metodologiska approacher för att visa att detta huvudresultat inte är känsligt för specifikation. Den första strategin är att använda en linjär, dynamisk modell med land-fixed effects och autoregressiv dynamik, alltså med laggade värden från BNP-tillväxten själv. Den andra strategin är en semiparametrisk regression där själva övergången till demokrati också görs till ett utfall av tidigare BNP-tillväxt. Den tredje strategin använder en instrumentvariabel-approach för att komma undan problemet med endogenitet och uteslutna variabler som varierar över tid. Deras IV-strategi bygger på faktumet att demokratisering tenderar att ske i vågor, som Huntington (1991) påpekade, där vad som händer i den omgivande regionen påverkar vad som sker i landet.

De gör också en mekanismanalys där de undersöker genom vilka mekanismer demokratin påverkar tillväxten. Resultaten är inte lika starka som för BNP självt, men antyder att det sker genom ökade investeringar, ekonomiska reformer, bättre skola och sjukvård, och minskade sociala konflikter.

Vad är då demokrati och demokratisering i deras modeller? De menar att olika demokratiseringsindex har mätfel och att det därför är bättre att använda ett index av index. Detta tar de från Papaioannou och Siourounis (2008), och det tar in information från olika källor som Freedom House och Polity IV, och klassificerar ett land bara som demokratiskt när det är klassat som sådant i flera av källorna. Grundsteget är att Freedom House klassar landet som "free" eller "partially free" och att landet har ett positivt värde på demokrati i Polity IV. Om någon eller båda av dessa källor saknar information, så använder de dataset från Cheibub, Gandhi, and Vreeland (2010) eller från Boix, Miller, and Rosato (2012).

Med deras mått var 31,5 procent av de 184 länderna i samplet år 1960 demokratier, och år 2010 var andelen 64,1 procent. Samplet innehåller 122 demokratiseringar och 71 tillbakagångar. [2] De gör en intressant poäng om sin relativt omfattande kodning av demokratisering, som de exemplifierar med Argentina. Argentina demokratiserades 1973 men 1976 inträffade en militärkupp och militärjuntan hade därefter makten från 1976 till 1983, efter vilket landet demokratiserades igen.Papaioannou och Siourounis kodar i sitt dataset bara 1983 som demokratisering i Argentina, eftersom den blev varaktig, men Acemoglu et al kodar både 1973 och 1983, med 1976 kodat som en tillbakagång.

Deras första "dynamiska" modell är:

y_ct = βD + ∑ γ_j y_ct-j + α_c + δ_t + e_ct

där y_ct är logaritmerad BNP per capita (y) i land c år t och D_ct är det dikotoma måttet om landet är demokrati eller inte. α_c är land-fixed effects och δ_t är års-fixed effects. ∑ av γ innehåller p antal laggar av BNP per capita. (Jag lyckades inte få in p i layouten av ekvationen, men ∑ går alltså från j=1 till p.) Här för de ett intressant resonemang om hur länder som demokratiseras och inte demokratiseras har olika trender av BNP per capita innan demokratiseringen sker eller inte sker. Detta beror både på att demokratisering blir mer sannolikt efter en ekonomisk kris, och eftersom både demokratisering och BNP per capita påverkas av faktorer som varupriser, jordbruksproduktivitet och teknologi. Faktumet att approachen med instrumentvariabler ger liknande resultat som den linjära dynamiska modellen stödjer i alla fall, säger de, slutsatsen att de lyckas få bort problemen med "selektion till demokratisering" genom sitt användande av laggar av BNP och land-fixed effects. (s. 58) [3]

De dynamiska regressionerna visar, föga förvånande, att BNP per capita är en starkt persistent variabel: koefficienten för BNP p/c föregående år på BNP p/c i år är 0.973. Demokrativariabeln har också en positiv och signifikant koefficient, om 0.973 den med men med större standardfel. De tolkar detta som att en bestående övergång till demokrati ökar BNP per capita med 1,97 procent året efter, med 2,9 procent två år efter, och så vidare. De beräknar den totala kumulativa effekten av en permanent övergång som:

β

--

1 -  ∑ ^p _j=1 γ_j

där de plockar β och γ ur beräkningarna i tabell 1, modellen med en lagg. Med dessa beräkningar ger ekvationen att en permanent övergång till demokrati ökar BNP per capita med 35,6 procent på lång sikt, och efter 25 år med 17,8 procent med standardfelet 5,7 procent. Om de istället tar β och γ ur en regression med två laggar så blir den beräknade långsiktiga effekten av bestående demokratisering 19,6 procent. De föredrar dock en regression med fyra laggar, där koefficienten β är 0,787 och den långsiktiga effekten är 21,2 procents ökning av BNP per capita med ett standardfel om 7,2 procent. Figur 2, som jag klistrat in ovan, visar dessa beräkningar. [4]

De har en mängd robustness checks. En är att skilja på länder beroende på deras initiala BNP per capita, alltså nivån som rådde år 1960. De delar in samplet i kvintiler utifrån denna nivå men effekterna håller. Nästa robustness check är att försäkra sig att resultaten inte drivs av specifika utvecklingar kring Sovjets fall. Detta kontrollerar de för genom interaktioner med en dummy för Sovjet och Sovjets satellitstater. Också med denna koll är resultaten liknande: den långsiktiga effekten av demokratisering blir 24,9 procent. (s. 70) Robustness ckeck tre och fyra är att kontrollera för föregående handelschocker, finanskriser och demografiska chocker. I ett Online Appendix har de också ytterligare robustness checks, inklusive ifall resultaten håller med andra mått på demokrati, vilket jag tycker är väldigt intressant. (s. 71) I Appendix gör de också en Appendix där de tar bort outliers, definierat som standardiserad residual över 1.96 eller under -1.96, eller med Cook's distance över 4/N.

Artikeln har egentligen ganska lite substantiell diskussion om demokrati, vad det betyder och varför det spelar roll för ekonomisk tillväxt, och väldigt mycket metodologisk diskussion. De kritiserar sin egen huvud-approach för att vila för tungt på antagnadet om linjära förhållanden mellan variablerna, och går därför i sektion IV vidare med semi-parametriska estimat. (s. 72ff) I sektion V använder de en instrumentvariabel-approach som, som nämnt ovan, bygger på de regionala vågorna av demokratisering. (s. 78ff)

Efter 10 sidor av instrumentvariabelberäkningar, kommer artikeln till mekanismerna. Här beräknar de modeller som:

 m_ct = βD + ∑ γ_j y_ct-j + ∑ η_j m_ct-j + α_c + δ_t + e_ct

 där m_ct är en eller annan mekanism genom vilken demokrati kan påverka BNP: investeringarnas andel av BNP, TFP, Giuliano et als (2013) index på ekonomiska reformer som är på en skala mellan 0 och 100, handelns andel av BNP, andelen skatter i BNP, andelen barn som går i grundskolan eller högstadiet, barnadödlighet, och social oro. De kör modellerna med sin within-estimator, med 2SLS, och en IV-estimator. I alla varianter får de fram att demokratin ökar sannolikheten för ekonomiska reformer, höjer skatteuttaget, ökar barnens skolgång, och minskar barnamortaliteten. De kommenterar: "Overall, these results suggest that democracy might be working through a number of channels. In particular, democracies seem to enact economic reforms that are conducive to growth. Democracies also seem to raise more taxes and invest more on public goods related to health and schooling,
which may contribute to growth. In addition, democracy seems to reduce social unrest, which could also have a positive impact on economic growth." (s. 89)

Sektion VII vänder på steken och ser på ifall demokratin bara har en positiv effekt på ekonomisk utveckling givet att man redan har en viss nivå av ekonomisk och social utveckling: proxyn för detta är andelen av befolkningen som har secondary school-utbildning. Det finns en positiv interaktion här men den är svårtolkad, säger de. De föredrar tolkningen att med mer humankapital minskar fördelningskampen, vilket gör demokratin mer stabil. (s. 93-96)

I slutsatssektionen, som är mycket kort, betonar de studiens relativt preliminära status och pekar på behovet av mer forskning:

"Taken together, our results suggest that democracy is more conducive to economic growth than its detractors have argued and that there are many complementarities between democratic institutions and proximate causes of economic development. Work using cross-country and within-country variation to shed more light on how democracy alters economic incentives and organizations and to pinpoint what aspects of democratic institutions are more conducive to economic success is an obvious fruitful area for future research. An exploration of the possibly more complex interactions between political regimes and economic outcomes, incorporating, among other things, nonlinear dynamics, multiple regime types, and richer heterogeneous effects, is another important area of future inquiry." (s. 96-97)

 

referens

Daron Acemoglu, Suresh Naidu, Pascual Restrepo och James A. Robinson (2019) "Democracy Does Cause Growth", Journal of Political Economy 127 (1).

fotnot

[1] De åberopar (s. 49-50) fyra metodologiska problem för att dra sådana här slutsatser. Ett, "existing democracy indices are subject to considerable measurement error, leading to spurious changes in democracy scores that do not correspond to real changes in democratic institutions." Två, icke observerade skillnader mellan demokratier och ickedemokratier gör att man inte kan dra kausala slutsatser utifrån tvärsnittsregressioner som Barro (1996, 1999) gjorde, utan man behöver difference-in-differences-metoden eller paneldata med fixed effects. Tre, en demokratisering föregås ofta av en dipp i BNP-tillväxten, och detta måste man ta hänsyn till i sin ekonometriska specifikation; t ex så bryts ju därmed antagandet om parallella trender som man gör i DID-metoden. Fyra, lite otydligt så säger de att "even if we control for country fixed effects and GDP dynamics, changes in democracy could be driven by time-varying unobservables related to future economic conditions, potentially leading to biased estimates."  

Längre fram i artikeln när de diskuterar hur artikeln relaterar till tidigare forskning fäster de verkligen stor vikt vid den till synes väldigt enkla frågan om att ha med laggar i regressionen:

"More recent work, including Rodrik and Wacziarg (2005), Persson and Tabellini (2006), Papaioannou and Siourounis (2008), and Bates, Fayad, and Hoeffler (2012), estimate positive effects using panel data techniques, although Murtin and Wacziarg (2014), Burkhart and Lewis-Beck (1994), and Giavazzi and Tabellini (2005) estimate insignificant effects on growth using similar strategies. These and other papers in this literature differ in their measure of democracy and choice of specifications and neither systematically control for the dynamics of GDP nor address the endogeneity of democratizations. Although some of the papers in this literature control for lags of GDP in some of their specifications (e.g., Persson and Tabellini 2006; Papaioannou and Siourounis 2008; Murtin and Wacziarg 2014), they do not emphasize the importance of GDP dynamics and the bias that results from not appropriately controlling for the dip in GDP shown in figure 1. The failure to recognize this point may, in fact, explain the divergent results in the literature: because growth rates are less serially correlated than GDP, contributions that focus on growth as the dependent variable tend to find positive effects, while studies that estimate models in levels generally find no effects—unless they model the dynamics of GDP as we do." (s. 52) 

[2] En intressant teknisk men också substantiell fråga är: "The major difference between our measure of democracy and that of Papaioannou and Siourounis (2008) is that theirs considers only permanent transitions to democracy. By considering only democratizations that are not reversed, their index encodes information on the future state of democratic institutions, which exacerbates the endogeneity concerns when it is included as a right-hand-side variable in growth regressions. Instead, we code both permanent and transitory transitions to democracy and nondemocracy. For example, our measure of democracy indicates that Argentina had a short spell of democracy from 1973 to 1976, when it held general elections for the first time in 10 years. This spell was inter-rupted by a military coup in 1976, which put a series of military dictators in power until 1983—a period we code as nondemocratic. Argentina returned to democracy again in 1983, when the collapse of the military junta gave way to general elections. While we code all such transitions, Papaioannou and Siourounis code only the permanent transition to democracy in 1983." (s. 55)

[3] Det är något roligt med hur grundligt skriven om enkla saker artikeln är ibland, som att den är läroboksmaterial. De säger att "Under assumption 1 and stationarity, equation (1) can be estimated
with the standard within estimator", och i en fotnot förklarar de ganska utförligt within-estimatorn -- som alltså undersöker variationen inom landet över tid, eftersom land-fixed effects tar bort variationen mellan länder. (s. 58)

[4] De diskuterar Nickell bias i panelerna och presenterar också GMM-estimat baserade på Arellano och Bond (1991). Dessa ytterligare beräkningar är inte särskilt intressant här. (s. 62-65)