tisdag 31 januari 2023

Antik förmögenhetsojämlikhet

För en icke-antikvetare som jag börjar antik-forskarna Walter Scheidel och Steven J Friesens artikel från 2009 på ett mycket lovande sätt:

"As Roman economic historians have moved beyond concepts such as formalism and substantivism that exercised previous generations of scholars, questions of economic growth and performance have increasingly come to the fore." (s. 61)

Jag hade gärna haft lite diskussion om substantivismens insikter och tillkortakommanden här, men de skippar det och går rakt in på den "moderna" frågeställningen om den ekonomiska tillväxten. Som exempel på den nya tendensen pekar de på Ian Morris, R. Saller och Scheidels Cambridge Economic History of the Greco-Roman World (2007), liksom P Milletts kapitel "Productive to some purpose? The problem of ancient economic growth" (2001), några tidskriftsartiklar och flera kapitel i PF Bang, M Ikeguchi och HG Ziches antologi Ancient Economies, Modern Methodologies (2006). De menar dock att med undantag för historisk-sociologen Keith Hopkins har forskarna om antikens Rom lämnat problemet om det romerska imperiets ekonomis storlek till nationalekonomer: RW Goldsmith i Review of Income and Wealth (1984), Peter Temin med ett bokkapitel 2006, Angus Maddison i hans Contours of the World Economy (2007), och sedan Milanovic, Lindert och Williamsons klassiska artikel från 2011. Den kvantitativa forskningen om ojämlikhet i antikens Rom har varit ännu mer återhållsam: Milanovic i RoIW 2006, Robert Allen med ett kapitel 2009 baserad på Diocletianus "Price Edict" från år 301 e Kr, och så några antikhistoriker: AK Bowman i JRS (1985), RS Bagnall i JRS (1992) båda om senromerska Egypten, och om Rom mer allmänt S Friesen (2004) och W Scheidel (2006).

Målet med 2009-artikeln är tvåfalt: ett, att med en mångfald av metoder etablera "convergent range of estimates of the size of the economy (that is, the Gross Domestic Product) of the Roman Empire at the time of its putative demographic peak in the mid-second century C.E." Två, att undersöka hur dessa inkomster fördelades. Detta är en viktig fråga för romersk socialhistoria, säger de: "Were there just a few super-wealthy surrounded by a mass of relatively undifferentiated poor? Or were there middling groups and a more finely gradated continuum from wealth to indigence?" (s. 62)

Metodologiskt kopplar de ihop löner, priser, elit-förmögenheter och BNP per capita. Dessa variabler hänger ihop: värdet på den ena variabeln begränsar vilka värden de andra har. Om lönen är väldigt låg, så är det osannolikt att BNP/c är väldigt hög. (s. 62) De har också en rolig diskussion gentemot skeptiska antikhistoriker som tycker att de kvantitativa gissningarna involverar för mycket gissningar. (s. 63)

De menar att Romarriket genererade en årlig inkomst ekvivalent till 50 miljoner ton vete eller nära tjugo miljarder sestercer per år, att stat och lokal offentlig sektor bara tog hand om ungefär 5 procent av inkomsten, att de översta 1,5 procenten i inkomstfördelningen tog hem ungefär 20 procent av inkomsterna, att "economically ‘middling’ non-élite groups accounted for a modest share of the population (around 10 per cent) but perhaps another fifth of total income", och att den större delen av befolkningen knappt levde bättre än subsistens-nivån men ändå sammantaget hade inkomster över 50 procent av de totala inkomsterna. (s. 63)

Hur omfattande den romerska ekonomin var, kan skattas på tre olika sätt, säger de.

"One is from the expenditure or consumption side, by estimating how much would have been consumed and valuing these amounts in cash or real terms, preferably by expressing them in grain equivalent. Another way is from the income side, by estimating group-specific earnings, once again in cash or real terms. A third method, that to the best of our knowledge has never been employed before, is to predict historically plausible GDP totals from the relationships between significant indicators, such as the ratio of unskilled rural workers’ wages to mean per capita GDP and the ratio of per capita
subsistence to mean per capita GDP, both of which have recently been estimated for a number of historical economies." (s. 63)

Den tredje metoden innefattar att använda löne/BNP-ratios från moderna ekonomier, och lönen från romarriket, för att extrapolera Romarrikets BNP. Om man gör alla tre typerna av skattning, menar Scheidel och Friesen, minskar man godtyckligheten i skattningarna och gör osäkerheten tydlig. De sätter också en yttersta maximinivå för hur hög BNP/capita kan ha varit i en förindustriell ekonomi som den romerska, genom att använda Hollands BNP per capita år 1600, skattad (av Angus Maddison) till $1381 US-dollars i 1990 års penningvärde. Det är osannolikt att antikens Rom var rikare än så. (s. 64)

Beräkningar från utgiftssidan för antikens Rom började redan 1980 med Keith Hopkins beräkningar av den totala konsumtionen i Romarriket i vete-ekvivalenter. Han menade att ekonomin motsvarade en genomsnittlig levnadsstandard mindre än två gånger absolut subsistens-nivå (250 kg vete om året). Scheidel och Friesen är kritiska mot Hopkins approach: 250 kilo vete om året är inte tillräckligt, Hopkins antagna vetepris är för osäkert, man borde inte räkna in sådden i BNP som Hopkins gjorde, och fjärde problemet är Hopkins metod för ett steg från minimum-beräkningar till medel-beräkningar. Sedan 1984 har en rad nationalekonomer fortsatt på Hopkins projekt; den mest inflytelserika studien gjordes av Raymond Goldsmith som lade till utgifter för annat än mat/vete medan han behöll i princip samma befoilkningsestimat som Hopkins, 55 miljoner. Goldsmiths beräkningar användes också av Angus Maddisons i dennes mycket inflytelserika databas. Peter Temin räknade däremot med mycket lägre vetepriser, baserat på de låga priserna i kornboden Egypten. Dessa beräkningar handlade alla om år 14 e Kr, medan Scheidel och Friesen istället vill fokusera på perioden i mitten av 100-talet e Kr, före Antonine Plague. (s. 66) De menar att befolkningen i Romarriket då var runt 70 miljoner. Från befolkningsfrågan går de vidare med att diskutera det genomsnittliga vetepriset i imperiet, vilket är riktigt svårt. För att beräkna BNP per capita utgår de då också från Robert Allens konsumtionskorgs-approach.

För att beräkna BNP från inkomstsidan börjar de med att diskutera de två centrala komponenterna: (1) arbetsinkomster, och (2) icke-arbetsinkomster. Hopkins var redan inne på detta och menade att en genomsnittlig arbetare, inklusive kvinnor, barn och slavar, tjänade HS3,5 om dagen och arbetade 225 dagar om året. Till detta lade han 20 procent för att representera icke-arbets-inkomster: arrenden (rents), räntor, indirekta skatter. Antagandet om 20 procent baserade han på nationalräkenskaper för låginkomstländer på 1970-talet. (s. 70) Maddison använde Hopkins skattningar också här, med några justeringar: han skruvade ner sysselsättningsgraden, och skruvade upp eliternas icke-arbetsinkomster, men med samma inkomst per capita. Scheidel och Friesen menar att Hopkins/Maddisons inkomstbaserade estimat ger en alldeles för hög BNP per capita, och detta beror huvudsakligen på att Hopkins antagande om snittlönen är godtyckligt och för högt. De för in ett batteri av riktigt blandade referenser, på det pragmatiska sätt som väl är nödvändigt

"Representative base wages are unavailable outside Egypt and attested figures vary as much as the wheat prices discussed in the preceding subsection. A popular passage, Cicero’s Pro Roscio Comoedo 28, in an overtly rhetorical context, claims that an unskilled slave could hardly have brought in HS3 per day: apart from the possibility of rhetorical distortion, we cannot tell if this tally was supposed to refer to gross or net income derived from slave hire; if it was the latter, the high cost of living in
Rome (even for a slave) means that gross pay may well have been considerably higher. Dacian miners were paid HS28, 47, and 70 per month, the same as miners in Egypt: expressed in terms of 225–250 work days per year, this amounts to anywhere from HS1.3 to HS3.7 per work-day. This compares to daily wages of HS4 for Matthew’s parable of workers in a vineyard, a town scribe in Spain, a cistern supervisor in North Africa, and (plus bread) a worker in Pompeii. Daily wages for unspecified work reported in the Rabbinic tradition range from HS3.3 all the way to 32, with HS4 being somewhat com-
mon.34 The range of regions — with different price levels — and occupations involved makes it difficult to distill an average wage from these sources. Moreover, the only known actual wage series, from Roman Egypt, consistently indicates lower wages of HS1 or slightly more per day for unskilled rural workers." (s. 70)
Olikt Goldsmith och Maddison använde Temin egyptiska data för att beräkna en medellön. Han menade att medellönen i Egypten var 1 HS och och satte medellönen för imperiet till mellan denna egyptiska lön och en hög lön för Roms stad om 3-4 HS. Scheidel och Friesen är dock skeptiska till Temins medellön om 1,75 HS. De börjar istället om från början och konstaterar att majoriteten av befolkningen var självförsörjningsbönder, som inte nödvändigtvis hade samma inkomst som arbetarna. (s. 71)


Den tredje approachen baseras på Milanovic, Lindert och Williamson (2011). I deras sample med sex förindustriella ekonomier varierar relationen mellan inkomsten för en "landless peasant — that is, an unskilled rural labourer" mellan 50 och 76 procent av BNP per capita. (s. 72-73) Om man följer dem i att sätta arbetarnas inkomster till 30 procent över minimum-överlevnads-standard och använda vete-värden för att undvika pris-problemen, så får Scheidel och Friesen för Romarriket en medelinkomst för arbetarna om 436 kg om året och en BNP per capita på 574 till 872 kilo.

Från detta rör de sig till processen att jämka ihop estimaten med de olika metoderna. Utifrån detta får de det till att BNP per capita i 1990 års dollars var $620, $700 någonting. (s. 74)


Hur var det då med eliternas inkomster? De börjar med att diskutera statens andel, och menar att den bara var ungefär 5 procent av BNP, samma som Frankrike år 1700 och inom Holpkins spann om 5-7 procent. Totalt menar de att den offentliga sektorn var kanske 10 procent. De går vidare med att diskutera inkomsterna för specifika grupper inom eliten, som de superrika senatorerna. För grupper som riddare (equestrian) eller ordo decurionum är det svårt att veta ens hur många som fanns. (s. 77-79)


För att beräkna elitgruppernas inkomster varierar de en mängd antaganden för att nå rimliga estimat. Det är en riktigt teknisk artikel med många detaljer om hur beräkningarna gjorts, och de går också vidare med motsvarande diskussion för mellan-grupper. För att komma till ojämlikhetsestimaten så presenteras de i två Lorenzkurvor, besynnerligt nog i två olika diagram vilket gör det svårare att jämföra dem. Figur 2 nedan är den "optimistiska" tolkningen, med lägre ojämlikhet. De lägsta 20 procenten av befolkningen har här ungefär 10 procent av inkomsterna och den lägre halvan ungefär 25 procent; i den "pessimistiska" tolkningen har de lägsta 20 procenten ungefär 7,5 procent av inkomsterna och de lägsta 50 procenten ungefär 25 procent. Skillnaderna är alltså inte så stora: Gini-koefficienten är 0,42 i det "optimistiska" scenariot och 0,44 i det "pessimistiska". Detta är i mitten av Milanovic, Lindert och Williamsons spann om 0,24 till 0,64 i tretton historiska samhällen. (s. 86)

Det finns inga tidigare beräkningar av inkomst-ojämlikheten i Romarriket; däremot finns det en del för förmögenheter utifrån fastighets-register: "mostly from Roman Egypt, ranging from 0.43 for villagers in Karanis in the Fayyum in 308/9 C.E. and 0.44 for the alimentary register of Ligures Baebiani in 101 C.E. to 0.52 for the Fayyum village of Philadelphia in 216 C.E., 0.62 in Aphrodito c. 525/6 C.E., 0.64 for metropolitan landowners in Karanis in the Fayyum in 308/9 C.E., and 0.82 for a group of landowners in the Hermopolite nome in the mid-fourth century C.E." (s. 87)

I slutet av artikeln diskuterar de hur rimliga estimaten är. Mycket jämlikare än så kan Rom inte gärna ha varit, om inte Rom var mycket mer jämlikt än jämförbara historiska samhällen. (s. 88)

Den romerska medelklassen ("'middling' income groups") var liten, bara ungefär en tiondel av befolkningen, men med en ganska ansenlig del av nationalinkomsten, 16-27 procent. (s. 88-89) Detta säger något om konsumtionsmöjligheterna i antikens Rom. Frågan är också hur koncentrerade dessa "middling" grupper var till städerna i imperiet, och specifikt till metropolen Rom. De har också en rätt obegriplig polemik mot "overly schematic ‘binary’ visions of a Roman society divided into ‘rich’ and ‘poor’." (s. 90) De menar inte desto mindre att de arkeologiska bevisen för romerskt välstånd kommer från den rikaste tiondelen i Roms befolkning och att även utgrävningar och artefakter, eller papyri om ägandet av 1-2 slavar, från tänkta "small farms" egentligen kommer från "middling"-grupperna, och att den stora majoriteten är "inconspicuous" och nästan osynlig i de historiska materialen. (s. 91)*


Två år senare publicerade Geoffrey Kron en artikel om "The Distribution of Wealth at Athens in Comparative Perspective". Han började sin artikel med att konstatera att väldigt lite kvantitativ forskning på ämnet hade gjorts, och att mycket av forskningen hade baserats på spekulation.** För Rom har mer forskning gjorts, säger han och hänvisar till Scheidel och Friesen (2009). För Aten på 300-talet har J.K. Davies (Wealth and the Power of Wealth at Classical Athens, 1981) i alla fall gjort ett viktigt bidrag, utifrån tre antaganden: (1) det fanns ungefär 300 atenare med gods värda 3-4 talenter, (2) det fanns 1200 personer med gods värda mer än en talent, och (3) 9000 atenare möte kravet om 2000 dr som krävdes för att bli medborgare enligt Antipaters krav år 322, efter the Lamian war, när Antipater lanserade ett oligarkiskt styre i Aten. Kron är positiv till Davies beräkningar, men menar att befolkningen var 31 000 vuxna män snarare än 21 000.

Han diskuterar elitens förmögenheter utifrån olika 300-talskällor: Lysias On the Property of Aristophanes, Demosthenes, med flera författare. För de fattiga finns det färre belägg (s. 131); det här är en väldigt rolig käll-baserad diskussion om hur många fattiga det egentligen fanns i stan:

"I have taken into account Lysias' speech 34 (Against the Subversion of the  Ancestral Constitution) delivered in 403 ВС against the motion of Phormisius, which proposed disenfran chising Athenians without any land (which I interpret to include garden or house plots, and certainly not  just agricultural land). Dionysius of Halicarnassus informs us that this motion would have disenfranchised about 5,000 citizens. This figure is probably only a rough estimate, and the population in the late Fourth  century may have increased somewhat since 403. Nevertheless, Hansen is probably right to assume a rela tively stable population, and the proportion of landless Athenian citizens is also likely to have declined as  Athens recovered, so I will assume that we can take 5,000 as a tentative estimate of the number of adult  male citizens with no landed wealth in the mid-4th century as well." (s. 131)

Vad var gränsen från dessa små-ägare till de som inte hade några fastigheter alls, utan bara lösöre? Det är godtyckligt men Kron väljer en "konservativ" gräns om 100 dr. Belägg om huspriser säger att få hus kostade mindre än 100 dr och att de flesta billiga hus kostade 200-300 dr. Krons resulterande estimat för total förmögenhet i Aten på 300-talet är 75 967 000 drachmer, vilket blir 12 661 talenter. Delat på 31 000 vuxna manliga medborgare blir detta en medel-förmögenhet per vuxen man om 2 451 drachmer. (s. 132) Av någon anledning menar Kron att det stödjer hans estimat att de visar att medel-förmögenheten i 300-talets Aten var samma som i Florens år 1427 (utifrån Herlihys studier av catasto-skatten där): är det inte snarare märkligt att Aten över 1000 år före cataston skulle ha nått samma medel-förmögenhet som renässansens Florens? I vilket fall, så konstaterar Kron att hans huvudfokus är fördelningen, inte medel-förmögenheten. Lorenzkurvan för förmögenheterna visas i diagrammet nedan, där Aten på 300-talet jämförs med Florens 1427, England 1911 och USA 1953-54. Gini-koefficienten för Attica/Aten ca 321 f Kr är 0,708, att jämföra med 0,788 i Florens år 1427. Topprocentens andel av förmögenheterna är enligt Kron 30,9 procent, och toppdecilens andel 60,2 procent. 

 

Referenser

Geoffrey Kron (2011) "The Distribution of Wealth at Athens in Comparative Perspective", Zeitschrift für Papyrologie und Epigraphik, Bd. 179 (2011), pp. 129-138

Walter Scheidel och  Steven J. Friesen (2009) "The Size of the Economy and the Distribution
of Income in the Roman Empire",
Journal of Roman Studies 2009, s. 61-91.

Noter

* I slutsats-sektionen har de också en intressant kommentar om nya studier som hann komma ut för sent för att kunna diskuteras i artikeln: "Two relevant studies came to our attention too late to be discussed here. P. F. Bang, The Roman Bazaar (2008), 86–91 estimates the GDP of the Roman Empire, at 60 million people, as 30m tons of wheat equivalent or HS13.7bn, for a per capita mean of 500 kg or HS229, somewhat lower than our own estimates of c. 680 kg or c. HS260. Conversely,
E. Lo Cascio and P. Malanima, ‘GDP in pre-modern agrarian economies (1–1820 AD): a revision of the estimates’, Rivista di Storia Economica (forthcoming), put Roman per capita GDP at $1,000 in 1990 Geary-Khamis dollars, about one and a half times as much as in our own calculation."

** Här hänvisar han till arbeten av L. Foxhall (1992) och R Osborne (2007).

Förhistorisk och antik förmögenhetsojämlikhet


Ett stort forskningslag lett, om jag förstår det rätt, av Timothy Kohler vid arkeologiska institutionen vid Washington State University och Samuel Bowles vid Santa Fe Institute, publierade 2017 en kort artikel i Nature är de beskrev förhistorisk ojämlikhet. De börjar sin artikel konventionellt: att förstå förmögenhetsspridningen säger något om hur samhället fungerar och om förutästtningar för social rörlighet. Men det har varit svårt att studera ekonomisk ojämlikhet i samhällen för vilka vi inte har skriftliga källor, "which adds to the challenge of placing current wealth disparities into a long-term perspective." De är kritiska mot arkeologiska proxies för förmögenheter som varor som folk fått med sig i graven (burial goods) eller exotiska eller dyra tillverkningsvaror i utgrävda hushåll eftersom den första inte säger något om hushåll, och den andra " is confounded by abandonment mode and other factors." Kohler et al föreslår istället att man ska använda Gini-koefficienter för hus-storlekar som mått och lägger fram sådana för en rad samhällen i Eurasien och Amerika.

"We argue that the generally higher wealth disparities identified in post-Neolithic Eurasia were initially due to the greater availability of large mammals that could be domesticated, because they allowed more profitable agricultural extensification, and also eventually led to the development of a mounted warrior elite able to expand polities (political units that cohere via identity, ability to mobilize resources, or governance) to sizes that were not possible in North America and Mesoamerica before the arrival of Europeans,. We anticipate that this analysis will stimulate other work to enlarge this sample to include societies in South America, Africa, South Asia and Oceania that were undersampled or not included in this study." (s. 619)

De har data från 63 utgrävningsplatser eller grupper av utgrävningar, för den Gamla världen från ca 11 000 år sedan till 2 000 år sedan, och för Amerika från 3 000 till 300 år sedan. 

De menar utifrån etnografiska belägg samt nåt slags logiskt resonemang att ojämlikheten var låg bland jägar-samlare, som inte ackumulerade och inte hade mekanismer för överföring av förmögenhet mellan generationer. Bland jägare-samlare var embodied wealth (kroppsstyrka och -vikt, reproduktiv framgång osv) och relational wealth ("number of exchange or sharing partners, number of allies in conflict and size of kin networks") viktigare än material wealth, säger de.

Som förväntat är Gini-koefficienterna för jägar-samlar-samhällen som Kohler et al producerat, överlag lägre (median 0.17) än Gini-koefficienterna för jordbrukarsamhällen (0.35); jfr Figur 2 som jag klistrat in ovan. 

Figur 2 visar också (i den högra panelen) att ojämlikheten ökar med mer komplexa politiska formationer; som referenser för denna mekanism anger de Flannery och Marcus The Creation of Inequality (2012), ett working paper av Fochesato och Bowles, och Lenskis Power and Privilege: A Theory of Social Stratification från 1966. För Mesopotamien under den gammelbabylonska perioden var Gini-koefficienten för hus (n=106) hela 0.40. I Totihuácan under Xolalpan-fasen (400-500 e Kr) var däremot hus-Ginin bara 0.12! "Archaeologists increasingly consider this site to represent the capital of a ‘collective’ polity" (s. 620)

 

Varför divergerade Gini-koefficienterna i Gamla och Nya världen för 2500 år sedan? Förklaringen är intensifierat jordbruk i den Gamla världen, med användning av dragdjur som också producerade gödsel (vilket ökade avkstningen i skördarna) sekundärvaror som mjölk och textilier

"Although increasing agricultural production in areas such as southern Mesopotamia and Egypt required irrigation, in many other areas, such as northern Mesopotamia and Europe, plow animals acted as a multiplier for human labour and enabled the preparation of a much larger area for sowing than a farming family could have cultivated by hand. Because the use of manure is likely to be highest in plots immediately surrounding settlement areas, the importance of agricultural extensification for urbanization in these areas is demonstrated by a significant negative relationship between the degree to which cereals were manured (inferred from grain δ15N values) and site size beginning in the Late Chalcolithic period (around 4000 calibrated (cal.) bc). In addition to their contribution to farming extensification, large domesticated mammals also produced valuable manure and a number of  ‘secondary products’, such as milk and fibre.
Agricultural extensification in turn had consequences. First, it is likely that only richer households could maintain draft animals. Those households could profit from higher production and from renting labour of their animals to others, strengthening the correlation between wealth and income. Extensification probably increased agricultural surpluses averaged across all households in a society, raising the maximum attainable inequality or the inequality possibility frontier. Finally, extensification is land-hungry, eventually resulting, in the Old World, in a class of landless peasants that was larger than in the pre-Columbian Americas. These processes increased inequality by operating on both ends of the wealth distribution, increasing the holdings of the rich while
decreasing those of the poor." (s. 620-621)
Kina verkar vara ett undantag: ojämlikheten ökar där, liksom i resten av Eurastien, fastän de inte började använda dragdjur förrän runt 2000 f Kr. Det tyder på att "food on the hoof" också var viktigt för att öka förmögenhetsojämlikheten: även innan de började använda dragdjur hade de tama grisar.

Kort efter 3000 år efter introduktionen av odling utvecklade många eurasiatiska samhällen brons-metallurgin och hästburen krigsföring.

"The emergence of a new mounted warrior elite contributed directly to higher Gini coefficients given their large rich houses and indirectly through territorial conquests that greatly increased polity scale. Horses and pack animals (including camels in some areas) were potent offensive weapons allowing successful polities to expand further than was possible in the New World. All 30 of the largest states and empires between 3000 and 600 BC were in the Old World." (s. 620)
Växande förmögenhetsojämlikhet var associerat med större boplatser (settlements) och regional befolkningstäthet (belägg presenteras i Supplement 5), och antagligen också med större ekonomisk specialisering och långdistans-handel.

I slutsatssektionen menar Kohler et al att det behövs mer forskning om hur pålitlig hus-Ginin är som mått på ojämlikhet. Men antagligen är det ändå så att förmögenhetsojämlikheten är högre idag än vad den var i förhistoriska samhällen.

 

Pertev Basri och Dan Lawrence, arkeologer vid universitetet i Durham, fortsatte, kan man nog säga, på den forskningsagendan i en artikel i Cambridge Archaeological Journal 2020. I introduktionssektionen refererar de till ett uppsving av ojämlikhetsforskning på sistone (Hardoon 2015; Piketty och Zucman 2014) men också, mer oväntat för mig, att "Investigating how different forms of inequality arose and were sustained through time has been identified as a central question for the discipline of archaeology (Kintigh et al. 2014)." Basri och Lawrence använder Kohler et als (2017) metod om Gini-koeffiienter för hus-storlekar för att undersöka ojämlikhet i Mellanöstern från neolitisk period till järnåldern. "During this period we see the emergence of the earliest cities, states and empires, and our dataset therefore allows us to make statements regarding the relationship between social and political complexity and inequality." Mönstren blir mindre tydliga när man kollar på en enda region över tid, istället för den extremt breda kollen som Kohler et al gjorde. Så här introducerar Basri och Lawrence litteraturen ur ett metodologiskt perspektiv:

"Tax, inheritance and land-holding records can be used to estimate inequality at particular points in time as far back as the Middle Bronze Age in southern Mesopotamia (Scheidel 2018, 48), but cannot provide the sorts of long runs of comparable empirical information needed to examine inequality systematically through time. Material culture proxies of wealth, such as burial goods, monuments and prestige material assets (e.g. high-status pottery, jewellery, personal items) are only available within societies expressing a certain level of social complexity, and thus exclude many different groups and communities from any study. Furthermore, as items such as grave goods most likely possessed non-utilitarian functions and derived their values from the specific concerns of cultural groups and even individuals, it would be difficult to compare them under the umbrella of a cross-cultural study (Papadopoulos & Urton 2012).
Although it is difficult to prove empirically, one might also suspect that the analysis of burial goods in particular would privilege elite burials over commoners simply as a result of differences in preservation. At a larger scale, Leppard (2019) has used a combination of agricultural suitability indices and Piketty’s theoretical work on modern societies to assess inter-regional inequality between social groups in the Mediterranean.
In contrast to the approaches taken above, Kohler et al.’s method is based on a simple assumption; that the relative size of a domestic dwelling can be used as a proxy for wealth (Kohler et al. 2017; Kohler & Smith 2018). This assumption not only provides an easily comparable unit of measurement, thus allowing cross-cultural analysis, but it is also in theory much more suited for archaeological sites and communities." (s. 690)
Kohler et al går all in på relativ husstorlek som mått på ojämlikhet, både i sin artikel i Nature och i sin edited volume Ten Thousand Years of Inequality från 2018, och Basri och Lawrence diskuterar på ett intressant sätt möjliga problem med denna metod. Hur plats, material och arbete ordnades i en neolitisk by kan varit väldigt annorlunda än i en stad (urban centre) under järnåldern. Men det finns ett par studier som visar att hus-storlek är korrelerat med andra tecken på hög ställning:

"Significant ethnographic and archaeological evidence from the Middle East suggests a strong relationship between the socio-economic status of individuals and the size of their domestic buildings (Daviau 1993, 34–7; Schloen 2001, 7–23; Yassur-Landau et al. 2011, 19–25). A recent study has also found a strong correlation in Gini values based on house size and other data types, such as storage space and burial goods (Fochesato et al. 2019)." (s. 691)

Ännu ett problem med metoden är dock att metoden inte tar hänsyn till att huset kommer vara olika värt beroende på var i bosättningen det ligger. Veenhofs (1996) studie av antika köpekontrakt i Mellanöstern har visat prisskillnader på huset beoende på läge i staden. Ett annat, antagligen mindre problem är att nomader inte går att studeras med denna metod. Det i mitt tycke största problemet med metoden är ett annat: att det i princip bara studerar skillnaden mellan household heads och inte beaktar skillnaden i sammansättningen av hushåll mellan olika hushåll: hur många bor i varje hushåll, vad är fördelningen barn/äldre/tjänare/slavar, etc, osv.?

"Kohler et al.’s methodology does not capture the existence of those without homes of their own, including those in extreme poverty and slaves. The prevalence of slavery, including debt peonage, in the Bronze and Iron Ages in the Near East is well documented within the textual records of the period (Van de Mieroop 2007, 106–8). Even if we ignore such social realities, we cannot ignore the fact that if there is a relationship between household size and relative wealth, the size of the domestic building can only be said to represent the wealth of its owner(s) or rent-paying tenants and not slaves who had minimal access to economic capital and were in fact classified as property (Van de Mieroop 2007, 107). This means that Gini coefficients based on house sizes systematically exclude the lowest classes of people and therefore would generally underestimate inequality at any given point. This would be of limited concern for cross-cultural comparison if the proportions of the groups not captured by the method (slaves, nomads, very low status individuals) remained the same across time and space, but this is very unlikely to be the case." (s. 691)
Basri och Lawrence kommer ändå använda denna metod, men påpekar att tolkningarna bör göras med en nypa salt, med tanke på metod-problemen.

Deras data kommer från publicerade fakta om utgrävningar "with a representative number of completely exposed contemporary domestic buildings" (s. 691). De har satt en godtycklig gräns om minst 10 utgrävna hus för att göra en beräkning, en datapunkt. För små platser där hela bosättningen grävts ut har man däremot bara satt gränsen till fem hus. Totalt utgörs datasetet av 54 Gini-beräkningar från 36 platser; vissa platser, som Çatalhöyük och Marki Alonia, observeras flera gånger.


Det finns olika biases i datat orsakat av var arkeologer har jobbat någonstans. Den bibliska arkeologin innebär en god representation för järnåldern i Levanten, medan södra Turkiet framför allt representeras av neolitiska utgrävningar. Basri och Lawrence har fått inkludera platser från en ganska stor region, inklusive hela the Fertile Crescent, för att få tillräckligt många platser, men menar att regionen var "broadly coherent" från den yngre stenåldern och framåt. (s. 694) För en del utgrävningar finns varje hus storlek publicerat, men för andra har Basri och Lawrence skapat värdena genom att analysera "published architectural site plans". Gini-värdena räknades ut med ineq-paketet i R. Ett intressant metodproblem är att de inte kunnat inkludera eventuella övervåningar. Courtyards är också ett problem: hur starkt associerade var de med ett särskilt hus? (s. 695) Ett tredje mätproblem är palats, som i Mellanöstern inte bara var bostäder för den härskande klassen utan också offentliga regeringsbyggnader och som sådana också kunde inkludera verkstäder och lager. För bosättningar med palats gör Basri och Lawrence därför två olika beräkningar, med olika sätt att behandla palats. De gör också en beräkning helt utan palats, vilket de har som standardberäkning men som alltså ska ses som en minimum-skattning av förmögenhetsojämlikheten. Figur 2 nedan visar ojämlikheten över tid med palatsen inräknade.


Bosättningar på upp till 5 hektar klassificeras som små, 5-20 hektar "Medium" och 20 hektar eller mer som stora. Detta baseras på forskning som visar att boplatser större än 20 hektar var ovanliga före bronsåldern. (I diagrammet visas Loess-utjämnade värden för trenderna med en span om 0,75; Kohler et al använde 0,5.) Både med och utan palats ser man en ökad ojämlikhet i hus-storlek över tid, och värdena i Figur 2 (alltså med palats) är liknande de för "Gamla världen" i Kohler et al. Det finns fler platser med väldigt låga Gini-värden i Basri och Lawrence dataset än i Kohlers, Variationen är lägre under (den yngre) stenåldern än senare. Beräkningarna med palats är ungefär 10 punkter högre än de utan palats.

Arkeologer har länge tänkt att större städer var associerat med större ojämlikhet; denna generalisering har nyanserats i nyare forskning men empirisk forskning från Mellanöstern (Lawrence et al 2016) och globalt (Morris 2013) visar att korrelationen kvarstår. Detta ser vi också i Figur 6:


Milanovic, Lindert och Williamson (2010) har utvecklat begreppet inequality possibility frontier, och visar att det samhälleliga överskottet är positivt korrelerat med den största möjliga ojämlikheten. För att bedöma ifall ett samhälle är påtagligt ojämlikt eller inte är det därför intressant att jämföra den faktiska ojämlikheten med den maximalt möjliga ojämlikheten, givet hurpass rikt eller fattigt samhället är. Det finns inga data på inkomster i förhistoriska Mellanöstern (men Leppard 2019 har försökt), så därför jämför Basri och Lawrence i Figur 7 genomsnittlig hus-storlek med ojämlikhet i hus-storlek. Metoden har förstås stora problem eftersom den genomsnittliga hus-storleken inte bara påverkas av välståndet utan också av klimat, byggnadsteknik, kultur m m.


Figur 7 visar en svag korrelation under stenåldern, men starkare under brons- och järnåldern. Basri och Lawrence menar att den politiska ekonomin förändrades över tid: överskotten av ökad jordbruksproduktivitet efter den yngre stenåldern togs i allt högre grad av de boende på större boplatserna. "The mechanisms by which this capture occurred could have included taxation and redistribution or more market-based systems, and seem to have benefited specialized non-agrarian workers as well as elites." (s. 699)

I slutsatserna menar de att några Gini-koefficienter för stenåldern ändå är oväntat höga: Tepe Gawra och den senare fasens Çayönü hade Ginis jämförbara med några platser år 1820 i Milanovic (2009) dataset. Ojämlikheten ökar över stenåldern, vilket stöttar tolkningar som Wright (2014) och Kujit et al (2011) gjort baserat på food-processing tools respetive gravar. Under bronsåldern ökar ojämlikheten, när de första städerna dyker upp i B och L:s dataset. Under järnåldern ökar ojämlikheten i städerna, medan rurala boplatser blir mer jämlika. Här introducerar de en väldigt intressant diskussion om skalor för mätandet av ojämlikhet

"The households at the small rural site of Tell es-Sa’idiyeh in Israel-Palestine are almost identical both in shape, size and arrangement, bringing to mind workers’ houses of Victorian period Britain (Timmins 2013). Tell es-Sa’idiyeh was part of the Kingdom of Israel during the occupation of Stratum V (Herzog 1997, 221, 232–4), alongside several other contemporary sites with relatively low Gini values such as Beer-Sheba, Tell en-Nasbeh and Tell Beit Mirsim (Herzog 1997; Herzog & Singer-Avitz 2016; Schloen 2001). As these kingdoms took control of larger and larger territories, socio-economic inequality was no longer being manifested just within a site but rather throughout the settlement system. Variation in social classes became concentrated in urban centres, while
rural sites became less diverse and more dependent on urban-based specialists and services. These changes coincide with a dramatic reorganization of the countryside in a process Wilkinson termed ‘the Great Dispersal’ (Wilkinson 2003; Wilkinson et al. 2005), when the Bronze Age tell-based settlement systems were replaced by new more dispersed sites. Such changes have been linked to shifts in land tenure (Wilkinson 2010), new market-based opportunities afforded by large-scale political units and deliberate planning by imperial elites (see papers in Düring and Stek 2018). The increased spatial scale of the polities involved also probably means that we are underestimating the level of inequality." (s. 700)

I tidens stora städer som Nineveh, Babylon, Assur och Hattusa, som alla saknas i samplet, var ojämlikhten antagligen mycket hög.

Lustigt nog säger de i slutsatserna att metoden är osäker men att resultaten "broadly conform to what we might expect given current (pre)historical narratives for the region" (s. 701), vilket ju inte får det hela att låta så spännande.. Mindre spännande än vad artikeln i själva verket är, kan jag tycka! De återkommer också till sin intressanta kritik av hus-ojämlikhet som mått ohc konstaterar att vidare forskning borde integrera hus-mått med andra mått, som från gravar till exempel. En del sådana studier har redan gjorts säger de, men ger bara ett exempel: Fochesato, Bogaard och Bowles (2019). Man borde också gå vidare med att integrera analysen av den produktiva kapaciteten och ojämlikheten, i enlighet med Milanovics Inequality Possibility Frontier. "While the use of modern
models developed for capitalist economies to investigate pre-capitalist, and even prehistoric, societies is not straightforward (see Algaze 2018 and Leppard 2019, both with comments), identifying how and
why such models do not apply can be productive in its own right. " (s. 702)

 

Referenser

Pertev Basri och Dan Lawrence (2020) "Wealth Inequality in the Ancient Near East: A Preliminary
Assessment Using Gini Coefficients and Household Size"
, Cambridge Archaeological Journal 30:4, 689–704
Timothy A. Kohler, michael e. Smith, Amy bogaard, Gary m. Feinman, Christian e. Peterson, Alleen betzenhauser, matthew Pailes, elizabeth C. Stone, Anna marie Prentiss, Timothy J. Dennehy, Laura J. ellyson, Linda m. nicholas, ronald K. Faulseit, Amy Styring, Jade Whitlam, mattia Fochesato, Thomas A. Foor och Samuel bowles (2017) "Greater post-Neolithic wealth disparities in Eurasia than in North America and Mesoamerica", Nature vol. 551, 30 november 2017.

Annat om gammal ojämlikhet

MIT Press om "The Archeology of Inequality", utifrån Cales Lalueza-Fox bok The Genetics of Inequality.

Matthew Shear i Smithsonian om "The Archeology of Wealth Inequality", utifrån boken Ten Thousand Years of Inequality.

torsdag 22 december 2022

Ett ekonomisk-historiskt perspektiv på persistensstudier

 “History never really says goodbye. History says, see you later.”

— Eduardo Galeano (2013)

 

De senaste 20 årens trend med persistensstudier har fått ett par översikter och jag har redan bloggat om den av statsvetarna Cirone och Pepinsky (2022). Här ska det istället handla om den översikt som ekonomisk-historikerna Leticia Arroyo Abad (CUNY) och Noel Maurer (GWU) publicerade förra året i Journal of Historical Political Economy. Om Cirone och Pepinskys studie var beskrivande till positiv, så utgår Abad och Maurer från vad de kallar en "hälsosam skepticism". Cirone och Pepinsky diskuterade metodologiska och analytiska problem och utmaningar i litteraturen, men betonade, kan man nog säga, möjligheterna: Abad och Maurer belyser mer vad persistensstudierna missar, tar ett bredare perspektiv, inte så mycket på persistensstudiernas egna villkor som Cirone och Pepinsky gjorde.

Abad och Maurers sätt att introducera persistenstemat och -forskningen är intressant! De utgår från institutionell teori:

"Social science assumes the persistence of human institutions. Rules that can change suddenly and randomly are no rules at all. For example, a constitution cannot shape political behavior if politicians can change the procedures that govern lawmaking at their whim. Studying institutions, therefore, means studying the conditions under which institutions are stable and the conditions under which they change. This realization, of course, dates back at least to classical Marxism in which history is seen as a progression from one equilibrium to another, with persistence within the stages. Douglass North’s seminal work (North, 1991) took this insight but removed the teleological elements and proposed a framework to explain how institutions might change — slowly! — over time. As economists and political scientists turned their interest towards the study of institutions, they inevitably began to ask questions about how institutions originated and why they change." (s. 33)

Medan Cirone och Pepinsky började sin diskussion av persistensstudier med AJR (2001, 2002), börjar Abad och Maurer med AJR:s omedelbara föregångare, Engerman och Sokoloffs jämförelse mellan Sydamerika och Nordamerika utifrån en analys av skillnader i vad för koloniala institutioner som skapades på de två kontinenterna. Hos Engerman och Sokoloff ledde olika klimat- och odlingsförutsättningar i Nord och Syd till att olika grödor odlades av kolonisatörerna i Nord och Syd, och att vissa grödor men inte andra odlades med slaveri, vilket genom slaveriets långsiktiga negativa effekter gjorde att dessa regioner idag är fattigare än de vars klimat och jord inte lämpade sig för bomull eller socker. "This line of inquiry was not new, but it led to the emergence of the modern persistence literature", säger Abad och Maurer och menar att AJR (2001) egentligen lade fram en ny version av Engerman och Sokoloffs hypotes. Hos AJR var det inte lämpligheten för vissa grödor som var avgörande, utan förekomsten av tropiska sjukdomar på 1500-1600-talen som gjorde att de europeiska kolonisatörerna valde att regera vissa regioner avlägset (och starkt ojämlikt) men andra med större delaktighet vilket gav bättre utveckling på sikt. Steg tre i persistensstudiernas utveckling var enligt Abad och Maurer att forskare insåg att om man ville mäta effekterna av "bra" och "dåliga" institutioner så skulle man få problem med att jämföra länder som i övrigt är olika, och då började forskarna istället använda mått på inom-statlig variation: mellan socknar, distrikt, valdistrikt etc. På 2010-talet tog det fart, men inte så mycket i ekonomisk-historiska tidskrifter som i nationalekonomiska. På 00-talet var bara runt 5 procent av historiska artiklar publicerade i NEK-tidskrifter persistensstudier, men på 10-talet snarare 15-20 procent.

Joachim Voth (2020) har delat in persistensstudierna i två typer: "apples to oranges"-studier som förklarar ekonomiska utfall idag med icke-ekonomiska orsaker förr, och "apples to apples"-studier som förklarar icke-ekonomiska utfall idag med icke-ekonomiska orsaker förr. Abad och Maurer går ganska rakt in på sin kritik:

"One problem with “Apples to oranges” papers is that the mechanisms are often ill-defined or ad hoc. As a practical matter it is extremely difficult to publish a paper that finds that a major historical event had no effect decades or centuries later. The lack of clear historically-grounded mechanisms, combined with publication bias, opens the possibility that the literature is leading us to believe that there is more persistence than actually exists. Publication bias means that persistence studies are already biased towards false positives. But without clearly-specified and historically-sound mechanisms, the scales
will be weighted even further towards misidentifying spurious correlations and overstating the actual degree of persistence." (s. 34-35)

Det låter som en helt korrekt bedömning. De har också specifika invändingar mot "apples to apples"-studier: hur vet vi att t ex tiden som en polsk by spenderade under ryskt styre påverkar väljarpreferenser mer, eller per capita-inkomster mer? Som Voth klargör är de kausala kedjorna också komplexa och blandar in en mängd variabler: "Does the history of Russian rule in Polish villages influence voting patterns through per capita income? The results of such studies can be hard to interpret unless the mechanisms are extremely well-specified." (s. 35)

Jag gillar väldigt mycket hur Abad och Maurer tänker på persistensstudier och vad de egentligen säger som fält. På ett sätt, säger de, är varje persistens-studie också en anti-persistens-studie: att händelse eller chock X år TX har en idag mätbar effekt, innebär ju att de institutioner som rådde år TX-1 avskaffats. Om koloniala institutioner bestämmer den ekonomiska utvecklingen, så betyder det att för-koloniala institutioner inte spelar roll på sikt, inte har persistens.* Ett annat exempel är Alesina och Fuchs-Schündelns (2007) artikel där de menar att DDR formade sina medborgares politiska preferenser på ett beständigt sätt, så att de en gång bodde i DDR även idag är mer positiva till statlig omfördelning etc än de tyskar som en gång bodde i BRD. Detta implicerar att det kvasi-sovjetiska styret i DDR formade folks preferenser och att preferenser från före andra världskriget alltså inte är persistenta, inte har ett eko idag.** Att jämföra BRD och DDR har också gjorts i en rad andra studier: om tillit, om attityder till migration idag, etc. Det finns också en motsatt studie, som betonar skillnaderna före Tysklands delning: Fritsch och Wyrwich (2016) menar att entreprenörskapet redan 1925 var starkare i det som tjugo år senare blev BRD, än i de regioner som blev DDR.

Ett annat sätt att hitta en "treatment", säger Abad och Maurer, är att använda de tämligen godtyckliga koloniala gränser som europeiska kolonisatörer gjorde. Cogneau och Moradi (2014) använder t ex uppdelningen av Togoland efter första världskriget för att studera effekterna av engelsk och fransk utbildningspolitik. Miguel (2004) använde den godtyckliga, rätlinjiga gränsen mellan Kenya och Tanzania för att studera statsbildning och identitet, och fann att tanzanisk politik lyckades överkomma förexisterande skillnader. I en europeisk kontext fann Backhaus (2019) ett liknande resultat i Polen: 1911 fanns där stora skillnader i utbildning mellan områden under rysk, österrikiskt eller preussiskt styre, men skillnaderna hade minskat 1931 och försvunnit 1961. Abad och Maurer sammanfattar: "In short, the arm of history may be long but it is not always strong." (s. 38)


Sektion två handlar om var ens historiska data kommer ifrån, och deras problem. Många persistensstudier av Afrika har utgått från den geografiska fördelningen av etniska grupper före koloniseringen för att kunna studera effekter av kolonialism och slavhandel på senare politiska och ekonomiska utfall. Man har ofta förlitat sig på antropologen George Murdock som 1959 publicerade en studie av etniska grupper i Afrika: kartan ovan, från Nathan Nunn, bygger på Murdock. Så här karakteriserar Abad och Maurer mottagandet av Murdocks studie när den kom: 

"The volume was described as “courageous”, “bold”, “influential”, “tour de force”, “provocative” but also “a special menace,” “dogmatic,” and “factually wrong.” The volume was criticized widely and harshly by linguists, historians, and anthropologists in terms that make an economics seminar seem warm and welcoming. Murdock cherry-picked work by botanists, creatively massaged demographic evidence, ignored historical work, disregarded post-war censuses, and contradicted anthropologi-
cal findings. Nor did he make it easy to dispel doubts about factual errors, generalizations, and selective use of sources as his book did not provide a comprehensive discussion of his sources — or even any footnotes at all." (s. 39-40)

Abad och Maurer citerar också en mängd kritiker på olika punkter; de drar inga uttalade slutsatser om implikationerna för de många persistensstudier som använt Murdocks data, men man kan nog läsa in att de är kritiska. De pekar också nöjt på att statsvetaren Paine (2019) tagit fram ett eget dataset för att konkurrera med Murdock.

I studier av Latinamerika har en mängd studier använt befolkningstäthet före Columbus och kolonisatörernas ankomst som en oberende variabel som formar en rad utfall idag: utbildningsgrad, inkomst per capita, tvångsarbete, ekonomisk utveckling, osv. Här finns det en mängd mätproblem:

"The problem is that estimating historical population figures for Latin America is a highly uncertain process at best, due to the lack of pre-Columbian records and the post-contact demographic collapse. The most common technique is to backcast from early colonial population counts. Doing so, however, requires an estimate of the rate of depopulation during the first century after the conquest. Estimations of that rate, however, are all over the map. For New Spain, “High Counters” assumed that the depopulation rate was over 90%; “minimalists” ran with a rate around 20%. These problems are compounded when scholars attempt to estimate the population of geographic units smaller than Viceroyalties. While we can connect different indigenous groups to historical geographical entities, the actual boundaries of these entities are blurry and do not correspond to the eponymous modern units. Compounding the problem, indigenous groups did not respect contemporary political borders. Any estimate of pre-Columbian population densities linked to a particular modern political unit embeds an army of assumptions." (s. 41)
De konkretiserar med en diskussion av Argentina och vad för data som egentligen finns där om befolkningstätheten under den förkoloniala perioden.

Den tredje sektionen handlar om de kausala mekanismerna. När jag läste Cirone och Pepinskys översikt över persistensstudierna blev jag lite förvånad över hur enkelt de lät persistensstudier komma undan utan att kunna förklara vilka de kausala mekanismerna är som länkar avlägsen orsak år T med samtida utfall år T+500. Abad och Maurer är mer ense med mig:

"Persistence studies need a convincing mechanism to explain what stops the effects of past events from dissipating. After all, people move, institutions change, and borders shift. Without mechanisms what you have is quantum persistence: spooky effects at a (temporal) distance.
Mechanisms can take multiple forms. To give a few examples, institutional inertia, cultural transmission, and (used loosely) agglomeration economies have all been proposed as plausible mechanisms. The question is not whether mechanisms are needed. Nor is the question whether such mechanisms can be demonstrated to be the only mechanisms that could explain persistence. Rather, the question is whether the proposed mechanisms will be well-specified and historically-grounded or vague and ahistorical." (s. 43)
De diskuterar tre slags studier som misslyckas med att presentera övertygande kausala mekanismer. Den första är en studie som förlitar sig på en teoretisk modell för att beskriva en hypotetisk mekanism, utan att ge historiska belägg för att mekanismen faktiskt fanns i verkligheten. En annan blandar ihop alternativa utfall med belägg för historiska mekanismer. En tredje presenterar plausibla mekanismer "but tortures history in the process". Som exempel på typ ett ger de Ashraf och Galors (2013) i sanning långsökta argument om att det är vår genetiska diversitet, som varierar mellan länder och regioner idag beroende på vad som hände under homo sapiens uttåg ur Afrika för ca 120 000 år sedan, som bestämmer variationer i ekonomisk utveckling i världen idag.

"Nonetheless, it remains unclear how genetic diversity translates into economic development. After all, human beings do not directly observe genetic diversity. Rather, people observe phenotypical variations, linguistic differences, ethnic fractionalization, or religious diversity. The evidence that genetic diversity produces differences that humans will care about comes from theory and animal studies. There are alternative explanations for their results — that they have identified a genetic pattern in Europe and East Asia, which also happen  to be the most densely-populated places in 1500 and the richest parts of the world today. In addition, their mechanism, if correct, generates implications
that are not obviously plausible. Would reducing Ethiopia’s genetic diversity (presumably without changing anything else about the country) really lead to economic development? Would encouraging (say) Ethiopians to migrate to Bolivia automatically do the same? The best that can be said about the long-term influence of genetic diversity on growth is that old Scottish adage: 'not proven.'" (s. 44)
Abad och Maurers bedömning verkar rimlig, och i en fotnot refererar de också till kritik från d'Alpoim Guedes et al (2013) om dataproblemen i Ashraf och Galors studie, och Gelmans (2013) "delightfully brutal take down of a prestigious paper that the author considered silly."

En annan studie på mycket lång sikt, om än inte lika lång som Ashraf och Galors, är Com et als (2010) “Was the Wealth of Nations Determined in 1000 B.C.?” De använder Atlas of Cultural Evolution för att koda ifall en region använde en viss teknologi år 1000 f Kr, år 0, och år 1500 e Kr. De använder data om var dagens befolkningar i olika länder kommer ifrån ursprungligen, alltså deras etnicitet, och menar att om land X idag har stor andel befolkning från region Y som år 0 använde en viss teknologi, så är det mer sannolikt att land X idag är rikt. Liksom med Ashraf och Galor är Abad och Maurer inte helt nöjda:

"One problem, however, comes from the fact that Putterman and Weil [om dagens länders befolkningars etniska ursprung] measure only post-1500 migrations. It is unclear, then, why the level of technology used in (say) Iberia in 1000 B.C. should determine technology use in 1500, given that few of the inhabitants of Iberia in 1500 descended from people who were there 2,500 years earlier. Nor should path dependence be accepted without some historical evidence that it operated: there are numerous historical episodes of catch-up in which societies quickly adopt innovations developed elsewhere. In addition, their sources and coding are heavily weighted towards technologies used in
Western Europe." (s. 45)

Ännu lite kortare lång sikt jobbar de studier med som följer Engerman och Sokoloff i att studera effekter av kolonialismen i Amerika. Dessa studier följer E och S i ämne, men använder mer finfördelade data och kollar på variationer inom länder.

"The most ambitious of these papers, Bruhn and Gallego (2012), classify contemporary subnational jurisdictions in terms of a combination of their pre-Columbian population density and their primary economic activities during the colonial era. They divide colonial activities into three categories:
good, bad, and ugly. Good places have no labor exploitation, bad places exploit native and “imported” labor, whereas ugly places exploit local labor simply because there is a lot of labor there to exploit. They then link these colonial institutions to modern economic outcomes. Their coding algorithm
produces some odd results. For example, Virginia and North Carolina are classified as “good,” which is bit puzzling in light of the savage slave systems that characterized both states during the colonial period. Similarly, Missouri receives a rating of “bad,” even though the first plantations did not appear in the state until it became part of the independent United States." (s. 46)

Bruhn och Gallego (2012) visade att regioner med vad de kallade "dåliga" institutioner på 1600-talet var fattigare idag, och de med "bra" institutioner är rikare idag. Det finns dock några undantag, menar Abad och Maurer: norra Mexiko och sydöstra Brasilien hade dåliga institutioner på 1600-talet men är relativt rika, medan det omvända gäller för norra Amerika.

"The conceptual problem with Bruhn and Gallego (2012) is that they do not identify the mechanisms which transmitted the effects of colonial activities to the year 2000. Rather, they confound outcomes for mechanisms. For example, they show that “bad” colonial activities in a region are correlated with modern-day under-representation in the lower house of the legislature. The problem is that modern-day under-representation cannot be a direct cause of modern-day lower income levels. Rather, the cause would be past under-representation that slowed past growth, leading to lower income levels of today. Their mechanism is plausible — although it is unclear why they only consider the lower house
in bicameral systems — but undemonstrated." (s. 46)

Dell (2010) är ett Latinamerika-papper som jobbar seriöst med mekanismerna. Dell utforskar effekterna av mita-institutionen, en form av tvångsarbete som spanjorerna använde för att driva silvergruvorna i Potosí.

"The proposed mechanisms were the system of land tenure, the provision of public goods, and market participation. The paper is meticulous and very well done, but the proposed mechanisms are somewhat questionable, historically speaking. It is not clear that the mita in its classic form persisted for very long. Historians have shown that the mita obligation changed over time. Indigenous populations challenged the institution by buying-out the obligation, baptizing children as females, and mass outmigration. As a result, the mita in 1700s was a very distant cousin to its form in 1578 (Abad and Maurer, 2019).
Dell’s primary mechanism relies on data showing that large-scale plantations (haciendas) became more common outside the mita catchment area. Dell posits that haciendas were good for economic development through three channels. First, they protected peasants from colonial exploitation. Second, after independence haciendas saw more productivity growth than non-haciendas because they enjoyed more secure property rights. Third, after independence haciendas were better able to mobilize for public investment in roads and schools. The causal mechanism therefore depends on two claims: (1) the Crown discouraged hacienda formation in mita areas; and (2) at least one of the three aforementioned channels operated after independence." (s. 47)
Abad och Maurer är inte övertygade av Dells påstående, grundat i historisk litteratur, att haciendorna utgjorde en konkurrent till den koloniala staten och dess mita vad gällde att rekrytera arbetskraft; A och M menar tvärtom att haciendorna ibland fungerade som arbetskraftsförmedlare till statens gruvor. A och M menar också att böndernas motstånd mot haciendornas expansion in i tidigare mita-områden efter Perus självständighet, visar att haciendorna inte var så mycket bättre som arbetsgivare än vad gruvorna var, som Dell menar och förutsätter. A och M ifrågasätter också de mekanismer genom vilka haciendorna enligt Dell sedan främjat tillväxt: investeringar i vägar och skolor.

Från Dell går de vidare till Banerjee och Iyer (2005) som också de ställer frågor om vilka effekter extraktiva koloniala institutioner har på ekonomin på lång sikt.

"They ask whether the colonial landlord system in British India had long-term effects. Under the landlord system, the British placed the local tax liability for a village or group of villages with a single person. The landlord, in turn, received the right to collect taxes from the occupants under his jurisdiction, subject to some legal protections. Independent India abolished the system in short order, unsurprisingly. After demonstrating a causal relationship between being under a landlord and outcomes over the next few decades, they proceed a bit like Sherlock Holmes, eliminating plausible mechanisms until one is left: a polarized and conflictual political environment created by peasant “memories of an oppressive and often absentee landlord class” (Banerjee and Iyer, 2005, p. 1210). Similarly, Iyer (2010) finds that whether an area was under direct or indirect British rule before independence has a persistent effect on the provision of public goods decades later, paying careful attention to the historical plausibility of the proposed mechanisms." (s. 48)
En tredje studie om detta är Acharya, Blackwell och Sens (2016) studie om slaveriets långsiktiga effekter i USA. De menar att i counties med fler slavar utvecklade de vita starkare rasistiska attityder, och dessa attityder har därefter överförts från generation till generation, så att counties med mer slaveri på 1850-talet ännu idag är mer rasistiska. Detta är en ganska rolig kommentar i förbifarten, som ändå är rätt fundamental: "Of course, the effect they find is marginal: anti-black attitudes spread throughout the nation and emerged in the North as well." (s. 49)

En rad andra studier har också byggt sin mekanism på kulturell överföring från generation till generation:

"Voigtländer and Voth (2012), for example, showed that medieval pogroms in Germany correlated geographically with multiple measures of anti-Semitic oppression and hostility after World War I: Nazi vote shares, anti-Jewish riots, the share of Jews sent to the camps, letters to Der Stürmer, and attacks during Kristallnacht in 1938. As would be expected from a model of cultural transmission, the association weakens with higher levels of migration and in the Hanseatic trading cities, whose economic base required a modicum of tolerance to function. Jha (2013) shows that medieval Indian trading cities, like the Hanseatic League, were far less likely to experience intercommunal violence in 1850–1950, an effect which continues after independence in weakened form. The mechanism is the existence of intergroup complementarities: that is, patterns occupational specialization by ethnicity (enforced and encouraged by community norms) that require intergroup cooperation to function. He carefully uses history to establish the existence of such institutions historically; he then uses 2005 household data to show that attitudes consistent with the mechanism have survived. The fact that his postulated effect survived for so long but weakened over time adds to the credibility of the results." (s. 49)

Chen et al (2020) menar att regioner i Kina med en tradition av att göra det kinesiska rikets examina idag har en starkare utbildningskultur: "They postulate that the need to pass the exams created pro-education traditions among elite families, which in turn passed those attributes on to their children and grandchildren. They cannot observe intermediate cultural variables, but they can and do observe
intermediate measures of elite social cohesion, which provides evidence for their proposed mechanism." (s. 49)

"Establishing mechanisms may be the next frontier.", konstaterar Abad och Maurer, som sagt lite i kontrast till Cirone och Pepinsky. Till och med Acemoglu själv har i ett medförfattat paper 2020 anmärkt att persistens-idéerna, "ideas based on institutional stasis" blivit väldigt populära trots att institutioner i verkligheten förändras ständigt. Abad och Maurers slutsats för mekanism-sektionen är väldigt rimlig och lovande:

"But we would argue that the primary way forward involved taking history more seriously. Identifying convincing mechanisms implies paying attention of the history “in the middle,” painfully constructing historical datasets, and sweating the details. A greater understanding of historical methods and more
collaboration with trained historians would be invaluable. Persistence studies could thereby both better identify real mechanisms and avoid another of the famous pitfalls in this literature: “the compression of history.” It is to this pitfall that we now turn." (s. 50)


fotnot

* De pekar på att James Robinson, R:et i AJR, förklarat Botswanas ekonomiska succé med förkoloniala institutioner som gjort att landet inte drabbats av de koloniala institutionerna så som AJR (2001) säger. 

** Voth (2020) dömer däremot i princip ut Alesina och Fuchs-Schundelns studie; för honom exemplifierar den studien det mer generella problemet med persistensstudier som ignorerar skillnader mellan enheter som föregår "the treatment", i detta fall kommunistiskt styre: "The assumption that assignment to treatment in the past is often as “good as random” is unfortunately often wrong. Implicitly, the Alesina and Fuchs-Schündeln paper assumes that pre-1945, East and West Germany were largely identical in attitudes – and hence, any differences that appear today must be the result of the Communist “treatment”. This assumption is prima facie sensible, in the absence of evidence to the contrary – after all, they had formed part of the same country since 1871. However, there is strong evidence that the area of Germany that became the GDR was already strongly different in a number of important dimensions prior to 1945 – church attendance was already lower, female labor force participation was higher, and electoral support for the Communists was higher in the East in the interwar period (Sascha O. Becker, Mergele, and Woessmann 2020). In other words, the ‘treatment’ of Communist rule and Soviet occupation may only have preserved or amplified pre-existing differences. This does not imply that there was no persistence – it implies that it was so strong in this particular case that even the cultural and social effects of a brutal, long-lasting dicatatorship did little more than to leave intact differences that existed long ago." (Voth 2020, s. 11)

referens
Leticia Arroyo Abad och Noel Maurer (2021) "History Never Really Says Goodbye: A Critical Review of the Persistence Literature", Journal of Historical Political Economy, 2021, 1: 31–68

Historiska persistensstudier

Inom ekonomisk historia, särskilt så som den praktiseras inom nationalekonomin, har studier av historisk persistens slagit igenom stort de senaste tjugo åren: medeltida pogromer bestämmer naziströstning på 1930-talet, plogens genomslag eller inte på stenåldern bestämmer variationer i jämställdhet mellan könen idag, digerdöden bestämmer det mesta, och så vidare. I senaste utgåvan av Annual Review of Political Science konstaterar statsvetarna Alexandra Cirone och Thomas B. Pepinsky att även i deras disciplin har persistensstudierna slagit igenom*, inspirerat av "the rise of quantitative approaches in economic history". De definierar persistens så här:

"we define historical persistence as causal effects that (a) operate over time scales of a decade or more and (b) explain spatial variation in political, economic, or social outcomes. The decision to set a decade-long time scale for long-term persistence is arbitrary, but it distinguishes historical persistence from analyses that explore short-run political dynamics or structural causal relationships without a historical component. The emphasis on spatial variation in outcomes, in turn, distinguishes historical persistence from general claims about the causal weight of history, such as the observation that Portuguese colonialism caused contemporary Brazil to be a Lusophone country. Our analysis of historical persistence sees the central analytical task as estimating the effect of spatial variables that operate over a substantial temporal distance." (s. 241)

Persistens-studierna använder kvantitativa metoder, och vill urskilja kausala effekter.

Persistens-vågen började med två "landmark essays" av Daron Acemoglu, Simon Johnson och James Robinson: AJR 2001 och 2002. De publicerades inte i statsvetenskapliga tidskrifter, men "these two essays quickly became standard reading among political economists, owing to their powerful demonstration of how historical data could be assembled to produce causal explanations for the contemporary distribution of political institutions across the world" (s. 242) Sokoloff och Engerman (2000) och andra hade gjort kvantitativa studier av kolonialismens långsiktiga politiska effekter, men vad som var unikt med AJR var att de kombinerade historiska data med " a framework for causal identification to estimate effects that operate at century-long time scales." Detta tillvägagångssätt blev centralt för -- definierar -- persistens-studierna. 

Cirone och Pepinsky har gått igenom fem nationalekonomiska och nio statsvetenskapliga tidskrifter och kodat artiklarna utifrån abstract till om det handlar om persistens eller ej. Inom nationalekonomi gick andelen persistens-studier från obefintlig till 5-10 procent vid 2010-talets början; inom statsvetenskap gick andelen över fem procent först 2016-17 och har sedan dess pendlat mellan 5 och 20 procent varje år. Studierna handlar om en mängd olika saker, men Cirone och Pepinsky identifierar ett par kluster.

Ett kluster följer direkt på AJR (2001, 2002) och handlar om kolonialismens långsiktiga effekter. Ett relaturat kluster handlar om effekterna av prekoloniala statsformer. Dessa sudier handlar oftast om globala Syd; ett undantag är Voglers (2019) studie av Polen. Ett tredje kluster handlar mer om globala Nord och handlar om ursprunget till och effekter av Förintelsen i Europa, och andra former av våld och masspolitik. Ett fjärde kluster handlar om "agglomeration and the infrastructural foundations of contemporary economic development." Ett femte kluster handlar om slaveriets långsiktiga effekter, i USA och Nord såväl som i Afrika söder om Sahara.

Vad gäller tidsskala är de mest långsiktiga persistensstudier de som handlar om ett par årtusenden, som Alesina et al (2011) om plogen under stenåldern. Nationalekonomerna skriver också i genomsnitt persistensstudier med längre tidsperspektiv än vad statsvetarna gör. Geografiskt sett så är spridningen ganska jämn: det finns många studier om Europa och Nordamerika, men också ganska många om Afrika söder om Sahara och Asien. Däremot handlar ganska få studier om Sydamerika eller Mellanöstern.


Efter beskrivningarna av persistensstudierna, så övergår Cirone och Pepinsky till en fråga som jag tycker är hyperintressant: hur och varför kan historiska orsaker ha bestående effekter? De typologiserar dessa förklaringar i två typer: equilibrium dependence och slow change. Så här förklarar de den första typen:

"Equilibrium dependence encompasses a set of causal processes in which some prior characteristic of a system affects its long-term equilibrium state. Such processes are commonly (if erroneously) lumped together under the terms path dependence or increasing returns, but Page (2006) distinguishes formally among concepts such as increasing returns, self-reinforcement, positive feedbacks, and lock-in. The distinguishing feature of equilibrium dependence is the existence of more than one equilibrium distribution of outcomes, with the equilibrium depending on past realized outcomes.
Importantly, however, it could be that in the long run there exists only one single distribution of outcomes, but that the outcomes at any particular time t nevertheless depend on previous outcomes. Page (2006) terms this outcome dependence. Equilibrium dependence implies outcome dependence, but the reverse is not true. Outcome dependence produces long-term persistence of historical causes on subsequent outcomes due to the slow rate of change of initial conditions over time." (s. 245)

De förtydligar med hjälp av ett exempel där en jordbävning förstör en stad där husen oftast var vita. Åren efter jordbävningen är den billigaste husfärgen röd. Hur kommer korrelationen mellan husfärgerna året före jordbävningen, och husfärgerna hundra år senare, se ut? Ett annat exempel är en kolonial policy som gör att det finns missionärer i en del koloniserade distrikt men inte andra. Hur kommer detta påverka läskunnigheten hundra år senare, givet olika antaganden om skolbyggande etc? Dessa slutsatser drar Cirone och Pepinsky av den illustrativa diskussionen:

"The upshots of this discussion are twofold. First, many conceptual tools can explain theoretically why initial conditions may shape subsequent outcomes. A theoretically satisfying account of why different initial causes produce long-term variation in outcomes requires that the mechanisms of persistence be precisely characterized to understand why causal effects exist. Second, equilibrium dependence is not necessary for historical persistence. For many political science questions that examine persistence over decade-long time scales—relatively common among political science articles—outcome dependence may suffice to explain why spatial variation in outcomes persists. Political scientists need not cast their findings in terms of path dependence or something like it to identify causal effects over time. Equilibrium dependence is likely more important for explaining very long-term persistence, over century-long time scales." (s. 247)

Från detta övergår de till en metoddiskussion om de kvantitativa metoder som forskarna i persistensstudier använt.

"Abramson & Boix (2019) use data on geographic and climatic features, urban population, industrialization, income, and early representative institutions, for both 225 × 225-km grid-square units and autonomous political units across Europe, from 1200 to 1900, to test competing theories of the origins of political–economic divergence. The authors utilize such an expansive time series and cross-sectional data because they argue that prior studies’ data probably begin after divergence took place. Similar data collection efforts are used to study the development of the modern state, from military capabilities to democratic institutions (e.g., Blaydes & Paik 2016, Cox & Dincecco 2021, Stasavage 2020)." (s. 248)

Cross-section-time-series-data har också använts t ex av Suryanarayan (2018) som använder mikrodata från Indien för att utforska under vilka förhållanden fattiga blir mer benägna att rösta på högerpartier. Hon använder folkräkningsdata från 1931, som kodade kasttillhöirghet, för att karaktärisera dagens politiska distrikt och regioner. I USA använder Bazzi et al (2020) 150 år av folkräkningsdata för att geokoda hur olika delar av USA fick olika politiska kulturer beroende på om de var på "the frontier" eller inte. Så här diskuterar Cirone och Pepinsky nackdelarna med en CSTS-approach:

"The challenge of studying historical persistence using standard regression analyses comes
from omitted variable bias or endogeneity, even when one controls for unit or time fixed effects (Blackwell & Glynn 2018). Since this approach is observational, and depends on ex post statistical adjustment, it requires a strong research design to defend it. As a result, the best of such studies demonstrate clear, theoretically grounded hypotheses, comprehensive data, extensive discussion and testing of alternative hypotheses, and results that are robust to alternative model specifications." (s. 248)

Nästa approach som de diskuterar är naturliga experiment. "Natural experiments are observational studies where the causal variable varies as a result of natural, social, or political forces, and so the researcher can make a credible claim that treatment assignment is as-if random. Sometimes this involves exploiting historical lotteries that used an actual randomization device, such as in the case of committees during the French Third Republic (Cirone & Van Coppenolle 2019) or guild selection in medieval Florence (Abramson 2021)." (s. 248) Oftare handlar det inte om faktiska lotterier utan att forskaren får göra ett detaljerat argument för att folk och platser inte själva kunde välja om de skulle hamna i treatment-gruppen eller kontrollgruppen. Som exempel tar de Charnysh _(2019) som undersöker hur etnisk diveristet påverkat ekonomin i Polen efter andra världskriget. När gränserna drogs om mellan Tyskland och Polen var det med ett inslag av godtydlighet och slump; folk som berördes kunde inte själva välja var de skulle hamna. Så här avrundar C och P diskussionen om approachensför- och nackdelar:

"Claims to plausibly random treatment assignment can be defended using statistical tests that show balance between treatment and control groups, placebo analyses, or other sensitivity tests (Angrist & Pischke 2010, Cinelli & Hazlett 2020). But they also require qualitative, case-based arguments explaining why the treatment is probabilistic and unconfounded. This requires detailed knowledge of the historical case and efforts to avoid reading history backward—in other words, incorrectly imputing the causes of certain developments from their correlates or consequences (Capoccia & Ziblatt 2010, Møller 2021). As Kocher & Monteiro (2016, p. 952) write, “Qualitative historical knowledge is essential for validating natural experiments.”" (s. 249)

Den tredje approachen är vad de kallar "design-based inference". "Design-based inference exploits features of the research design—rather than model-based statistical adjustment—to move from correlation to causation (Sekhon 2009, Dunning 2012, Cantoni & Yuchtman 2020). Historical persistence studies commonly rely on three statistical techniques to study the past: RD designs, DiD designs, and IV analyses." Regression discontinuity har använts i en mängd kontexter:

"to look at the long-run effects of medieval or colonial institutions on state development in settings such as China (Mattingly 2015), Namibia (Lechler & McNamee 2018), Peru (Dell 2010), Spain (Oto-Peralías & Romero-Ávila 2017), Vietnam (Dell et al. 2018), and Kenya ( Jedwab et al. 2017). This method has also recently been used to examine how borders affect modern political outcomes, such as voting, extremism, or representation (Fontana et al. 2017, Fowler & Hall 2017, Tur-Prats & Valencia Caicedo 2020). Importantly, any RD design—historical or not—has high internal validity, but may have low external validity, for the sample around the threshold for which a causal effect may be estimated may be quite small or nonrepresentative. Further, this research design requires a significant number of observations around this threshold to estimate an effect, which might be challenging with historical data." (s. 249)

Difference-in-differences utgår från en händelse eller chock som ledde till senare olikheter mellan enheter som före chocken hade liknande trender. Cantoni et al (2018) utforskar hur katolska och protestantiska regioner utvecklades efter reformationen; Fouka (2020) studerar tvångsmässig assmileringspolitik med utgångspunkt i USA:s förbud mot tyskspråkiga skolor år 1919.

Instrumentvariabeldesignen "rely on a historical or geographic variable that serves as an instrument for
an endogenous regressor. In other words, this instrument is correlated with the treatment and
uncorrelated with the error term in the outcome model. This assumption is termed the exclusion
restriction. If it (among other conditions) holds, instrumental variables can allow scholars to isolate
the effects of historical variables on subsequent outcomes." (s. 250) Nunn (2008) och Nunn och Wantchekon (2011) analyserade effekterna av slavhandeln på Afrikas ekonomiska utveckling med avståndet till stora slavhandelshamnar som instrument för slavhandelns intensitet. Acharya et al (2018) visar att slaveriets intensitet i distrikt i USA år 1860 korrelerar med politiska attityder idag, och använder jordens lämplighet för att odla bomull som instrument för slavhandelns intensitet. Det finns också än mer exotiska användningar:

"Natural phenomena may also serve as instruments. Wang (2021) studies the effects of state-sponsored violence in 1960s China on modern political attitudes, using exposure to sulfur as an instrument: Proximity to sulfur mines resulted in arms manufacturing plants, which were well guarded by the state and suffered less violence than other regions. Sellars & Alix-Garcia (2018) explore how a demographic collapse in the seventeenth century concentrated land ownership in Mexico, which helps explain nineteenth- and twentieth-century landholding inequality and land reform. They use precipitation data (extracted from tree-ring chronologies) to instrument for disease prevalence and therefore variation in population levels." (s. 250)

Bland problemen för IV-approchen finns hur man ska övertyga om att the exclusion criterion verkligen funkar.

Efter denna metod-diskussion övergår C och P till de analytiska utmaningarna i persistens-litteraturen. Det handlar om fyra utmaningar: mått, spatial heterogenitet, posttreatment and collider bias, och kausala mekanismer. Vad gäller måtten är ett väldigt intressant problem detta: för att kunna studera persistens måste man ju ha ett historiskt mått på den oberoende variabeln: men vilka historiska data har egentligen överlevt in i vår egen tid? Där finns antagligen en tendens, t ex att undertryckta gruppers information i lägre grad bevarats. Frågan om var måtten kommer ifrån skulle jag t ex mena kan ställa till problem för Giuliano och Nunns mått på historisk bydemokrati, som ju uttryckligen ibland kommer från 1800-talet, ibland från 1900-talet, osv.

Frågan om spatial variation: persistens-studierna jämför distrikt, regioner och stater.

"But the spatial nature of the data means that adjacent observations may be dependent on each other (Cook et al. 2020). Correlations could potentially be driven by extreme levels of spatial autocorrelation of residuals or strong spatial trends, leading to biased coefficients (Casey & Klemp 2021) or artificially low standard errors (Kelly 2019). Kelly (2019) demonstrates this problem by assessing the extent of serial correlation in 27 persistence studies in top economics and political economy journals, and showing that if spatial noise is taken into account, many studies’ findings are no longer statistically significant. Yet as Voth (2021) highlights, many of these studies employ multiple specifications, and the results from the more sophisticated models that account for spatial dependence remain robust." (s. 251-2)

Geografiska fixed effects är en standard-metod som används; klustrade standardfel m m används också.

Den tredje utmaningen är posttreatment bias: om decennier eller århundraden skiljer oberoende och beroende variabel åt, vad kan inte ha hänt däremellan?

"... this means studies often include posttreatment variables: variables that occur after the proposed treatment has happened and lie on the causal path from the treatment of interest to the outcome. Conditioning on such variables can introduce posttreatment bias. Posttreatment bias can be introduced both by controlling for posttreatment variables in statistical models and by selecting the sample or subsetting the data on posttreatment criteria (Montgomery et al. 2018). Posttreatment data are also increasingly and incorrectly used to justify the exclusion restriction in IV analysis, which can actually undo all the benefits of a natural experiment. More generally, when working with missing, noisy, or aggregated historical data, it may be more challenging to accurately determine the exact timing of covariates, and to what extent one was measured before the other: Two variables may be recorded as coming from the seventeenth century, but if temporal order matters, such a coarse measurement may be insufficient.
If scholars do not adequately control for confounders, their analysis suffers from omitted variable bias, but what appear to be confounders might actually be causal consequences of the treatment variable. What are the solutions? First, these trade-offs can be modeled by using DAGs (directed acyclic graphs), a nonparametric approach to test whether causal effects are identifiable (Pearl 2009). Causal mediation analysis can also be used to examine intermediate variables that exist on the causal path between treatment and outcome (Imai et al. 2011), although the identification assumptions required for such analyses are strong. Acharya et al. (2016) propose the use of a two-stage regression estimator, the sequential g-estimator, to estimate the controlled direct effect, i.e., the treatment effect holding fixed values of a potential mediator. This has been employed in research on historical persistence (Charnysh 2019, Homola et al. 2020, Ito 2021), but its use still requires a properly specified causal model." (s. 252)

Vad gäller kausala mekanismer blir jag lite förvånad över hur avslappnade Cirone och Pepinsky är inför kausala förklaringar som inte kan ange mekanismerna genom vilka X påverkar Y: jag kan inte hålla med dem när de skriver att

"Under the standard approaches to causality in the quantitative social sciences (Rubin 2005, Pearl 2009), causal effects can be identified and estimated without reference to mechanisms. Under the potential outcomes framework for causality and many counterfactual-type definitions related to it, an explication of causal mechanisms is not necessary to estimate causal effects. The failure to supply evidence of causal mechanisms that link, for example, medieval anti-Semitism to Nazi-era violence against Jews (Voigtländer & Voth 2012) does not comprise evidence that this link is not causal." (s. 253)
Det låter obegripligt för mig. Efter ett sofistikerat resonemang om de kausala mekanismernas roll landar de i vilket fall i denna rekommendation för fortsatta persistensstudier:

"Although we welcome the discussion of causal mechanisms in historical persistence research, calls for mechanisms face the same challenges in the study of long-run persistence as they do in the rest of the social sciences. Even though historical persistence studies seem particularly in need of mechanismic evidence given the long time scales of the causal relations that they seek to identify, they are unlikely to prove dispositive for establishing that long-term correlations are indeed causal without an abundance of intermediate outcome data and multiple qualitative studies that meet stringent case selection criteria. Taking the causal ambitions of the historical persistence literature seriously means that the standards for mechanismic evidence to complement correlational
evidence are beyond the reach of most feasible studies.
We emphasize, however, that this is not an argument against mechanismic evidence. Like others, we expect that a middle ground is often possible, with historical and process-based evidence complementing the standard template, much as Simpser et al. (2018) have proposed for reconciling political economy approaches with comparative historical approaches to historical legacies.
Instead, we conclude that unconditional demands for mechanismic evidence are inappropriate for historical persistence studies and that the requirement that authors identify a single mechanism to the exclusion of all others is almost always unjustified. We recommend that quantitative scholars adopt a view of historical evidence that recognizes the limitations of mechanismic evidence in the context of their explanatory objectives." (s. 254)
Slutsatserna känns över huvud taget ganska preliminära: det är en litteratur som utvecklas snabbt och det blir ju också då svårare att sammanfatta vad den egentligen kommit fram till. I slutsatssektionen säger Cirone och Pepinsky att:

"As Nunn (2020) notes, for example, replicability is an issue with historical work. Data constraints in historical research make independent replicability across different empirical contexts difficult. But to the extent that replication is possible, it will strengthen the appeal of otherwise unique historical findings, moving beyond causal estimates to generalizability and event prediction.

Research on historical persistence can continue to theorize and model the passage of time (Grzymala-Busse 2010). Key questions include how to subdivide stretches of time when studying endogenous processes, what the mechanisms of persistence are, and what sorts of causal claims require affirmative mechanismic evidence. That physical infrastructure like roads and dams persists ever time is relatively uncontroversial, but just how social formations, norms, and ideas can persist over decades and centuries should remain an active area of research." (s. 254-255)


fotnoter

* det är inte heller den första översikten över persistensstudierna. Hans-Joachim Voth skrev 2020 "Persistence -- myth and mystery" (pdf) och Leticia Arroyo Abad och Noel Maurer publicerade 2021 "History Never Really Says Goodbye: A Critical Review of the Persistence Literature" i Journal of Historical Political Economy.


referens

Alexandra Cirone och Thomas B. Pepinsky, "Historical persistence", Annual Review of Political Science 25: 241-259, 2022.