bengtzzon: Relationen mellan historia och kvantitativ samhällsvetenskaplig metod: fallet APD

En av de för mig som ekonomisk-historiker mest intressanta skärningspunkterna i forskningen är den mellan disciplinen historia -- som tenderar att arbeta källintensivt och med kvalitativa metoder/small N designs -- och kvantitativ forskning inom statsvetenskap, sociologi och nationalekonomi. Statsvetaren Gregory J. Wawro och historikern Ira Katznelson, båda verksamma vid Columbia-universitetet i New York, har 2014 och 2020 publicerat två artiklar om just denna skärningspunkt, specifikt för hur man kan kombinera historiska och samhällsvetenskapliga metoder inom fältet American Political Development (APD). APD är en inriktning inom amerikansk statsvetenskap som arbetar med USA:s politisk-historiska utveckling och framför allt med kvalitativa metoder; APD är nära relaterat till forskningsprogrammet historisk institutionalism. [1]

En rolig grej med att läsa 2014-artikeln nu är att den redan, tolv år senare, så tydligt känns som att den kommer från en tidigare era inom samhällsvetenskapen, metodmässigt. [2] Titeln "Designing Historical Social Scientiﬁc Inquiry" går tillbaka på King-Keohane-Verbas klassiska metodbibel från 1994, Designing Social Inquiry, och diskussionen hör verkligen till 1990-talets och 00-talets fokus på panelregressioner och hur kan kunde frångå antaganden om linjära och konstanta effekter/korrelationer för att istället tillåta effekt-heterogenitet. (Jag disputerade 2013 och min avhandling var väldigt färgad av de diskussionerna, med structural breaks, rolling regressions för tidsvarierande koefficienter, interaktionsmodeller, multilevel m m, som jag förstås lärt mig på metodkurser på 00-talet och tidigt 10-tal.) Wawro och Katznelson nämner Angrist och Pischkes fundamentala artikel i Journal of Economic Perspectives från 2010 som var med och startade (och namngav) identifikationsrevolutionen, som ledde metoddiskussionen i ett ganska annorlunda håll, mer fokuserat på forskningsdesign, men Angrist och Pischkes fokus på regressionsdiskontinuitet, differences-in-differences med mera spelar ingen roll i Wawro och Katznelsons artikel. [3]

Utgångspunkten för deras diskussion är väldigt intressant: historikers och kvalitativa statsvetares grundläggande argument mot linjär regressionsanalys, att denna missar betydelsen av kontext och hur kausala relationer inte kommer vara konstanta över tid och mellan olika kontexter. Så här presenterar de APD:s diskussion av tidsvarierande effekter:

"We need to be receptive to how the complex and interdependent features of causal relations are sensitive to temporality and periodicity by way of a rigorous historical sensibility that places “politics in time,” a goal that long has been an aspiration of APD scholarship focused on path dependency, heterogeneous causality, and contingency (Pierson 2004, 102, 109; also, see Orren and Skowronek 2004)." (s. 527) [4]

Wawro och Katznelson säger att de håller med APD-forskarna i deras kritik av standard-kvantitativa metoder, men att de menar att APD när de väljer att bara använda kvalitativa metoder, både försvagar sin egen position inom statsvetenskapen, och "are missing the chance to probe rigorously into subjects that matter by the absence of appealing quantitative tools." De anför alltså både pragmatiska och substantiella skäl för att APD ska använda kvantiativ metod i högre utsträckning.

Det huvudsakliga problemet med "standard regression models" för historikers intresse för kontext, temporalitet och periodicity är att man tenderar att estimera konstanta koefficienter/effekter över lång tid och över olika kontexter. Mot detta ställer de modeller som tillåter varierande koefficienter: "Parameter variation offers a potentially powerful solution by permitting the effects of explanatory variables to change and evolve along dimensions that are thought to be important." (s. 529) Det kan handla om koefficienter som estimeras separat för två olika perioder, före och efter en critical juncture, eller med variation mellan kontexter.

Den första typen av modell som de lyfter fram är Structured additive regression-modeller (STAR). Dessa presenteras på följande vis:

"Structured additive regression (STAR) models extend generalized additive models by incorporating flexible nonparametric functions of covariates that can account for nonlinear effects and build in complexities in relationships among variables that are not possible in standard regression models (Fahrmeir and Tutz 2001; Hastie and Tibshirani 1990). STAR models generalize several classes of models familiar to political scientists, including generalized additive mixed models, variable coefficient models, and multilevel/hierarchical models. STAR models can capture parameter variation as well as unobserved heterogeneity that is likely to exist in the data while performing parameter smoothing to reduce the estimation instability that can result when we increase the parameter-to-data ratio. Smoothing can be done in a way that is particularly sensitive not just to historical time but also in ways that provide flexibility over other dimensions as well, such as region and policy area.
Bayesian approaches to estimation of STAR models provide the kind of flexibility that we seek. While frequentist approaches that use smoothing splines—especially splines over the time dimension—offer flexibility, a key advantage to going the Bayesian route is that we can use priors that incorporate assumptions that are particularly useful for historical analysis." (s. 529-530)

De exemplifierar fördelen med denna typen av modell med en undersökning av röstmönster i USA:s Kongress för medborgarrättsfrågor (civil rights) sedan tidigt 1800-tal. Vi kan förvänta oss att hur Demokrater och Republikaner röstar och samröstar (eller röstar mot varann) i dessa frågor förändras över tid: t ex med Lincoln och inbördeskriget på 1860-talet som en brytpunkt, eller med Lyndon B Johnsons liberala politik gentemot de svartas rättigheter i Södern på 1960-talet som en brytpunkt. Vi kan förvänta oss varierande effekter per period, eller per kongress.

Det första empiriska exemplet är som sagt röstmönster i US Congress. Här introducerar de också hur statsvetare jobbar med varierande effekter i regressioner över tid, utifrån structural breaks. Det vanligaste sättet att identifiera strukturella brytpunkter, skriver de 2014, är att göra ett Chow-test, "which assumes that it is valid to break a series into two parts—before and after some posited significant event. Yet it could be the case that the series should be broken into more than two parts and that the most important breaks occur at different points in time from those explicitly posited. If there are more structural breaks in the data than specified, we could reach incorrect inferences." (s. 531) W och K förespråkar istället ett flexiblare sätt att identifiera strukturella brytpunkter, bayesianska metoder där man använder informationskriterier för att beräkna vilket antal brytpunkter som ger bäst resultat. (531-2)

Nästa empiriska exempel är hur vanligt det är med split-party U.S. Senate delegations. Detta bygger på att varje delstat i USA har rätt att utse två senatorer, och att dessa väljs på ett rullande schema: en delstat väljer en senator vartannat år, och varje gång kan valet av ny senator alltså delvis "kompensera" för vem man valde förra gången. Brunell och Grofman (1998) har undersökt hur vanligt det är med split-party och lyfter fram att frekvensen av detta talar till en rad viktiga ämnen: realignment-teori, effekten av 17th Amendment (1913, bestämde att senatorer ska vara direktvalda), och ifall väljare väljer "divided government" för att balansera ut extrema politiker. Brunell och Grofman gör en tidsserieanalys för perioden 1788 till 1996 (!) där "the percentage of split Senate delegations is regressed on lags and lagged differences to account for the directionality of the multistage realignment process, variables that mark the received locations of realigning elections (e.g., 1830, 1862, 1896, and 1932), and a dummy that indicates the move to direct election." (s. 533) W och K säger att Brunell och Grofmans studie är extremt välgjord men att det ändå finns skäl att tänka vidare om fallet med split Senate delegations. Bland annat utifrån hur Mayhew (2002) och andra ifrågasatt realignment-teori: utifrån detta kan en mer flexibel metod för att bestämma strukturella brytpunkter vara mer befogad än B och G:s metod där de själva sätter parametrarna (1862, 1896 osv). Resultaten av en omanalys av detta, med Barry-Hartigan och Bai-Perrons metoder för att hitta strukturella brytpunkter, syns i Figur 1 ovan. Enligt dessa tester var t ex inte 1896 eller 1932 några brytpunkter för benägenheten till split Senate delegations, och att man hittar en brytpunkt 1908 talar emot betydelsen av 17th Amendment, med tanke på att den först implementerades 1913.

Wawro och Katznelsons tredje exempel handlar om hur Demokraternas politiska koalition omformades av politiken under New Deal. Här omanalyserar de en studie som Katznelson själv gjort, tillsammans med Farhang och publicerad 2005 i APD:s hustidskrift Studies in American Political Development. Närmare bestämt så handlar det om hur Demokrater från Sydstater och Nordstater kunde hålla ihop så länge New Deals arbetarvänliga politik inte omfattade svarta arbetare (många i jordbruk eller husliga tjänster) i Södern, medan koalitionen började krackelera när Nordstatsdemokraterna började omfamna kraven på rättvisa i att också förbättra livet och förhållandena för de svarta arbetarna. Wawro och Katznelson beskriver processen så här:

"During the early years of the New Deal, southern Democrats behaved much like their northern colleagues because labor policy was explicitly designed so that it would not interfere with the southern system of racial apartheid. Specifically, domestic and agricultural sectors—occupations in which the majority of African Americans were employed—were largely exempted from New Deal labor protections. The basis of this arrangement was a set of Faustian bargains in which liberals outside the South allowed a distinctly illiberal social and political order to perpetuate for the sake of securing and maintaining national majority coalitions. As labor unions began to mobilize in the South, and as their inroads began to undercut Jim Crow through the partial racial integration of union locals and by the challenge they posed to the region’s racialized, low-wage political economy, senators and representatives from that section became less willing partners in the New Deal coalition. Pursuing an insight of Key’s (1949), Farhang and Katznelson show how this decline in the southern propensity to vote with their northern counterparts on labor questions was the opening wedge for the later emergence of the Conservative Coalition that linked Republicans and southern Democrats in votes to resist a more robust federal government." (s. 535)

Farhang och Katznelsons studie bygger på röstmönster (roll-call voting data) i Kongressen från 1933 till 1948 och visar att likheten mellan Sydstats- och Nordstatsdemokrater minskar över tid; inte minst så slutade Sydstatsdemokraterna stödja arbetarvänlig lafstiftning när facket växt sig starkare. [5] "The analysis that Farhang and Katznelson offer can be conceived as one of changing parameters. " (s. 535) Wawro och Katznelson använder STAR-modeller för att omanalysera detta mönster och specifikt vad den fackliga styrkan hade för implikationer för röstningen i Kongressen. Jämfört med Farhang och Katznelsons modeller så inkluderar dessa tidsvarierande effekter. Kanske så fanns det för Sydstatarna en "temporal component of accelerating concern"? Och omständigheterna under andra världskriget, med tighta arbetsmarknader och en speciell politisk mobilisering, kan också ha format omröstningarna under krigsåren.

Så här sammanfattar Wawro och Katznelson resultaten av sin omanalys av Farhang och Katznelsons (2005) studie:

"Allowing parameters to vary over time and region while employing historically relevant priors thus reveals a fascinating nuance inside the more general pattern identified by Farhang and Katznelson(2005)—one that indicates an interesting and significant modification to our understanding of this era’s labor policymaking. While senators from the Deep South were much less supportive of labor as unionization, the African American population in their states, and urbanization increased in tandem, their colleagues from the Border South were significantly less hostile to labor into the Fair Deal period. These results suggest that senators from this region were cross pressured, caught between their overarching desire to protect a system of white supremacy and the need to be responsive to their voters, some of whom were drawn to unions and their capacity to improve life situations. While segments of constituencies in this region feared the threat to desegregation and the southern order that union activity presented, other constituents were actually being mobilized to join unions, implying that they might pose effective opposition to reelection-seeking senators who were hostile to labor. As a result, some southerners in Congress may have hedged their bets in places where unions were experiencing the most success at organizing and where, concomitantly, preferences for segregation were weaker.
The methods we have applied provide clear and unexpected evidence that unionization in the Border South tempered defections from the majority party position in the 1940s, a pattern within a pattern that had been missed not only by Farhang and Katznelson (2005) but also by all the extant literature on unions and the South written by historians and social scientists, including Marshall’s (1967) still standard work.
In all, this replication demonstrates the usefulness of permitting parameter heterogeneity while constraining it with historically relevant priors. ..." (s. 540)

I slutsatserna återkommer de till riskerna med ömsesidig oförståelse mellan historiker och historiskt orienterade samhällsvetare. Att använda modeller med varierande effekter över tid och mellan enheter kan vara en väg framåt för att överbrygga motsättningarna och den ömsesidiga oförståelsen, säger de: "Good research on historical periods cannot proceed by a flattening universalism. Rather than expect models to predictably port across time, we should be building models that seek to internalize and reflect central historical features and processes by integrating parameter heterogeneity and complexity inside their very construction." (s. 541)

Om 2014-artikeln var en fläkt från 1990- och 2000-talens metoddiskussioner, så är 2020-artikeln, publicerad i Jenkins specialnummer av Public Choice om APD och metod och återpublicerad i den editerade volymen från 2020, Causal Inference and American Political Development, mycket mera ett explicit engagemang med identifikationsrevolutionen. De diskuterar Rubins (1974, 1978, 1990) potential outcomes-modell, diskussionerna om kausal inferens och randomisering. De säger att APD-forskningen över tid rört sig till att inkludera OLS-regressioner med kontrollvariabler, men inte riktigt med den typen av designer som "causalistas" förespråkar. [6]

Men faktum är att W och K vill varna för detta: "First, we worry that standard OLS approaches insufficiently are attuned to central problems of history and historicity, including context, specificity, and temporality. And we are concerned as well that no compelling reason exists for historical scholarship deeply concerned with causality to rely on standard regression analysis without going further." (s. 303) De är optimistisk om möjligheten att använda geografiska regressions-diskontinuitets-designer (RDD) a la Melissa Dells (2010) studie av tvångsarbete i Peru och Bolivia, men mer skeptiska till tidsbaserade diskontinuitetsdesigner. Däremot tror de att man kan använda sig av RDD-designer där man jämför politiska kandidater som knappt vunnit respektive knappt förlorat val, så som Feigenbaum, Palmer ohc Schneer ("Descended from immigrants and revolutionists: How immigrant experience shapes congressional decisionmaking on immigration votes", konferenspapper 2018, publicerat i QJE 2025) gjort för att undersöka hur politikers familje-migrationshistorier påverkat deras röstning i migrationsfrågor 1915-1971.

Nästa diskussion handlar om instrumentvariabeldesigner, lanserade som kausala designer för nationalekonomi av Angrist, Imbens och Rubin i en rad artiklar på 1990-talet, som alla relaterade till Rubins potential outcomes-modell. Wawro och Katznelson ser IV-designer som lovande för APD:

"A number of influential and well-placed publications in the field of economic development have used IV for historical work, effectively establishing it as a definable approach. APD scholars will find much to like in this literature. The questions pursued are of the “big” variety that APD prides itself on tackling (Mettler and Valelly 2016). Historical materials are deeply engaged, especially when it comes to arguments for why the IVs employed are valid. Archival resources are mined painstakingly to compile astoundingly rich historical datasets amenable to quantitative analysis and suitable for IV designs. Much of this work marries qualitative and quantitative efforts in the ways advocated by Dunning (2012), with the former involving a grappling with historical context in ways that justify the latter." (s. 305)

Här diskuterar de t ex Feyrer och Sacerdotes ("Colonialism and modern income: Islands as natural experiments", RESTAT 2009) studie av hur längden av perioden under kolonialism påverkar den ekonomiska utvecklingen, med vindförhållanden som instrument. Kolonisatörerna koloniserade först öasr som det med den tidens segelteknik var enkelt att segla till. Vindförhållandena borde inte ha några kausala effekter på den ekonomiska utvecklingen idag, och är alltså ett giltigt instrument för koloniseringsperioden. Liknande så använder Hoyt Bleakley och Jeffrey Lin ("Portage and path dependence", QJE 2012) svårframkomlig vattengeografi, t ex vattenfall, som instrument för var det var särskilt viktigt att anlägga städer för att hantera transporter för länge sen. Vattenfallen har ingen egen effekt på den ekonomiska utvecklingen idag, så utgör ett relevant instrument för urbaniseringens effekter på ekonomisk utveckling.

Wawro och Katznelson reser dock en invändning mot IV-designerna. Det handlar om att de typiskt använder ett förhållande från för länge sedan, flera hundra år, och kör regressionen med en nutida utfallsvariabel på den historiska instrumentvariabeln. Tiden däremellan beaktas inte. (Ekonomisk-historikern Gareth Austins "Compression of history".) De diskuterar Nunn och Wantchekons (2011) IV-studie av slavhandelns effekter på tilltro som exempel: det finns mer än hundra år av historia mellan måttet på slavhandeln och måttet på samtida tilltro. Gentemot IV-designens avstånd mellan historiska orsaker och nutida utfall, ställer W och K en rad intressanta frågor om hur man skulle kunna utveckla approachen:

"the empirical strategy does raise questions about what we would expect to see if we had data from intervening intervals. Would we expect relationships to decay, grow stronger, or stay the same across time? If relationships between explanatory variables of interest and outcomes vary over time, what does that tell us about the nature of the persistence? What if the extent of correlation between instruments and endogenous variables changes over time? In a sense, we would expect such shifts, but what does this mean in terms of the theory of persistence?" (s. 307)

Från denna mer principiella diskussion går de över till en diskussion av användningar av IV-designer inom APD-forskning. Acharya, Blackwell och Sen (2016, 2018) använder en historisk IV-design, liknande Nunns (2008) för att utforska slaveriets bestående effekter på politiken i USA. ABS argumenterar att vita i områden som var mer beroende av slaveriet för sin ekonomi reagerade mer negativt på avskaffandet av slaveriet, och agerade för att etablera institutionella och kulturella förhållanden som skulle upprätthålla de vitas makt över svarta. Så här beskriver Wawro och Katznelson argumentet och metoden:

"ABS find a relationship at the individual respondent-level between slaves per capita in a county in 1860 and the likelihood today of identifying as Republican, opposing affirmative action, and expressing racial resentment and “colder” feelings toward African–Americans. In order to bolster the validity of their estimates as causal, the authors use cotton-growing suitability to instrument for the proportion of the population made up by slaves on the eve of the Civil War. Nunn and Qian (2011) first deployed the design using crop suitability as an instrument in their study of the impact of the potato on population growth and urbanization. The concern is that a simple regression of political attitudes on the proportion of slaves in a county would not account sufficiently for all pre-1860 covariates that would have had a simultaneous effect on both the slave population proportion in 1860 and contemporary attitudes. The argument for doing two-stage least squares is that cotton-growing suitability would have a direct relationship with slave proportions in 1860, but would not be related to racial attitudes today, thus providing the necessary exclusion restriction. The design enables them to discount other potential explanations, including possible “racial threats” perceived by whites who currently are living in close proximity to high concentrations of African–Americans." (s. 308)

Invändningar har rests, säger Wawro och Katznelson, mot att ABS inte har något faktiskt mått på hurpass användbar jorden var för att odla bomull år 1860, utan att jordkvalitetsvariabeln istället härrör från perioden 1961-1990. Här kan man t ex ställa frågor om omvänd kausalitet: kanske intensiv odling av bomull under slaveriperioden slet ut jorden och i sig gjorde att jorden 1961-1990 var mindre effektiv för att odla bomull. (Nunn och Qian försöker undvika sådan endogenitet genom att använda bara de aspekter av suitability för potatisodling som inte kan påverkas på detta sätt: värme, regn.) En annan invändning är att ABS bara kollar just på bomullslämplighet som instrument, trots att slavar användes också för att producera andra jordbruksprodukter. ABS (2016) säger i en fotnot att de “omit suitability for other crops, such as tobacco, because they have no relationship with slavery conditional on cotton suitability.” Detta trots att Fogel (1989) visar att det fanns stora koncentrationer av slavar också i områden som inte odlade bomull, särskilt i upper South där man odlade tobak. Wawro och Katznelson reser invändningar mot ABS design som är helt i enlighet med deras 2014-artikel och intresset för varierande effekter över tid och mellan enheter, här delstater:

"We also question whether or not it is reasonable to assume homogeneous coefficients between the Deep South and the Border South. ABS address heterogeneity by including state fixed effects in their regressions. However, it is reasonable to worry about heterogeneity of the coefficients across states in the first-stage regression and possibly the second. The question of how crop suitability varied over time also remains, as southerners embraced innovations in farming techniques and technology that helped to revive depleted lands (Craven 1926)." (s. 310)

Som mer generell slutsats menar de att en viktig metodologisk väg framåt är att gentemot IV-designer utforska varierande effekter över tid. "We are hopeful that devoting more thought and effort to developing causal approaches that are more self-consciously historical will enable researchers to avoid trading off identification for the flattening of time." (s. 311)

anteckningar

Gregory J. Wawro och Ira Katznelson (2014) "Designing Historical Social Scientiﬁc Inquiry: How Parameter Heterogeneity Can Bridge the Methodological Divide between Quantitative
and Qualitative Approaches", American Journal of Political Science.

Gregory J. Wawro och Ira Katznelson (2020) "American political development and new challenges
of causal inference", Public Choice 185: 299–314

fotnoter

[1] APD verkar vara mer kontroversiellt och debatterat än vad man som utomstående genast förstår. Jag vet inte riktigt vad det handlar om men jag antar att det har med metodstrider att göra? Det är i vilket fall slående att redaktörerna för Oxford Handbook of American Political Development, Suzanne Mettler (Cornell) och Richard Valelly (Swarthmore), i sin inledning till handboken talar om APD som att fältet "emerged in the early 1980s as an insurgent movement". Insurgent!

Jeffery A. Jenkins (USC) ger i sin inledning till volymen Causal Inference and American Political Development, publicerad av Springer 2024, också ett intressant perspektiv på APD:s metodologi, från ett kvantitativt håll; Jenkins är kvantitativ statsvetare som under 2020-talet varit med om att etablera Historical Political Economy (HPE) som ett forskningsfält, som drivs av kvantitativ metod. Volymen springer ur en workshop arrangerad 2019, före HPE myntats som begrepp, ägnad åt att föra samman Causal Inference (CI) och APD, och Jenkins kommenterar så här på mötet mellan CI och APD: "As many of the authors discussed, CI and APD do not easily go together. For example, Caughey and Chatfield (2020: 359) noted: “both causal inference and APD are centrally interested in questions of causation, but they approach causation with very different ontological and epistemological commitments.” Specifically, while CI scholars typically incorporate careful, experiment-based research designs to produce “average effects of discrete, manipulable ‘treatments’” (Caughey and Chatfield 2020: 360), APD scholars have traditionally focused on “large, complex, normatively significant questions about historical processes and institutions – questions that typically are not well-suited to a crisply defined design-based inference about the effect of a specific ‘treatment’” (Schickler 2020: 502)." Citat från Jenkins, s. v.

[2] Det är kanske också den har förvånansvärt få citeringar för att vara en programmatisk metodartikel publicerad i en av statsvetenskapens topp tre-tidskrifter: enligt Google Scholar har den bara citerats 50 gånger.

[3] De diskuterar Angrist och Pischke så här: "Although social scientists have recently paid a good deal more attention to unearthing more persuasive and powerful instrumental variables to address endogeneity and identify causal effects (Angrist and Pischke 2009), our focus here is on the substantial progress that can be made by augmenting standard models with techniques that have only recently come to the attention of political scientists. These techniques work within the framework of the regression model in ways that satisfy a desire for parsimony while incorporating features historians see as crucial to representing historical events and development." (s. 528)

[4] För den andra dimensionen, kontext, har de en intressant definition som jag inte riktigt förstår. Jag citerar: "Defined as “the dependency of sufficient causes upon necessary causes” (Gaddis 2002, 97), context concerns those features of social reality that make a given cause a candidate for sufficient status. This orientation to how particular surrounding circumstances affect the play of causal relations implies close attention to the particularity of locations and moments, for interaction of factors is shaped by noteworthy elements at distinct times and places." (s. 527)

[5] De definierar Södern som "the 17 states that mandated racial segregation before the 1954 Brown decision". Södern delas i sin tur in i tre grupper: Deep South (Alabama, Florida, Georgia, Louisiana, Mississippi, South Carolina, och Texas), Border South (fyra delstater), och de övriga sex.

[6] Så här beskriver W och K (2020) utvecklingen: "While earlier generations of APD scholars viewed detailed narratives, combined with some descriptive statistics, as sufficient for evaluating causal claims, regression analysis has become a standard method within APD’s toolkit, thus helping to move at least some parts of APD closer to the mainstream of political science, though not without cost." Fotnoten här går till: "For recent works in the APD tradition that employ regressions, see Caughey and Warshaw (2016), Farhang (2010), Mulroy (Forthcoming), Ogorzalek (2018), and Schickler (2016)." (s. 303)

bengtzzon

måndag 22 juni 2026

Relationen mellan historia och kvantitativ samhällsvetenskaplig metod: fallet APD

Inga kommentarer:

Om mig