onsdag 19 maj 2021

Ojämlikhet i internationella dataset: en diskussion av WIID och SWIID


I min serie om debatter och diskussioner om hur ojämlikhet mäts och bör mätas, så kommer jag nu efter Galbraiths kritik mot World Inequality Lab och Atkinson och Brandolinis diskussion från 2001 av då tillgängliga internationella dataset, till en diskussion av World Income Inequality Database (WIID) och dess fortsättning SWIID. WIID är fortsättningen av Deninger och Squires (1996) data som Atkinson och Brandolini diskuterade; SWIID är Frederick Solts, professor i statsvetenskap vid universitetet i Iowa, fortsättning av WIID.

Det är ekonomen Stephen P. Jenkins vid London School of Economics som står för denna diskussion, publicerad i Journal of Income Inequality år 2015. De två databaserna, säger Jenkins, är "notable" för sin breda täckning: 161 länder i WIID, 173 länder i SWIID, och många år: 1867-2006 i WIID; 1980-2012 i SWIID. För forskare som vill ha internationella data är WIID och SWIID "convenient and accessible sources". Men hur är det med datakvalitet och jämförbarhet?*

Det är huvudsakligen tre typer av studier som använder såna databaser, säger Jenkins. Ett, beräkningar av globa inkomstfördelning, som t ex Sala-i-Martin (2006) gjort baserat på WIID. Två, ekonometriska analyser av cross-country-paneler där ojämlikheten är utfallsvariabel eller kanske förklarande variabel. Ett exempel är Acemoglu et al (2015) som utforskar demokratins effekter på jämlikhet; många andra studier har kollat på relationen mellan ojämlikhet och tillväxt, så till exempel en IMF-studie från 2014 som baserat på SWIID hävdade att lägre ojämlikhet gav högre BNP-tillväxt. En tredje tyå av studie, mindre vanlig, använder individ-data från t ex World Values Survey och använder nationella ojämlikhetsdata som kontextvariabel.

Sektion två av artikeln börjar med hur man definierar "inkomst". Otroligt nog listar Jenkins inte färre än fem dimensioner i hur olika man kan definiera dettta till synes enkla begrepp. 

First, there is the resource definition. The principal alternatives here are ‘income’ and ‘consumption’ (consumption expenditure). There is no decisive case in favour of one measure or the other: there are arguments to be made for both in terms of principle and of data collection. In practice, income measures are more commonly available for high-income countries, and expenditure measures for low-income countries. 

Här handlar det också om: hur behandlar vi inkomstskatter, skatteavdrag, socialförsäkringskostnader, och transfereringar från staten?

Dimension två är referensperioden: har surveyn frågat om en vecka, en fortnight (som i Storbritannien), eller handlar måttet om en månad, eller ett år?

Dimension tre är referensenhet: hushåll, familj, skatteenhet, eller individ?

Dimension fyra är hur man justerar (eller inte) för referensenhetens storlek, antalet individer som berörs av inkomsten.

Dimension fem är analysenheten. "The issue is whether each reference unit receives a weight of one or a weight equal to the number of individuals within the unit when the distributional summary statistics are derived. Compare, for instance, the distinction between the inequality of the distribution of household income among households and the inequality of the distribution of household income among individuals (each individual is assumed to receive the income of the household to which he or
she belongs)." (s. 632-3)

Han går igenom Atkinson och Brandolinis (2001) rekommendationer för insamling och användande av jämförande ojämlikhetsdata, och går därefter över till att diskutera WIID-databasen, som finns tillgänglig att ladda hem från FN-institutet WIDER. Hans diskussion är påtagligt konkret:

"The WIID data are in a 1.76MB Excel spreadsheet. Eager to check whether I could simply ‘plug and play’ with the data, I imported them into Stata version 13.1 with the command import excel, firstrow, and then checked the variables available and their characteristics. ..." (s. 635)

Han kollar på Storbritannien, och finner att det finns en mängd estimat för samma år, med rätt olika nivåer och tendenser -- se figur 1 som jag klistrat in ovan. Han granskar etiketteringen av variabler och sådana detaljer med anmärkningsvärd energi, och betygsätter WIID (ganska gott betyg) utifrån hur väl den lever upp till Atkinson och Brandolinis (2001) råd för hur man ska konstruera jämförande databaser.


Referens
Stephen P. Jenkins (2015) "World income inequality databases: an assessment of WIID and SWIID", Journal of Income Inequality

Fotnot

* En rolig kommentar som Jenkins gör i introduktionen är: "The way in which I explore and discuss WIID and SWIID is influenced by the fact that I had never used either of them before embarking on this paper. What I describe is the experience of a new user discovering what is in the data rather than a critique of substantive analyses that have been done with them. The commentary is forensic and specific on occasion but an important part of my message is that The Devil is in the Detail."  (s. 631)

Inga kommentarer: