måndag 5 oktober 2020

Metodfrågor i toppinkomstlitteraturen

Toppinkomstlitteraturen har dominerat den långsiktiga debatten om inkomstojämlikhet de senaste tjugo åren, sedan Pikettys studier av Frankrike 2001 och USA 2003 (med Saez). Från de tidiga inkomstskatte-arkiven tar man fram hur stor inkomst toppinkomsttagarna -- kanske den 0.1 procent som tjänade mest, eller den 1 procent, eller de 5 procent, eller de 10 procent -- hade som kollektiv, och så relaterar man det till en nationalinkomst för att få fram "toppinkomstandelen".

Men hur beräknas egentligen nationalinkomst i dessa studier? För att få ett rimligt mått på ojämlikhet, alltså toppinkomsttagarnas del av det hela, så är det ju lika viktigt att måttet på "det hela" är bra, som att måttet på toppinkomsttagarnas egna inkomster är. Ändå upplever jag det som att jämförelse-totalen diskuterats och uppmärksammats betydligt mindre. Åtminstone har jag själv tänkt på det som en teknikalitet. Men nu när jag själv håller på med liknande studier, så blir det desto viktigare att förstå på detaljnivå hur beräkningarna i toppinkomstlitteraturen funkar.

I Atkinson och Piketty-antologin Top Incomes over the 20th Century från 2007 har Anthony Atkinson glädjande nog just ett sådant metodologiskt kapitel. För jämförelsen behövs först en total befolkning, "control total for population", och sedan en total inkomst, "control total for income". I 2007-boken är befolkningen i Kanada-kapitlet de över 20 år, vilket missar de under 20 år som tjänar pengar och är med i inkomstskattestatistiken, påpekar Atkinson. I UK-kapitlet är befolkningen därför de 15 år och äldre. Detta till synes tekniska val har förstås en implikation för ens beräknade ojämlikhet: med cut-off på 20 år blir den beräknade befolkningen mindre, vilket ger en lägre beräknad toppinkomstandel (eftersom topp 1 procent blir en mindre grupp rent numerärt). Omvänt, med cut-off på 15 år blir kontrollbefolkningen större, vilket kommer ge en större toppinkomstandel. (s. 27) En lärdom: dessa till synes mycket tekniska och perifera antaganden, har substantiella implikationer för de slutgiltiga beräkningarna! I UK 1931 var befolkningen 15 år och äldre 13 procent större än befolkningen 20 år och äldre. Om topp 1 procentens inkomstandel var 10 procent med befolkningen 20 år och äldre, så blirden 10.6 procent med befolkningen 15 år och äldre. (s. 28) I andra länder är befolkningen av skattebetalare mer komplex, eftersom det var hushåll, inte indiivder, som var skatte-enheten. Piketty och Saez räknar därför ut sin befolkning som antalet individer över 20 år minus alla gifta kvinnor. I länder med parvis beskattning blir beräkningarna mer osäkra; Atkinson menar att en faktisk topp 1 procent-andel om 10 procent kan variera mellan 8.3 och 11.8 beroende på hur fördelningen inom hushållen (som toppinkomstforskaren inte vet något om) ser ut. (s. 28-29)

Från befolkningsfrågan kommer vi till den mer uppenbart relevanta frågan om totalinkomsten. Här finns två approacher för att få fram den totalinkomst som ska vara nämnaren i toppinkomstandel-beräkningen. Den första börjar från inkomstskattedatat och lägger till inkomsterna för de som inte är inkluderade i det datat (eftersom de tjänat för lite för att betala inkomstskatt), "the non-filers". Denna approach används i Atkinson och Piketty 2007-boken för Nederländerna, UK, och USA från och med 1944. En annan approach börjar från en "external control total, typically derived from national accounts". Denna approach används i boken för Australien, Kanada, Franrkike, Tyskland, Irland, Nya Zeeland, och USA före 1944. Atkinson kommenterar:

"The approach seeks to adjust the tax data to the same basis, correcting, for example, for missing income and for differences in timing. In this case, the income of non-filers appears as a residual. This approach has a firmer conceptual base, but there are significant differences between income concepts used in national accounts and those usually applied in income distribution analysis." (s. 29)
Den första approachen beräknar den totala inkomst som hade rapporterats om alla hade varit tvungna att deklarera sina inkomster. Historiskt sett var bara en liten del av befolkningen tvungen att deklararera. Slående nog så gällde det bara 2 procent i Kanada år 1930, som studerats av Saez och Veall; år 2000 gällde det istället 97 procent av de vuxna. Hur gör man då för att beräkna/imputera inkomsterna för "non-filers"? Piketty och Saez använder för USA en fast andel av skattebetalarnas inkomst. De använder 50 procent för åren 1944 och 1945, och 30 procent från 1945. I Nederländerna har Central Bureau of Statistics redan gjort mer detaljerade skattningar i frågan; och Atkinson använder motsvarande beräkningar för UK.

Med den andra approachen är det viktiga att göra en nationalräkenskap-total för personliga inkomster. För USA 1913-43 beräknar Piketty och Saez detta som 80 procent av nationalinkomsten. Saez och Veall använder denna approach för hela perioden 1920-2000. För Schweiz används istället 75 procent. Atkinson förklarar logiken i denna approach:

"How do these national income based calculations relate to the totals in the tax data? In answering this question, it may be helpful to bear in mind the different stages set out schematically below:
Personal sector total income (PI)
minus Non-Household income (Non-proWt institutions such as charities, life assurance funds)
equals Household sector total income
minus Items not included in tax base (e.g. employers’ social security contributions and—in some countries—employees’ social security contributions, imputed rent on owner-occupied houses, and non-taxable transfer payments)
equals Household Gross Income Returnable to Tax Authorities
minus Taxable income not declared by filers
minus Taxable Income of those not included in tax returns (‘non-filers’)
equals Declared Taxable Income of Filers.
The use of national accounts totals may be seen as moving down from the top rather than moving up from the bottom by adding the estimated income of non-filers. The percentage formulae can be seen as correcting for the non-household elements and for the difference between returnable income and the national accounts definition. Some of the items, such as social security contributions, can be substantial." (s. 30)
Vilka implikationer har då val av metod för ens skattade totala inkomst? Diagrammet nedan visar för Storbritannien 1908 till 1999 skillnaden mellan 80 procent-antagandet (approach 2) kontra en beräkning av non-filers inkomster som man själv adderar upp till en nationalinkomst (approach 1).


Som vi ser i diagrammet ger approach 1för åren 1908-1940, med undantag för krigsåren, en större referensinkomst. Det innebär att med denna approach blir de beräknade toppinkomstandelarna lägre för 1908-13 och 1920-39 än vad de blir med approach 2. Under krigsåren blir den beräknade ojämlikheten tvärtom högre med approach 1. "The choice of control total is evidently important." (s. 31)

Nästa metoddiskussion handlar om interpolation av inkomsterna. Exempel: de franska data som Piketty använder för år 1919 täcker det året bara de 3.591 % som tjänade mestm vulket Piketty extrapolerar för att beräkna en inkomstandel för topp 10 %. Standard-praktiken är att extrapolera med antagandet att fördelningen är Pareto-formad, vilket Feenberg och Poterba (1993, 2000) och Piketty (2001) har visat är ett okej antagande. (s. 32)

I Sverige är det Jesper Roine och Daniel Waldenström som gjort den centrala studien om toppinkomstandelar av inkomsterna på lång sikt. (Journal of Public Economics, 2008.) I ett bokkapitel från 2010 (pdf), från uppföljaren till den antologi ur vilken jag citerat Atkinsons kapitel ovan, diskuterar de metoden mera utförligt. I appendixet 7C, "Construction of reference total", diskueras just de metod-frågor som jag intresserar mig för här, nämligen den tänkta totala inkomsten i toppinkomststudier bestäms/beräknas. Diagrammet nedan visar på ett väldigt fint sätt diskrepansen mellan de personer för vilka man vill mäta inkomsterna, den övre serien "tax units (preferred)", och de för vilka man faktiskt har data, alltså de som faktiskt rapporterat sina inkomster. I 1900-talets början är det färre än 10 procent som betalat den inkomstskatt som Roine och Waldenström använder som källa. 1916-19 fördubblas antalet deklarationer, och efter ungefär 1935 börjar en ny stark ökning av andelen som deklarerar.


Nästa diagram visar hur stor andel av BNP som representeras av referensinkomsttotaler som uträknats med olika metoder och antaganden.


Angreppssättet för att beräkna en referenstotal beskriver de så här:

"In constructing our reference total income we have used three basic approaches. The first two are based on that we can arrive at the ‘Preferred Total Income Definition’ either by (1) starting with ‘Total Personal Sector Income’ and deducting items not included in our preferred definition, or (2) starting from the ‘Tax Statistics Income’ and adding items not included in the tax base and income estimates for individuals not included in the tax statistics. The third—which is mainly included as a point of reference—is based on the assumption that our preferred income total can be approximated as a fixed share of GDP." (s. 355)


 

A. B. Atkinson, "Measuring Top Incomes: Methodological Issues", s. 18-42 i Atkinson och Piketty (red.) Top Incomes over the 20th Century: A Contrast Between European and English-Speaking Countries. Oxford University Press, 2007

Inga kommentarer: