Home

Erik Moberg ©:
Offentliga beslut, appendix.
 
 

Nyttoteori
Spelteori
Välfärdsteori
Slutnoter
 

APPENDIX
 

NYTTOTEORI

Termen nyttoteori (eng. utility theory) betecknar knappast någon enhetlig teoribyggnad. Snarare är det några olika ansatser som brukar betecknas med termen, ansatser som är delvis fristående från varandra även om de också har beröringspunkter. Jag skall i detta avsnitt försöka fånga in det i dessa ansatser som är av intresse speciellt med hänsyn till innehållet i denna bok.

Låt oss börja med att tänka oss ett antal alternativ och en person som bedömer värdet, eller nyttan, av dessa alternativ för sig själv. Alternativen kan t ex vara ett antal varmrätter av olika slag, ett antal politiker inom ett och samma politiska parti, eller ett antal olika politiska partier. Alternativen kan kort sagt vara vilket slags företeelser som helst som kan jämföras med varandra. Om personen antar vi att hon, när hon konfronteras med två alternativ, alltid kan tala om vilket hon tycker är sämst och vilket hon tycker är bäst av de båda. Vidare antar vi att hennes värderingar uppfyller ett s k transitivitetsvillkor. Detta innebär att om hon tycker att alternativet A är bättre än B, och att B är bättre än C, så tycker hon alltid också att A är bättre än C.

Det är väsentligt att den beskrivna personen, hur rimlig den än kan te sig, är en modell, som inte nödvändigtvis har exakta motsvarigheter i verkligheten. Det är ju inte säkert att alla verklighetens människor alltid kan rangordna två alternativ även om de för andra människor förefaller uppenbart jämförbara. Det är inte heller säkert att människors preferenser alltid är transitiva, även om det kan förefalla nog så logiskt. Vi vet ju att människor ibland är ologiska, d v s att ologiska människor inte är någon logisk omöjlighet. Vår antagna person är därför en modell och frågan om modellens realism är en empirisk fråga.

Inom ramen för de antaganden vi gjort kan vi emellertid dra slutsatsen att samtliga alternativ kan ordnas utefter en enda, entydigt bestämd skala, med hänsyn till vilken nytta de har för vår person. Om personen i valet mellan D och E t ex säger att D är bäst, så kommer D före E på skalan. Eftersom vi antagit att personen på samma sätt, och för alla godtyckliga par av alternativ, kan bestämma vilket som för henne är bäst, kan alla alternativ placeras in på skalan. Eftersom vi vidare antagit att personens värderingar uppfyller transitivitetsvillkoret så kommer alternativen att placeras i en enda lång rad, från det bästa till det sämsta. Några cirkulariteter eller andra underligheter kommer inte att förekomma.

En nyttoskala av det just beskrivna slaget brukar kallas för en ordinal nyttoskala. En sådan skala anger endast om ett visst alternativ, för den person den gäller, är bättre än ett annat eller ej. Den säger ingenting om avstånd mellan alternativ. Den säger t ex ingenting om huruvida ett visst alternativ är mycket bättre än ett annat, eller bara lite bättre. Att skalan inte ger någon sådan information beror naturligtvis på att personen, i samband med konstruerandet av skalan, aldrig förutsatts yttra sig om något annat än just rangordning av alternativ.

Behovet av en nyttoskala som faktiskt anger något mer än bara rangordningen mellan alternativ, som i någon bemärkelse också mäter "nyttoavstånd", har ibland känts starkt. Det mest kända försöket att åstadkomma en sådan skala finns i John von Neumanns och Oskar Morgensterns Theory of Games and Economic Behavior (se vidare nästa avsnitt). För att direkt anknyta till förutsättningarna för den ordinala skalan så tänkte sig von Neumann och Morgenstern att modellpersonen, förutom att rangordna alternativ, också kunde rangordna lotterier med alternativen som vinster eller utfall.

Låt oss utgå från de tre alternativen A, B och C och anta att vår person rangordnar dem så att A är bättre än B, och B bättre än C. Därefter tänker vi oss att personen får välja mellan B å ena sidan och ett lotteri, som kan ge antingen A eller C som utdelning, å den andra. Om sannolikheten i lotteriet för A är p, där p ligger mellan 0 och 1, så är alltså sannolikheten för C lika med 1-p. Om nu p är tillräckligt stort så kommer personen att föredra lotteriet framför B. Sannolikheten för att personen faktiskt skall komma i besittning av det bästa alternativet, d v s A, är ju då så stor att chansen är värd att ta. Om p å andra sidan är tillräckligt litet, d v s tillräckligt nära noll, så kommer personen istället att föredra B framför lotteriet. Risken för att drabbas av det sämsta alternativet, d v s C, är ju annars alltför stor. Mellan dessa båda tänkta, och ganska extrema, värden på p bör det alltså kunna finnas ett värde för vilket personen är indifferent mellan lotteriet och alternativet B. Det är detta p-värde som ger en möjlighet att precisera B:s läge mellan A och C.

Antag att indifferensen inträffar då p är lika med 0,2. Antag också högst godtyckligt att nyttan av A för vår person kan sättas till 100, och nyttan av C till 10. Nyttan av lotteriet, och av B, bör då kunna sättas till (0,2 × 100) + (0,8 × 10), eller till 28. B tycks alltså med detta förfaringssätt kunna placeras in på en exakt angiven position mellan A och C. En svårighet är emellertid att de antagna nyttovärdena för A och C är godtyckliga. Vilka andra värden som helst skulle därför kunnat användas så länge värdet för A är större än det för C. I sin tur påverkar detta naturligtvis också värdet för B. Även om man varierar värdena på A och C på alla tänkbara sätt, men med restriktionen att A skall vara större än C, så kommer emellertid B, i viss bemärkelse, att bevara sin position i förhållande till A och C.

Att visa detta, liksom att precisera den bemärkelse i vilken B bevarar sin position, kräver emellertid en del matematik som jag inte skall gå in på här. Det viktiga just här är att von Neumanns och Morgensterns tänkta experimentsituation ger en möjlighet att fånga in avstånd utefter en nyttoskala, att t ex säga att alternativet B, för en viss person, är mycket bättre än alternativet C, medan alternativet A bara är lite bättre än alternativet B. Att denna möjlighet verkligen öppnas bör vid det här laget förhoppningsvis vara åtminstone intuitivt rimligt. Dessutom visade von Neumann och Morgenstern att alla val som den antagna modellpersonen inom ramen för deras resonemang kunde tänkas göra, d v s alla tänkbara val mellan alternativ eller mellan lotterier avseende alternativ, var logiskt förenliga. Några intransitiviteter eller andra motsägelser gick inte att härleda ur antagandena. Detta innebar, annorlunda uttryckt, att en enda entydig och logiskt sammanhängande nyttoskala, med avståndsinnebörd, kunde härledas ur modellens preferenser.

Denna nyttoskala hos von Neumann och Morgenstern är ett exempel på vad som brukar kallas en kardinal nyttoskala. Det karakteristiska för en sådana skala är just att nyttoavstånd får en preciserad innebörd. Fortfarande är det emellertid inte fråga om en absolut nyttoskala. Värdena på de alternativ man utgår från, i vårt fall A och B är ju, med reservation för den inbördes ordningen, godtyckliga. Den kardinala skalan anger alltså bara i viss bemärkelse avstånd mellan alternativ, inte några absoluta lägen hos alternativen.

Innan jag för tillfället lämnar von Neumann och Morgenstern skall jag ta upp ytterligare ett par saker. I exemplet ovan antog vi att modellpersonen var indifferent mellan alternativet B och lotteriet med A och C som utfall vid p lika med 0,2. Vi sade också att alternativet B under dessa förhållanden kunde tillskrivas nyttan 28 om A och C gavs nyttovärdena 100 respektive 10. Detta innebär naturligtvis också att lotteriet med A och C som utfall har nyttan 28. När lotteriet faktiskt spelas kommer emellertid antingen nyttan 100 eller 10 att bli verklighet, något utfall med nyttan 28 finns inte. För att markera detta brukar man säga att lotteriet har den förväntade nyttan (eng. expected utility) 28.

För att kunna beröra en annan intressant omständighet skall jag till sist göra om exemplet något. Vi släpper tanken på att alternativen A och C åsatts de godtyckliga nyttovärdena 100 och 10 och tänker oss istället att A betyder att vår modellperson får 100 kronor, och C att hon får 10 kronor. Vi antar också att alternativet B innebär att personen får 28 kronor. Därefter kan vi fråga oss vilket sannolikhetstal som skall karakterisera ett lotteri mellan A och C för att personen skall vara indifferent mellan lotteriet och alternativet B. Det intressanta är att svaret inte alls med nödvändighet är 0,2. Vilket svaret blir är beroende av modellpersonens s k attityd till risk. Om hon har en positiv attityd till risk, d v s är vad som med vanligt språkbruk brukar kallas riskbenägen, så blir sannolikheten istället mindre än 0,2. En lägre sannolikhet för det värdefullaste alternativet A kompenseras för en sådan person av det upphetsande i att få delta i ett lotteri. Om personen emellertid inte är en gambler, och inte uppskattar denna slags spänning i tillvaron, utan istället skyr risksituationer, blir sannolikheten istället större än 0,2. Riskattityder av detta slag har blivit föremål för en omfattande teoribildning, som bl a tar upp frågor om varför människor deltar i lotterier, och varför de försäkrar sig. Allt detta måste vi emellertid lämna åt sidan i denna framställning. Det viktiga här är att möjligheten av olika riskattityder är beaktad i von Neumanns och Morgensterns nyttoteori. De nyttovärden som preciseras i den inbegriper, vilket bör ha framgått av redogörelsen ovan, såväl modellpersonens värdering av de faktiska utfallen som hennes attityd till risk. Det är ju just därför som förekomsten av olika riskattityder bara kan demonstreras genom att kronvärden förs in vid sidan om nyttovärden.

Resonemangen hittills i detta avsnitt har varit renodlade modellresonemang - bl a har, som jag redan flera gånger framhållit, de rangordnande personerna varit modeller som utrustats med vissa egenskaper. Vilka skalor som är användbara för att beskriva preferenser hos verklighetens människor är därför beroende av i vilken utsträckning dessa människor liknar modellernas människor. Om de verkliga människornas preferenser åtminstone i huvudsak är transitiva så bör dessa preferenser åtminstone hyggligt kunna beskrivas med en ordinal nyttoskala, annars inte. Om verklighetens människor dessutom, vilket är mera tveksamt, kan rangordna lotterier på samma sätt som personen i von Neumanns och Morgensterns modell, så kan deras preferenser också beskrivas med en kardinal nyttoskala. Om inte går det kanske att konstruera någon annan kardinal skala baserad på något alternativ till von Neumanns och Morgensterns lotteriidé, men något lika genomtänkt sådant alternativ känner åtminstone inte jag till.

De berörda frågorna om vilka modeller som bäst beskriver människors preferenser är komplicerade och knappast besvarade på ett sätt som vunnit allmän acceptans. Flera olika uppfattningar finns företrädda. I argumentationen kring de olika uppfattningarna har det meningskriterium som utformades av de logiska empiristerna under 1920-talet i Wien spelat en betydande roll. Enligt detta kriterium förstår man, för att uttrycka saken enkelt, vad ett påstående betyder när man vet hur det skall prövas. En del menar att man genom experiment eller i intervjuer aldrig kan belägga annat än att en person tycker mer om något än om något annat, d v s att påståenden om nyttoavstånd är oprövbara och därmed också meningslösa. Dessa personer menar därmed också att skalor som är innehållsrikare, eller säger mer än en ordinal nyttoskala är meningslösa. Andra menar emellertid att påståenden om nyttoavstånd låter sig preciseras, t ex på von Neumanns och Morgensterns vis, och prövas, och därmed också är meningsfulla. Sådana personer tror därmed också på möjligheten av en kardinal nyttoskala.

Hela vår diskussion hittills har gällt inompersonliga, eller s k intrapersonella, jämförelser av nyttor. Vårt intresse har ju hela tiden gällt möjligheterna att jämföra en viss persons nytta av något med samma persons nytta av något annat. Utöver detta har nyttoteoretiker emellertid också i stor utsträcknig intresserat sig för möjligheten att göra interpersonella nyttojämförelser, d v s möjligheten att på ett meningsfullt sätt jämföra nyttan av något för en viss person med nyttan av samma sak för en annan person. Är det t ex, har man frågat sig, meningsfullt att säga sådant som att Andersson tycker mer om fisk än vad Pettersson gör. Uppfattningen att sådana jämförelser är omöjliga, vilken bl a stötts med hjälp av de logiska empiristernas meningskriterium, har spelat en stor roll i den ekonomiska teoriutvecklingen.

Genom den s k marginalismens genombrott i slutet av 1800-talet gavs noggranna nyttoresonemang en central roll i den ekonomiska teorin. Grundläggande pristeoretiska problem, t ex den s k värdeparadoxen, var dessförinnan olösta. Paradoxen bestod i att en vara som vatten, trots sin livsnödvändighet, kostade så lite eller ofta t o m var gratis, medan en del i grunden helt onödiga saker som t ex diamanter till smycken kunde betinga mycket höga priser. Olika försök att lösa upp paradoxen, t ex genom arbetsvärdeteorin, hade gjorts men visat sig behäftade med alltför uppenbara svagheter. Problemet löstes först av marginalisterna som gav nyttan för en konsument av den sist tillförda enheten av en vara, till skillnad från den totala nyttan, en central roll i prisbestämningen. Priset blev, inom ramen för ett resonemang som även inbegrep utbudsfaktorer, lika med den s k marginalnyttan. Denna gräns- eller marginalnytteteori som utvecklades av några av 1800-talets och det tidiga 1900-talets största ekonomer, främst fransmannen Léon Walras (1834-1910), engelsmannen W. Stanley Jevons (1835-82) och österrikaren Carl Menger (1840-1921), åstadkom en revolution inom nationalekonomin och markerar inledningen till vad som brukar kallas den neoklassiska epoken.

Hur de tidiga marginalisterna såg på möjligheten av intra- och interpersonella nyttojämförelser är kanske inte helt klarlagt. Att de inte var helt främmande för uppfattningar som långt senare skulle presenteras som betydelsefulla nyheter kan emellertid illustreras med ett citat från Stanley Jevons, som vid ett tillfälle skrev så här (citatet taget från Cooter & Rappoport, 1984):

The reader will find, again, that there is never in any single instance, an attempt made to compare the amount of feeling in one mind with that in another. I see no means by which such comparison can be accomplished. The susceptibility of one mind may, for what we know, be a thousand times greater than that of another. But, provided that the susceptibility was different in a like ratio in all directions, we should never be able to discover the difference. Every mind is thus inscrutable to every other mind, and no common denominator of feelings seem to be possible. Att Jevons hade sina tvivel på de interpersonella nyttojämförelsernas möjlighet är alltså uppenbart.

Dessa tidiga, men kanske inte systematiserade, insikter hos en del tidiga teoretiker hindrar emellertid inte att den s k ordinalismens genombrott under 1930-talet brukar betraktas som en omvälvning inom nationalekonomin. Inspirerade av de logiska empiristerna hävdade ordinalisterna, med ekonomen John Hicks (1904-1989) som förgrundsgestalt, för det första att alla kardinala, intrapersonella nyttojämförelser, och alla interpersonella nyttojämförelser, var meningslösa - den ekonomiska teorin kunde endast acceptera de ordinala intrapersonella jämförelserna. För det andra hävdade de att den ekonomiska teorin faktiskt kunde byggas upp med utgångspunkt från enbart ordinala intrapersonella nyttojämförelser. Inga resultat förutsatte de meningslösa kardinala eller interpersonella jämförelserna.

Som en illustration till denna senare tes kan vi tänka oss att Andersson köper en häst av Pettersson. Möjligen kan man tycka att köpet visar att Andersson sätter större värde på hästen än vad Pettersson gör, och därmed också är uttryck för en interpersonell nyttojämförelse. Ett sådant synsätt är emellertid inte invändningsfritt. I transaktionen ingår också en köpeskilling, låt oss säga 10 000 kronor. Med beaktande av den innebär bytet att Andersson hellre vill ha hästen än 10 000 kronor, medan Pettersson hellre vill ha 10 000 kronor än hästen. Dessa Anderssons och Petterssons preferenser är fullt tillräckliga för att förklara hela transaktionen. Bytet ger alltså i själva verket uttryck åt två stycken intrapersonella, ordinala nyttojämförelser, inte åt en interpersonell sådan.
 
 

SPELTEORI

Spelteorin etablerades på allvar 1944 då matematikern John von Neumann (1903-1957) och ekonomen Oskar Morgenstern (1902-1977) publicerade sitt stora arbete The Theory of Games and Economic Behavior.1 Tidigare hade båda författarna, var och en för sig, intresserat sig problem inom området. Det var emellertid den gemensamma ansträngningen som ledde till en något så när enhetlig teoribildning, och också till själva beteckningen spelteori. von Neumanns och Morgensterns bok väckte ett oerhört intresse och tände också starka förhoppningar om stora samhällsvetenskapliga genombrott. Förhoppningarna infriades emellertid knappast och spelteorins konjunkturer har därefter varierat. Att spelteorins grundläggande begrepp och betraktelsesätt berikat samhällsvetenskaperna är väl de flesta idag överens om. Det samhällsvetenskapliga värdet av den matematiska kalkylen inom spelteorin, såsom den hittills utvecklats kanske man skall tillägga, är däremot mera diskutabelt.
 
 

Figur 28

I figur 28 illustreras en spelsituation på ett sätt som är vanligt inom spelteorin. Två spelare, A och B, deltar i spelet. A kan välja mellan fem olika strategier, nämligen a1-a5, och B kan på samma sätt välja mellan de fyra strategierna b1-b4. Rutorna i figuren betecknar resultaten eller de s k utfallen. I varje ruta finns två siffror varav den första markerar resultatet för A och den andra resultatet för B. Tills vidare, och provisoriskt, kan vi tänka oss att siffrorna betecknar kronor. Om t ex A spelar strategin a4 , och B strategin b4, så får alltså A 17 kronor och B blir av med 17 kronor. Så här långt har figur 28, det skall kanske framhållas, inte tjänat något annat syfte än att visa ett vanligt sätt inom spelteorin att precisera en spelsituation mellan två spelare. Det viktiga är därvid själva rutschemat, den s k matrisen. Ingenting hindrar naturligtvis att antalet strategier för respektive spelare kan variera hur som helst, och detsamma gäller de två siffrorna i varje ruta. Det är t ex inte nödvändigt att de är lika stora och av motsatt tecken, som i figuren - men mer om det senare.

Efter detta kommer vi så till de centrala frågorna om hur spelarna bör spela (normativt), eller kommer att spela (deskriptivt). Om den normativa frågan har ett självklart och uppenbart svar, så gäller det svaret sannolikt också för den deskriptiva frågan. Det förefaller ju rimligt att spelarna faktiskt kommer att bete sig på det uppenbart rationella sättet. Om den normativa frågan däremot inte har ett självklart svar så blir allt förstås mer komplicerat.

Låt oss se saken från A:s synpunkt. Antag först att A av ett eller annat skäl vet hur B kommer att agera, t ex att B kommer att välja strategin b4. I så fall är A:s problem enkelt. Naturligtvis kommer han att välja strategin a4 , vilken ger honom den högsta möjliga utdelningen, 17 kronor, när B spelar b4. (17 är störst av talen -6, 12, -3, 17 och 12.)

Efter detta måste vi emellertid lämna det orimligt förenklande antagandet att A vet vad B kommer att göra. Det karakteristiska för en egentlig spelsituation är nämligen att ingendera parten vet vad den andre kommer att göra, och det är under sådana betingelser som båda parterna, var och en från sina utgångspunkter, skall försöka bete sig så klokt som möjligt. Det är detta problem vi nu försöker diskutera utifrån A:s situation. Hur kan A tänkas resonera? Eftersom han inte vet vad B kommer att göra så skulle han t ex, om han är försiktigt lagd, kunna fråga sig vad varje strategi i värsta fall kan föra med sig. Om han väljer strategin a1 så kan resultatet för hans egen del, beroende på vad B gör, bli 10, -7, -8 eller -6. Det sämsta av dessa resultat är alltså -8, vilket markerats längst ut till höger i figuren. Om han istället väljer strategin a2 så är på motsvarande sätt -7 det värsta som kan hända honom. För strategierna a3, a4 och a5 blir de värsta utfallen på samma sätt -4, -6 respektive -8. Efter detta kan man tänka sig att A väljer den strategi som gör det värsta som kan hända honom så lindrigt som möjligt. Han väljer i så fall strategin a3 eftersom -4 är det största av talen i figurens högra kant. Detta sätt att resonera sig fram till ett strategival är naturligtvis inte det enda möjliga, men det förefaller rimligt och sammanhängande. Som redan framhållits är det också påfallande försiktigt.

Låt oss nu anta att B resonerar på samma sätt. De värsta resultat han kan drabbas av är -10 för strategin b1 , 4 för strategin b2 , o s v. Dessa resultat anges av talen i figurens underkant. Det största av dessa tal, 4, inträffar för strategin b2, och om B resonerar som vi antar så väljer han alltså den strategin.

Om båda spelarna resonerar på det beskrivna sättet kommer alltså A fram till strategin a3 och B till strategin b2, d v s A blir av med 4 kronor och att B får 4 kronor. Men blir det verkligen så? Vi antog ju tidigare att vardera spelaren motiverade sin försiktighet med att han inte visste hur motparten skulle bete sig - om denna ovisshet inte förelegat så hade spelarna alltså möjligen agerat på annat sätt. Och kanske behöver osäkerheten inte vara så stor. Om A tycker det är klokt att resonera på det sätt som han själv gör, så kan han ju tänka sig att B också resonerar på samma sätt. A kan alltså resonera sig fram till att det finns skäl för B att välja strategin b2 - inte tvingande skäl visserligen, men rätt hyggliga ändå. Och på samma sätt kan B resonera sig fram till att A har skäl att välja strategin a3.

Men om A misstänker att B kommer att välja strategin b2 , och B på samma sätt misstänker att A väljer strategin a3, så är ju de båda spelarnas ovisshet inte så total som vi först antog. Det finns därför stor anledning att undersöka hur spelarna skulle bete sig om A faktiskt visste att B skulle spela b2, och B på samma sätt visste att A skulle spela a3. Om denna kunskap skulle få de båda spelarna att ändra sina strategier, d v s få A att spela något annat än a3 och B något annat än b2, så skulle hela vårt resonemang sluta i förvirring. Frågorna om hur spelarna bör, eller kan väntas, bete sig skulle stå kvar totalt obesvarade.

Låt oss alltså se hur det faktiskt förhåller sig. Om A vet att B spelar b2 så har A resultaten -7, -5, -4, -5 och -6 att välja på. Det bästa av dessa, -4, inträffar om A väljer strategin a3. I just detta spel får A:s kunskap om B:s strategival honom alltså inte att ändra sin strategi. Och på samma sätt förhåller det sig med B. Om B vet att A spelar a3, så är b2 fortfarande det bästa för B. Utdelningen 4 vid b2 är ju större än någon annan utdelning som B kan få om A spelar a3.

Det beskrivna spelet har alltså ett resultat som i en viss bemärkelse är stabilt. Vardera spelaren väljer efter ett visst kriterium sin strategi och håller sig sedan till den även om spelaren får reda på, eller kan räkna ut, hur motparten agerar. Ett stabilt resultat av detta slag brukar kallas för en lösning, och strategiparet a3 och b2 kan alltså sägas vara en lösning till vårt speciella spel. För ett strikt och bindande resonemang måste lösningsbegreppet naturligtvis definieras exaktare än på detta sätt, men jag har förhoppningsvis ändå förmedlat en känsla för vad en lösning är för något. Därmed är vi också framme vid spelteorins grundproblem, nämligen att utreda vilka typer av spel som har lösningar i den nämnda, eller någon annan snarlik och rimlig bemärkelse. Även för att kunna ge en aldrig så kort antydan om resultaten av dessa strävanden är det nödvändigt att säga något om vilka typer av spel som spelteorin räknar med.

En första distinktion är den mellan två- och flerpersonersspel. I det beskrivna spelet deltog de två spelarna A och B, och det var följaktligen ett tvåpersonersspel. Utöver sådana spel behandlar spelteorin emellertid också spel med tre eller flera deltagare. Detta leder till avsevärt mer komplicerade resonemang som bl a inkluderar koalitionsbildning och kompensationsbetalningar - eller sidobetalningar som man vanligen säger i spelteoretiska sammanhang.

En annan och något svårare distinktion är den mellan nollsumme- och icke-nollsummespel. I vårt tidigare spel var summan av utdelningarna till de båda spelarna, alltså summan av de båda talen i varje ruta, genomgående noll. Spelet är också ett exempel på ett nollsummespel. Ibland sägs det karakteristiska för sådana spel vara att den enes vinst alltid är den andres förlust. Man kan också säga att ett nollsummespel karakteriseras av att spelarnas intressen genomgående är strikt motsatta, och av att gemensamma intressen sålunda saknas. Innebörden av denna karakteristik kommer att klarna lite senare när vi diskuterar det icke-nollsummespel, som brukar kallas fångarnas dilemma. Där, liksom i andra icke-nollsummespel, förekommer såväl motsatta som gemensamma intressen.

Men även om alla dessa karakteriseringar kan ge en känsla av vad ett nollsummespel är för något, så är de likväl något lösliga. Att här ge en exakt definition av nollsummebegreppet skulle föra för långt, men det är ändå möjligt att tala om vari lösligheten består. Jag nämnde tidigare att siffrorna i figur 28 kunde tänkas beteckna kronor, men bara provisoriskt. Det är just här som skon klämmer. I sin strikta uppbyggnad av spelteorin arbetar von Neumann och Morgenstern inte med kronor eller andra penningmått, utan med nyttovärden. I sin tur är dessa baserade på den statistiska nyttoteori som omnämndes i föregående avsnitt. Nyttovärdena i den teorin är intrapersonellt jämförbara med en kardinal skala, vilket innebär att avstånd utefter skalan kan tillskrivas viss mening. Däremot är nyttovärdena inte interpersonellt jämförbara. Detta senare innebär förstås att nyttovärden för olika individer inte kan adderas på ett meningsfullt sätt. Bl a är det t ex otillåtet, eller meningslöst, att addera nyttovärdena för de två spelarna i en spelmatris och därmed också att säga att summan är noll. Det är just därför som definitionen av nollsummebegreppet måste bli mer teknisk än vad som antytts ovan. En sådan definition finns emellertid och det är fullt möjligt att strikt skilja mellan nollsumme- och icke-nollsummespel.

För att spelteorins resultat skall kunna beskrivas måste ytterligare en distinktion klargöras, nämligen den mellan rena och blandade strategier. Strategierna för A och B i vårt tidigare spel, alltså a1-a5 och b1-b4, var alla rena strategier. En blandad strategi för en spelare är en sannolikhetsfördelning över spelarens rena strategier sådan att sannolikheternas summa blir 1. Ett exempel på en blandad strategi för spelaren A är t ex sannolikheten 0,1a1 , 0,2 på var och en av a2 - a4 , och sannolikheten 0,3a5. Den blandade strategin kan effektueras med hjälp av en slumpmekanism, t ex ett tombolahjul vars omkrets delas in i områden för strategierna a1-a5 i proportion till varje strategis sannolikhet. Att i praktiska sammanhang tolka innebörden av sådana blandade strategier kan vara nog så komplicerat, men det viktiga just nu är att strategier av detta slag faktiskt råkar spela en central roll i spelteorin, så som den är uppbyggd.

Beträffande spelteorins resultat kan nu följande sägas. Tvåpersoners nollsummespel har alltid en lösning i ungefär samma bemärkelse som vårt spel ovan, d v s en lösning som garanterar var och en av spelarna ett visst minimalt resultat och som är stabil. Ibland kan den lösningen, som i exemplet ovan, innebära att rena strategier spelas. Sådana lösningar är dock undantag. I det allmänna fallet måste istället blandade strategier användas. Med sådana strategier finns emellertid alltid en lösning. Detta resultat, som bevisades av von Neumann redan i slutet av 1920-talet, är det klassiska s k minimaxteoremet. För andra spel än tvåpersoners nollsummespel har de mycket omfattande ansträngningarna att hitta någon form av något så när självklara lösningar emellertid i allt väsentligt varit fruktlösa. Detta är också ett väsentligt skäl, för att inte säga huvudskälet, till spelteorins begränsade användbarhet och spridning hittills. Verkliga situationer avbildas ju rimligen i allmänhet mycket bättre av dessa andra spel än av tvåpersoners nollsummespel. Redan inledningsvis i detta avsnitt kunde vi ju också konstatera att om det inte går att säga hur spelarna bör spela (den normativa frågan), så är det knappast heller möjligt att säga hur de faktiskt kommer att spela (den deskriptiva frågan).

Men även om det visat sig svårt eller omöjligt att hitta lösningar, och den generellt inriktade spelteorin så tillvida stött på svårforcerade hinder, så är ju avsaknaden av självklara lösningar på sitt sätt också ett resultat. Verkligheten är ju sådan som den är, det är den som skall analyseras. Om lösningar saknas behöver det därför inte bero på något "fel" på spelteorin, utan kan lika gärna hänga samman med verklighetens beskaffenhet. Om man mera exakt kan peka på de omständigheter som förhindrar en lösning, och också säga något om tänkbara beteenden under sådana förhållanden, så kan just det därför vara av betydande intresse. En del spelteoretiska formuleringar av konfliktsituationer har faktiskt visat sig instruktiva och användbara i många sammanhang på just det sättet. Kanske kan man t o m hävda att detta är den mest betydelsefulla samhällsvetenskapliga användningen av spelteorin hittills. Den mest spridda av dessa spelteoretiska metaforer eller modeller är antagligen den som brukar betecknas fångarnas dilemma.

Dilemmat ser ut som följer. En åklagare är övertygad om att två häktade personer tillsammans begått ett allvarligt brott, men erkännanden saknas. Han ställer dem då inför de alternativ som illustreras i figur 29. Om ingen av dem erkänner så kommer fångarna att få ett års fängelse var för en del mindre brott, som man under alla förhållanden vet att de gjort sig skyldiga till. Om en av dem erkänner och den andra inte, så belönas den erkännande med att bara få tre månader, medan den icke erkännande, som ju då bundits vid brottet, får tio års fängelse. Om båda erkänner så får de åtta års fängelse var.
 
 

Figur 29

Antag nu att fångarna inte kan kommunicera med varandra. Var och en av dem sitter i sin cell med matrisen i figur 29 framför sig och funderar över det kloka i att erkänna respektive inte erkänna. Låt oss se saken från A:s synpunkt. Att inte erkänna förefaller på sitt sätt tilltalande för honom. Om inte heller B erkänner blir ju straffet bara ett år, vilket inte är särskilt mycket jämfört med t ex åtta eller tio år. Å andra sidan är det emellertid också riskabelt. Om B istället erkänner så drabbas ju A själv av ett straff på hela tio år. Dessutom har ju erkännandet för B sin alldeles egen lockelse eftersom det, med lite tur, kan minska hans straff till bara tre månader. Under den osäkra förutsättningen att A inte erkänner blir det ju så. Men trots denna lockelse kanske A är obenägen att tro att B skulle lämna honom i sticket just denna gång genom att erkänna. "Under vårt hittillsvarande samarbete", kanske A säger sig, "har ju B alltid varit lojal och solidarisk i svåra situationer". "Och dessutom", kanske han tillägger, "ser förstås B värdet i att vi båda kan operera tillsammans också i framtiden". Uppenbarligen är det inte lätt för A att komma fram till rationellt grundat beslut i den beskrivna situationen. Och för B framstår allt, med samma argument, i samma dager. Båda fångarna har skäl både för och emot att erkänna, och för och emot att inte erkänna. Det är detta som är deras dilemma.

Så mycket lättare behöver det inte heller bli om man antar att fångarna kan kommunicera med varandra. Visserligen kan man tycka att de då borde kunna träffa en överenskommelse om att inte erkänna och alltså komma undan med ett år var. Men för båda fångarna finns också starka incitament att bryta en sådan överenskommelse. Antingen därför att möjligheten att vara den ende som bryter hägrar, och därmed det låga straffet på 3 månader. Eller därför att risken att den andra skall bryta överenskommelsen, med ett hotande straff på 10 år för egen del, bedöms vara stor.
 
 

Figur 30

De piskor och morötter, eller den s k incitamentsstruktur, som utgör fångarnas dilemma förekommer också i många andra sammanhang, varför dilemmat kan betraktas som en metafor med mera allmän tillämpning. Vanligen brukar spelmatrisen framställas som i figurerna 30, 31 och 32, där talen kan betraktas som nyttovärden eller, om man så vill, som något annat, t ex penningbelopp - ju större ett tal är desto bättre är det alltså. Storleksordningen mellan talen är densamma i alla tre figurerna så tillvida att det största talet för spelaren A finns i nedre vänstra rutan, det näst största talet i övre vänstra rutan, det näst minsta i den nedre högra rutan och det minsta talet i den övre högra rutan. På motsvarande sätt är ordningsföljden mellan spelaren B:s tal densamma i båda figurerna. Det är just dessa ordningsföljder som konstituerar själva definitionen av "fångarnas dilemma". Så länge de bibehålles så kan talen se ut hur som helst, t ex som i figurerna 30, 31 och 32. På samma sätt som inom spelteorin i övrigt tänkes det emellertid också vara möjligt att tala om avstånd utefter nyttoskalor. Spelsituationerna i de tre figurerna är alltså, trots de nämnda sammanfallande ordningsföljderna, inte identiska. De präglas också, var och en på sitt sätt, av de numeriska avstånden mellan respektive spelares utfall.
 
 

Figur 31

Fångarnas dilemma är ett icke-nollsummespel. Det är inte genomgående så att den enes vinst är den andres förlust. Istället innehåller spelet såväl gemensamma som motsatta intressen. Det är t ex bättre för båda spelarna att hamna i den övre vänstra rutan än i den nedre högra. Strategierna a1 och b1 brukar därför ofta kallas för samarbetsstrategier och strategierna a2 och b2icke-samarbetsstrategier.
 
 

Figur 32

Den spelteoretiska diskussionen om dilemmat har till stor del just gällt betingelserna för samarbete. Hur sannolikt är det att spelarna faktiskt väljer samarbetsstrategierna? Vilken roll spelar möjligheter till kommunikation mellan spelarna därvidlag? Kan man förutom explicita överenskommelser om samarbete också tänka sig implicita eller underförstådda sådana? Vilken roll spelar matrisens exakta utseende för en eventuell överenskommelses hållbarhet? Spelarna är t ex antagligen mindre benägna att välja samarbetsstrategier i matrisen i figur 31 än i den i figur 30. Sannolikheten för en överenskommelse är sannolikt också mindre och på det hela taget är situationen i figur 31 "nervösare". Allt detta sammanhänger förstås med att incitamenten att bryta en överenskommelse, implicit eller explicit, är så mycket starkare än i situationen i figur 30. Situationen i figur 32 avviker istället från den i figur 30 i andra riktningen och betingelserna för samarbete är där rimligen avsevärt bättre. Utdelningen för den som avviker från samarbetsstrategin är ju i den situationen mycket liten, samtidigt som konsekvenserna för den som drabbas av motpartens avvikelse bara är obetydligt värre än om båda spelar icke-samarbetsstrategin.

Jag har redan nämnt att fångarnas dilemma är en träffande metafor i många olika sammanhang. Det är t ex inte ovanligt att nedrustningsförhandlingar mellan länder beskrivs med den metaforen. Strategierna a1 och b1 står då för nedrustning och strategierna a2 och b2 för bibehållen rustningsnivå. En överenskommelse om nedrustning är, om den hålles, värdefull för båda parter eftersom båda sparar pengar och också bibehåller sin relativa säkerhetsnivå. Överenskommelsen är emellertid också farlig därför att den kan brytas. Det land som ensamt lyckas bryta överenskommelsen blir då militärt överlägset, och det drabbade landet hamnar i ett möjligen katastrofalt underläge. Visserligen sparar det land som inte bryter överenskommelsen fortfarande pengar, men i den nya och ojämna militära situationen kan den trösten vara klen.

Med hänsyn till innehållet i denna bok är emellertid en del andra tolkningar av fångarnas dilemma intressantare. Framför allt tänker jag då på sådana tolkningar som har med skapandet av ett rättssamhälle, och med samhällskontrakt av olika slag att göra. Samarbetsstrategin kan då t ex innebära att samhällsmedlemmarna kommer överens om och upprätthåller en elementär rättsordning, d v s skapar ett marknadssamhälle (beteckningarna på samhällstyper desamma som i kapitel 2), och icke-samarbetsstrategin att männsikorna fortsätter att leva i ett laglöst djungelsamhälle. Samarbetet innebär i detta fall att lag och ordning upprätthålls och att betingelser för ekonomisk tillväxt därigenom skapas. Allt detta är naturligtvis utomordentligt gynnsamt för människorna. Även i detta fall kan det emellertid vara frestande att bryta överenskommelsen, d v s att slå in på brottets väg. Och även här får ett sådant beteende en stor del av sin attraktion just av att det stora flertalet människor håller sig till överenskommelsen. Det är ju mycket trevligare att vara tjuv i ett rättssamhälle med god ekonomi, och följaktligen mycket att stjäla, än i ett primitivt djungelsamhälle. Denna och liknande tolkningar av fångarnas dilemma finns bl a hos Buchanan (1975, s 26 ff och s 64 ff).

I denna typ av tolkningar blir emellertid dilemmats egenskap av metafor än mer påtaglig än i t ex rustningsexemplet ovan. Eftersom ett samhälle alltid har mycket mer än två medlemmar måste man ju antingen tänka sig att spelresonemanget på något sätt generaliseras till en mångpersonssituation, eller också måste man betrakta alla hederliga samhällsmedborgare tillsammans som den ene spelaren, och alla tjuvar tillsammans som den andre. Båda vägarna ter sig dock intellektuellt framkomliga.

Det mest grundläggande draget i spelteorin, dess väsen om man så vill, är analysen av interaktionen mellan flera tänkande individer som försöker agera så rationellt som möjligt. Detta leder till andra resonemang än vid analysen av situationer som präglas av ofullständiga kunskaper, och det är därför också vanligt att göra en distinktion mellan osäkerhet (eng. uncertainty) och risk (eng. risk). De situationer som analyseras i spelteorin präglas av osäkerhet i denna mening, vilket innebär att omvärldens beteende, d v s de andra spelarnas beteende, är beroende av vad man själv gör. Därför är det i allmänhet också meningslöst att beskriva den bristande kunskapen om omvärlden i sannolikhetstermer. Man måste använda andra metoder, vilket är precis vad spelteoretikerna försöker göra. I samband med risk råder också okunnighet om omvärlden, men dennas beteende är i det fallet oberoende av vad man själv gör. Därför är det i allmänhet också möjligt att beskriva omvärlden med hjälp av sannolikheter och agera, d v s fatta beslut på basis av dem. Tror man t ex att det finns risk för regn under en planerad promenad så tar man ett paraply med sig, annars inte. Sådant beslutsfattande brukar ibland kallas för spel mot naturen, men egentligen är det förstås inte fråga om något spel alls. Det egentliga spelets natur är ju just att spelaren inte står mot naturen, utan mot andra spelare.
 
 

VÄLFÄRDSTEORI

I sina funderingar över det goda samhällets natur har samhällstänkare och filosofer under lång tid försökt utforma något slags kriterium för att kunna jämföra olika samhällstillstånd med varandra. Önskemålet om ett distinkt sådant kriterium är lätt att förstå. Till att börja med skulle det ju, det ligger i sakens natur, göra det möjligt att rangordna olika tillstånd som bättre eller sämre i förhållande till varandra. Dessutom skulle det ge möjligheter att med mycket större auktoritet och precision än eljest föreslå politiska eller ekonomiska åtgärder som successivt förbättrar samhällstillståndet. Ett handfast kriterium av det angivna slaget ger ju en referenspunkt för att bedöma föreslagna åtgärders effekter. Det är försöken att hitta och motivera ett jämförelsekriterium av detta slag som, åtminstone i senare och modernare utformningar, och i sina akademiskt teoretiska utformningar kanske man också skall tillägga för att utesluta t ex de vanliga politiska ideologierna, brukar kallas för välfärdsteori.

Även om de engelska utilitaristerna var för tidiga för att kallas välfärdsteoretiker i modern mening så är det ändå lämpligt att inleda diskussionen med dem. Utilitarismens hedonistiska drag, dess karaktär av njutningslära, har ofta med all rätt påtalats. Lusten eller lyckan betraktas som det goda och smärtan som det onda. I just detta sammanhang är emellertid utilitaristernas uppfattning om det godas och det ondas natur inte det väsentligaste, utan snarare deras syn på möjligheterna att mäta eller kvantifiera dessa företeelser. Bland utilitaristerna menade speciellt Jeremy Bentham (1748-1823) att den ena människans lycka eller njutning, åtminstone under ideala omständigheter, faktiskt kunde observeras och mätas, samt adderas till den andra människans uppmätta lycka, på samma sätt som man adderar vikter till varandra. Genom att på detta sätt addera alla människors lycka kunde man alltså komma fram till en total lyckosumma för hela samhället. Målet för den politiska och ekonomiska verksamheten borde vara att maximera denna summa. Detta är utilitaristernas och Benthams normativa princip om "den största möjliga lyckan".

Bentham menade alltså att ett lyckotal kunde anges för ett samhälle, åtminstone i princip, och att samhället var bättre ju större det talet var. Eftersom lyckotalet utgjorde summan av alla enskilda samhälsmedlemmars privata lyckotal förutsatte additionen att den ena personens lyckotillstånd direkt, och i kvantitativ mening, kunde jämföras med den andres. Utilitaristerna menade alltså, och för att anknyta till framställningen i avsnittet "Nyttoteori", att interpersonella jämförelser av nytta var möjliga och meningsfulla. Sådana jämförelser har emellertid, som vi sett, ansetts diskutabla, och bl a från den utgångspunkten har kritik riktats mot utilitaristerna. Utan interpersonella jämförelser är ju lyckoadditionen otänkbar.

Efter denna summariska diskussion av några utilitaristiska tankegångar förflyttar vi oss fram till det tidiga 1900-talet, men stannar kvar i England. Där utvecklades då en välfärdsteori som var avsevärt mer artikulerad än sina föregångare och ledaren för dessa strävanden var Arthur C. Pigou (1877-1959), Alfred Marshalls favoritelev och efterträdare som professor i nationalekonomi i Cambridge. Pigous välfärdsteoretiska huvudarbete är The Economics of Welfare (1920).

Pigou och hans meningsfränder menade att mänskliga behov och önskemål kunde rangordnas i en hierarkisk struktur.2 Mest grundläggande och angelägna var de materiella behoven, och då framför allt de som avsåg mat, kläder och husrum, för vilka termen necessaries ibland användes. Därefter kom andra behov, med ett möjligen mindre materiellt innehåll, vilka kunde betecknas med termerna comforts och luxuries. Vidare ansåg Pigou att alla, eller åtminstone nästa alla, människor hade i stora drag samma behovsstruktur och sålunda liknade varandra i detta väsentliga avseende. Nästan alla människor försökte först tillgodose sina grundläggande materiella behov. Först därefter tillgodosåg de också andra behov i mån av möjligheter.3

Ur dessa grundläggande idéer härleddes sedan ett jämlikhetsideal. För att se hur detta gick till kan vi utgå från ett tillstånd med en mycket ojämn fördelning av samhällets resurser, d v s ett tillstånd sådant att en del människor inte ens kunnat tillgodose sina mest elementära materiella behov medan andra inte bara gjort det, utan också tillgodosett en lång rad andra, mindre angelägna, behov. Om resurser då flyttas från de rikare till de fattigare kommer en del mindre angelägna behov, som dittills varit tillgodosedda, upphöra att vara så, medan andra mer angelägna behov istället blir tillgodosedda. Omfördelningen skulle alltså medföra att resurserna i samhället i större utsträckning används för att tillgodose grundläggande och angelägna behov, och den totala behovstillfredsställelsen skulle därför öka. På samma sätt som hos utilitaristerna förutsätter naturligtvis detta tal om total behovstillfredsställe att enskilda inidividers nyttor kan adderas och att alltså någon form av interpersonell nyttojämförelse kan göras.

Utöver denna grundläggande jämlikhetsidé innehöll Pigous välfärdsteori också ett antal uppfattningar om vad som bestämmer den totala resursproduktionen i samhället. Pigou menade att denna produktion borde vara så stor som möjligt, ty då maximerades ju också möjligheterna att tillgodose människornas behov, från de angelägnaste och mest grundläggande materiella basbehoven till behoven högre upp i behovshierarkin.

Till att börja med ansåg Pigou att jämlikhetssträvanden på olika sätt kunde påverka resursproduktionen. Jämlikhetspolitiken kunde därför inte drivas doktrinärt och i blindo utan måste istället modifieras med hänsyn till effekterna på produktionen. En sådan effekt som Pigou räknade med var att incitamenten att producera, och därmed också själva produktionen, kunde påverkas negativt av omfördelningar. Pigou såg emellertid också tänkbara positiva effekter av jämlikhetsfrämjande omfördelningar. Han menade t ex att välnärda människor som får äta tillräckligt arbetar bättre än andra, och att det följaktligen också därför är angeläget att i möjligaste mån, genom omfördelningar, tillgodose allas grundläggande basbehov.

Pigous resonemang om produktionens betingelser har emellertid sin tyngdpunkt i analysen av de s k marknadsimperfektionerna. Utgångspunkten därvidlag är föreställningen att den sociala eller samhälleliga nyttan av en viss produktionsinsats inte nödvändigtvis behöver sammanfalla med den privata nyttan, d v s den nytta som manifesteras i olika privata ekonomiska redovisningar som t ex företagsbokslut. Istället kan den totala sociala nyttan av en viss produktionsinsats vara både större eller mindre än den privata nyttan. När dessa båda nyttor inte sammanfaller föreligger s k externaliteter eller externa effekter, vilket innebär att andra aktörer än de som direkt deltar i marknadstransaktionerna i en viss speciell situation också påverkas av transaktionerna. Är den sociala nyttan större än den privata talar man om positiva externa effekter, i motsatta fallet om negativa sådana effekter. Möjligheten för människor att under sina dagliga promenader gå förbi och beskåda vackra trädgårdar, som de själva inte bidragit till, kan anföras som exempel på det tidigare, och miljöföroreningar av skilda slag som exempel på det senare.

Pigou menade att produktionen av olika varor och tjänster påverkas av förhållandet mellan den sociala och den privata nyttan. Produktionen av sådana varor för vilka den sociala nyttan är större än den privata nyttan, d v s en produktion med positiva externa effekter, tenderar att bli mindre än optimalt, eller helt enkelt för liten. Produktion med negativa externa effekter har istället en tendens att bli för stor.

Betydelsen av "för liten" och "för stor" i dessa sammanhang är knappast självklar, men kan anges på följande sätt. Antag att det råder marknadsjämvikt i den bemärkelsen att alla aktörer som har möjlighet att delta i en viss sorts transaktion är nöjda sina produktions- och konsumtionsbeslut. Om det då fortfarande finns kvar en otillfredsställd efterfrågan, som av ett eller annat skäl inte kan komma till uttryck på marknaden, så är produktionen för liten. För att återknyta till det tidigare exemplet så kan sålunda flanörerna ha svårt att ge ett marknadsmässigt uttryck för sin uppskattning av vackra trädgårdar. Institutioner för sådant, t ex bössor som man tvingas lägga pengar i när man passerar trädgårdarna, brukar helt enkelt saknas. Om emellertid sådana institutioner skapas skulle antagligen fler trädgårdar anläggas. Innebörden av att en viss produktion är "för stor" kan beskrivas på likartat sätt.

Man kan nu säga att närhelst den samhälleliga nyttan av en viss produktion är större eller mindre än den privata nyttan, så föreligger enligt Pigou en marknadsimperfektion i den bemärkelsen att marknaderna, om de lämnas åt sig själva, inte ger optimala resultat. Om effekterna av olika marknadsimperfektioner kunde undanröjas skulle värdet av den totala produktionen i samhället, d v s produktionens förmåga att tillgodose faktiska och genuina behov, bli större än eljest. Det är därför viktigt att närmare kartlägga orsakssammanhangen bakom olika typer av marknadsimperfektioner, och att föreslå politiska ingrepp för att korrigera dem. Det var precis detta Pigou försökte göra.

Under 1930-talet blev Pigous välfärdsteori föremål för hård kritik som riktades mot teorins metodologiska grundvalar. Kritiken, som i första hand formulerades av ekonomen Lionel Robbins (1932), var samtidig med ordinalismens genombrott (se avsnittet "Nyttoteori") och tog sin utgångspunkt i delvis nya föreställningar om vad ekonomisk vetenskap var och borde vara för något. Inspirationen kom delvis från den logiska empirismen inom filosofin och kritiken mot Pigou och hans meningsfränder gällde framför allt deras interpersonella jämförelser av nytta. Huruvida kritiken, som alltså riktades mot den ovan beskrivna föreställningen om en värdehierarki och därpå grundade jämförelser mellan olika människogruppers behovstillfredsställelse, verkligen var berättigad har diskuterats senare (Cooter & Rappoport, 1984). På den tid det begav sig var kritiken emellertid framgångsrik.4

Men om olika samhällstillstånd inte kunde jämföras med varandra på det sätt som Pigou föreslagit, hur skulle man då göra istället. Den metod som föreslogs, och efter hand också accepterades, var att använda ett kriterium som ursprungligen formulerats av den italienske ekonomen och sociologen Vilfredo Pareto (1848-1923). Enligt detta kriterium, det s k paretokriteriet, sägs ett visst samhällstillstånd vara bättre än ett annat om det för varje medborgare, enligt medborgarens egen uppfattning, är bättre. Med tillämpning av samma kriterium kan man då också säga att ett tillstånd är så bra som möjligt, eller paretooptimalt, om det är sådant att ingen medborgare, enligt sin egen uppfattning, kan få det bättre, utan att någon annan, enligt sin uppfattning, får det sämre. Befinner sig samhället i ett sådant tillstånd så går det ju inte att genomföra en paretoförbättring, d v s en förbättring för samtliga.

Det sagda kan illustreras med en enkel illustration som avser ett samhälle med bara två medborgare, A och B (figur 33). Dessa båda medborgares möjligheter att komma i besittning av sådant som är av värde eller nytta för dem är naturligtvis inte obegränsade. Istället finns en klar gräns som bestäms av de rådande möjligheterna att producera varor och tjänster i samhället. I figuren anges denna gräns av kurvlinjen. Området innanför linjen är alltså det möjligas område - alla punkter inom det området kan uppnås och inga punkter utanför området är tillgängliga. För att konkretisera det hela kan man tänka sig att de båda personerna A och B tillverkar var sin vara, och att var och en av dem dessutom har en distinkt gräns för sin produktionsförmåga. Var och en av dem producerar alltså sin vara i en takt som ligger någonstans mellan noll och produktionsgränsen. Dessutom tänker vi oss att de båda personernas samlade produktionsresultat fördelas mellan dem så att var och en får en blandning av de båda varutyperna. För varje produktionskombination beaktas alla fördelningsmöjligheter, såväl marknadsmässiga som andra. Punkterna i området innanför kurvan kan då tänkas representera värdet för A respektive B av alla tänkbara produktions- och fördelningskombinationer i vårt samhälle.

För att illustrera paretokriteriets innebörd kan vi nu först välja ut en punkt inne i det fyllda området, t ex punkten p1. Uppenbarligen kan både A och B få det bättre än i den punkten. Alla punkter inom den särskilt markerade sektorn "nordöst" om p1 är ju bättre för båda parter och representerar alltså förbättringar enligt paretokriteriet.
 
 

Figur 33

Låt oss nu istället se på en punkt som ligger någonstans på själva kurvlinjen, t ex punkten p2. Uppenbarligen kan A inte få det bättre än vad han har det där utan att B samtidigt får det sämre, och B kan inte heller få det bättre utan att A får det sämre. Punkten p2 är alltså paretooptimal i den mening som detta begrepp definierats ovan. Men detta gäller förstås inte bara punkten p2 utan varje punkt som ligger på kurvlinjen - för varje sådan punkt kan man ju argumentera på precis samma sätt som vi gjort för p2. Det finns alltså inte bara en, utan en hel mängd, paretooptimala punkter, och dessa befinner sig samtliga på kurvlinjen i figuren.

Att det finns en hel mängd paretooptimala punkter är av betydelse i olika avseenden. Till att börja med innebär det att paretokriteriet inte är fullständigt. Ibland ger det en möjlighet att rangordna olika samhällstillstånd i förhållande till varandra, ibland inte. Kriteriet ger sålunda ingen möjlighet att sinsemellan rangordna de tillstånd som representeras av punkterna på kurvlinjen. Ändå skiljer sig dessa tillstånd kraftigt åt, bl a från fördelningssynpunkt, vilket ofta har påpekats. Punkten p3 med sin extremt ojämna fördelning mellan den rike A och den fattige B är sålunda paretooptimal likaväl som punkten p2.5

För att återgå till den välfärdsteoretiska diskussionen är det är lätt att förstå paretokriteriets attraktivitet i den. Framför allt var det tilltalande därför att alla behov av interpersonella nyttojämförelser försvann. De enda nyttojämförelser som behövs för att kriteriet skall kunna tillämpas är ju, som vi sett i anslutning till t ex figur 33, intrapersonella rangordningar av samhällstillstånd. Och just sådana jämförelser är ju, som vi såg i avsnittet "Nyttoteori", de minst diskutabla av alla nyttojämförelser. Men samtidigt har kriteriet också sina brister. Vi har redan sett att det inte är användbart för rangordning sinsemellan av de punkter som ligger på kurvlinjen och till detta kommer att också många andra jämförelser mellan punkter är omöjliga att göra. Se t ex på punkterna p1 och p2. Den tidigare punkten är bäst för A, den senare för B, och följaktligen går det inte att säga att den ena punkten är paretobättre än den andra.

I verkliga sammanhang kan denna senare brist vara ytterligt besvärande. Politiska åtgärder, t ex ingrepp för att undanröja s k marknadsimperfektioner, leder ju praktiskt taget aldrig, hur stora de positiva effekterna i vissa avseenden än kan vara, till fördelar för alla. Det finns nästan alltid några som drabbas på ett eller annat sätt. Inte ens en politisk åtgärd med mycket stora positiva effekter kan därför motiveras med paretokriteriet om den, vilket är sannolikt, också är till viss nackdel för några.

I sådana fall finns emellertid alltid den åtminstone teoretiska möjligheten att de som gynnas av åtgärden kompenserar de drabbade, t ex med pengar. Ingår sådana kompensations- eller sidobetalningar i bilden så bör samtliga samhällsmedborgare, under de antagna förhållandena, kunna få det bättre genom den aktuella politiska åtgärden. Och då är också tillståndet efter åtgärden från paretosynpunkt bättre än tillståndet före. Även dessa sammanhang låter sig lätt illustreras i figuren. Vi kan t ex tänka oss att åtgärder som leder till en förflyttning från punkten p1 till p2 övervägs. Den senare punkten är visserligen inte paretobättre än p1 , men den är likväl så mycket bättre för B att han eller hon mycket väl kan tänkas kompensera A så att båda, därefter får det bättre än i p1, t ex därför att de hamnar i p4.6

Om man räknar med kompensationsbetalningar ökar alltså möjligheterna att använda paretokriteriet högst väsentligt. Samtidigt är det emellertid uppenbart att det i verklighetens mångmiljonsamhällen kan te sig mycket svårt, eller kanske t o m omöjligt, att faktiskt bestämma kompensationernas storlek, och att i praktiken genomföra betalningarna. I den välfärdsteoretiska diskussionen under 1930-talet föreslog därför ekonomen Nicholas Kaldor en modifiering av paretokriteriet (1939). Som övriga diskussionsdeltagare var han intresserad av att jämföra samhällstillstånd, t ex före och efter en viss politisk åtgärd. Antag nu att det är möjligt att tänka sig kompensationsbetalningar sådana att samtliga medborgare i det aktuella samhället, efter betalningarnas verkställande, föredrar tillståndet efter den politiska åtgärden framför tillståndet före. I så fall, det var Kaldors förslag, skall tillståndet efter den politiska åtgärden anses bättre än tillståndet före, även om kompensationsbetalningarna inte genomförs.

Den välfärdsteoretiska diskussion som inleddes under mellankrigstiden pågick under lång tid därefter. Ett tungt inlägg i denna fortsatta diskussion var, som vi såg i kapitel 3, Arrows presentation av sitt omöjlighetsteorem. Någon redogörelse för välfärdsteorins vidare öden är emellertid inte befogad här. Två kommentarer som båda gäller paretokritieriet är allt som återstår.

Den ena kommentaren gäller sambandet mellan marknadshushållning och paretooptimalitet. Föreställningen att en marknadsekonomi är effektiv har under lång tid successivt preciserats och stärkts inom den ekonomiska vetenskapen. Den moderna och formellt stringenta versionen av detta resultat har givits av Kenneth Arrow och Gerard Debreu (se t ex Arrow & Debreu 1954). De har, för att uttrycka sig mycket kortfattat, för det första visat att en marknadsekonomi under vissa preciserade och idealiserade betingelser leder till paretooptimalitet. För det andra har de också visat att varje paretooptimalt tillstånd kan förverkligas genom någon marknadsprocess. Utan att gå in på något bevis är det ändå lätt att göra åtminstone det första av dessa båda resultat sannolikt. Ett marknadsbyte är ju en ömsesidigt fördelaktig transaktion, det kommer inte till stånd om inte de deltagande parterna vinner på det. Om det inte förekommer några externa effekter kommer inte heller några utanförstående att drabbas av bytet. Ett byte leder sålunda till att de bytande får det bättre utan att några andra får det sämre. Så länge det fortfarande finns möjligheter till fördelaktiga byten kommer samhället därför successivt att närma sig ett paretooptimalt tillstånd och när det når dit är bytesmöjligheterna uttömda. Att ett samhälles resursutnyttjande i viss bemärkelse är effektivt i ett paretooptimalt tillstånd är inte heller svårt att ana. Om situationen inte är paretooptimal, d v s om någon kan få det bättre utan att det drabbar någon annan så är ju det en klar indikation på att resurserna inte är effektivt utnyttjade i utgångsläget. Om någons förbättring däremot med nödvändighet går ut över någon annan så är det en lika klar indikation på att det inte finns något "slack", d v s på att resurserna faktiskt är effektivt utnyttjade. Den nära kopplingen mellan paretooptimalitet, marknadsresultat och effektivitet gör att paretokriteriet, trots en del begränsningar som antytts ovan, rimligen kommer att behålla sin centrala ställning i välfärdsteoretiska överväganden av skilda slag, vare sig det gäller privata eller offentliga beslut.

Den andra kommentaren gäller förhållandet mellan paretokriteriet och Wicksells något tidigare formulerade enhällighetskriterium. Som framgick i kapitel 4 står dessa båda kriterier varandra mycket nära. Inget av kriterierna tar ju hänsyn till något annat än varje samhällsmedlems egen bedömning av sin egen situation; interpersonella nyttojämförelser utnyttjas inte i något av kriterierna. Det finns emellertid också skillnader. Paretokriteriet är, kan man säga, formulerat i termer av föreliggande värderingar och inte enbart applicerbart på förändringar utan också på enstaka tillstånd. Kriteriet säger ju att ett tillstånd är optimalt när ingen enligt sina värderingar kan få det bättre utan att någon annan får det sämre. Wicksells enhällighetskriterium är däremot formulerat i termer av beteenden och i första hand applicerbart på förändringar. Kriteriet säger ju att en förändring är eftersträvansvärd om alla samhällsmedlemmar, t ex med sina röstsedlar, faktiskt stöder den. Det är klart att dessa skillnader i en del fall leder till olika resultat för de båda kriterierna. Antag t ex att det paretooptimala tillståndet p3 i figur 33 faktiskt föreligger. Om A och B då ombeds att avge röster om detta tillstånd skulle de kanske först finna begäran egendomlig eftersom den inte gäller någon föreslagen förändring. Om de likväl ställer upp på att rösta är det, på grund av den slående ojämlikheten mellan A och B i tillståndet, fullt möjligt att A röstar för tillståndet och B mot, d v s enhällighet uppnås inte.
 
 

Slutnoter

1Den som vill läsa mer om spelteori kan framför allt hänvisas till standardverket av Luce & Raiffa (1957).

2Redogörelsen för Pigou är, liksom en stor del av framställningen i övrigt i detta avsnitt, baserad på Cooter & Rappoport (1984).

3Ekonomen Gary Becker, som omnämndes i avsnittet "Disciplinens plats" i kapitel 1, har senare utvecklat idéer som påminner om Pigous tankar om en allmänmänsklig behovshierarki. I sitt kapitel "Could Economics be a Biological Science?" för Rosenberg (1992) en diskussion om Beckers idéer där denna likhet framgår klart, även om den inte direkt nämns.

4Det är vid det här laget lätt att se att Pigous välfärdsteori egentligen består av två av varandra tämligen oberoende delar, nämligen dels en nyttoteoretisk del och dels en del om marknadsimperfektioner och annat som berör produktionens betingelser. Den nyttoteoretiska delen blev, som vi just sett, tidigt utsatt för kritik. Även den produktionsinriktade delen har efter hand, men långt senare, kritiserats, vilket bl a framgått i avsnittet "Marknadsavtal och Coase" i kapitel 4. Det är möjligt att den nästan omedelbart kritiserade nyttoteorin efter hand får en renässans och visar sig vara den tyngst vägande delen i Pigous välfärdsteori, medan den produktionsinriktade delen efter hand försvinner i glömska. Åtminstone ger den tidigare fotnoten nr 3 i detta kapitel en antydan om en sådan möjlighet.

5I samband med presentationen av figur 33 kan det vara lämpligt att också parentetiskt komplettera framställningen i det föregående spelteoretiska avsnittet. Situationen i figuren är ju en typisk icke-nollsummesituation. Spelarna, d v s A och B, har såväl gemensamma som motstridiga intressen. Båda vill komma så långt i "nordöstlig" riktning som möjligt, men samtidigt är det denna rörelses "nordliga" komponent som är intressant för A, och dess "östliga" komponent som är intressant för B. Kompletteringen består helt enkelt i påpekandet att paretokriteriet spelar en central roll i sökandet efter lösningar för icke-nollsummespel av olika slag.

6Jfr diskussionen om enhällighetsregeln i kapitlen 4 och 5.