Search toggle

Svensk modell

Den i Sverige föreslagna bibliometriska modellen försöker estimera lärosätenas prestationer med avseende på vetenskapliga artiklar i internationella tidskrifter.

Kontakt

Stefan Carlstein
stefan.carlstein@ju.se
036-10 10 15

Detta görs genom att kombinera normaliserad artikelproduktion med normaliserad citeringsfrekvens. På detta sätt ges varje lärosäte ett värde vilket avser återspegla dess vetenskapliga produktion och genomslagskraft under given tidsperiod.

Följande metodgenomgång bygger på Resurser för kvalitet (SOU 2007:81) samt Resurser för citeringar (HSV 2008:18R). Modifieringar av systemet är troligen att vänta då Vetenskapsrådet har fått i uppdrag att utveckla modellen (Utbildningsdepartementet U2009/322/F).

Ett resurssnålt system

Den svenska modellen ger varje lärosäte ett numeriskt värde vilket används som fördelningsnyckel i anslutning till de konkurrensutsatta direkta statsanslagen. Systemet bygger helt på metrik och begagnar sig således ej av kvalitativ peer review. Anledningen sägs vara att ett resurssnålt system är önskvärt, vilket ska förstås som ett system som ej belastar forskningssamfundet med insamling av diverse information. Datakälla är de av Thomson Reuters tillhandahållna citeringsindexen SCI-E, SSCI och A&HCI. Endast artiklar indexerade i dessa index utgör underlag för beräkning av fördelningsnyckeln.    

Normalisering citeringsgrad

Den första komponenten i systemet består av normaliserad citeringsgrad och avser uppskatta forskningens genomslagskraft. Normaliseringen - vilken genomförs genom att använda de cirka 250 tidskriftsklasser som återfinns i aktuella citeringsindex – utförs för att en given forskningsartikel skall jämföras med ämnesmässigt relaterad internationell forskning samt för att jämförelser över ämnesgränserna skall vara möjliga. Normaliseringen utförs på artikelnivå och fraktionalisering tillgrips, vilket innebär att om en artikel är resultat av samarbete mellan n lärosäten tilldelas de 1/n av artikeln. Vid beräkning av citeringsgraden viktas lärosätenas artiklar efter dess fraktion. Artiklar med färre samarbetspartners väger således tyngre än de med många och avsikten är att ge en bättre representation av arbetsinsatsen. Beräkningsformeln blir:

där Ci är antalet citeringar till publikation i och [µf]i  är det genomsnittliga antalet citeringar till artiklar av samma typ (till exempel originalartiklar eller reviewartiklar), publicerade samma år och i samma tidskriftsklass(er) som artikel i. Fraktionen av publikation i som tillskrivs aktuellt lärosäte betecknas med [Pfrac]i.

Normaliserad artikelproduktion

Den andra komponenten består av normaliserad artikelproduktion. Normalisering är nödvändig då täckningen i de för ändamålet använda citeringsdatabaserna inte är jämställbart mellan olika ämnesområden. Dessutom föreligger, vilket tidigare påtalats, olika publiceringstraditioner där man inom ett område i första hand publicerar i internationella tidskrifter medan man i ett annat i första hand använder sig av andra publiceringskanaler. Tittar man bara på den av Thomson levererade informationen förefaller till exempel kemister vara avsevärt mer produktiva än  humanister, vilket knappast är fallet (det stämmer förstås att en kemist i regel publicerar fler artiklar i internationella tidskrifter).

Normaliserad artikelproduktion avser uppskatta vad antalet artiklar motsvarar i termer av normalproduktiva forskare efter att hänsyn tagits till de olika ämnesområdenas publiceringstraditioner. Tidskriftsklasserna som användes vid beräkning av normaliserad citeringsgrad kan ej användas för att normalisera artikelproduktionen, detta då stabila referensvärden ej kan erhållas på grund av att en del tidskriftsklasser utgörs av för få artiklar för att den i det följande beskrivna metoden skall fungera tillfredställande. I stället tillgrips klusteranalys vilken utifrån citeringstrafiken mellan samtliga tidskrifter klassificerar varje tidskrift tillhörande ett av 34 kluster. Dessa 34 kluster eller ämnesklasser avses representera stora forskningsfält med liknande arbets- och publiceringsförhållande. För dessa 34 forskningsfält beräknas sedan referensvärden. För att skapa dessa referensvärden förutsätts att fördelningen av artiklar per författare inom respektive forskningsfält följer en waringfördelning. Genom att analysera denna fördelning (de aktiva nordiska författarnas artikelfrekvens under given tidsperiod) kan en uppskattning göras av hur många artiklar en normalproduktiv (med nordiska mått mätt) forskare inom respektive forskningsområde publicerar. Metoden förstås troligen bäst genom ett exempel.

Ett exempel

I det följande har en produktionsfördelning genererats utifrån waringfördelningens sannolikhetsfunktion (här med parametrar α = 4 N =5) för ett fiktivt forskningsområde.

Vi känner i detta läge antalet författare som inte publicerat under den aktuella tidsperioden. Författarpopulationen utgörs av 5 000 forskare och antalet forskare med noll artiklar under tidsperioden är  2 238 till antalet. En genomsnittlig forskare producerar vidare 1,66 artiklar. I skarp tillämpning har vi dock ingen uppgift om antalet forskare med noll artiklar inom given tidsperiod, därför har dessa data i det följande tagits bort. Följande beräkningar är tänkt att visa hur vi ändå med utgångspunkt i waringfördelningens karakteristika kan estimera hur många artiklar en genomsnittlig författare producerar inom det aktuella forskningsfältet samt uppskatta storleken på den totala författarpopulationen inom vårt fiktiva forskningsområde.

Bilden nedan visar fördelningen av ovan redovisad data (där icke-publicerande forskare ej är medtagna). På x-axeln antal artiklar och på y-axeln antal författare.

För att nu estimera hur många artiklar en genomsnittlig forskare inom det aktuella forskningsområdet producerar beräknar vi den punkt där regressionslinjen för det plottade, s-trunkerade populationsmedelvärdet skär y-axeln (först beräknas medelvärdet för alla författare med en eller flera artiklar, sedan för alla författare med fler än en artikel osv.) Antalet artiklar bildar x-axeln och de olika medelvärdena y-axeln. En linjär funktion tas fram genom viktad minsta-kvadrat-regression (i exemplet är vikterna omvänt proportionerliga till standardfelet för respektive trunkerat medelvärde). Bilden nedan är ett resultat av det beskrivna tillvägagångssättet.

Skärningspunkten på y-axeln motsvaras av 1,68. Vår uppskattning av hur många artiklar en normalproduktiv forskare i vårt forskningsområde producerar överensstämmer med andra ord mycket väl med det faktiska värdet (det vi får när hela populationen med 5 000 forskare används). Om referensvärde beräknas på samma sätt för alla ämnesområden kan en rättvisare jämförelse ske mellan dessa. Till exempel skulle en kemiinstitutions produktion av 56 artiklar approximativt jämställas (i termer av vad antalet artiklar motsvarar i form av medelproduktiva forskare) med en humanistisk institution som har producerat 4 artiklar under samma period givet att referensvärdena är 2,22 respektive 0,16 (nordiska referensvärden för en fyraårsperiod enligt Sandström & Sandström, 2008). Som en parentes kan nämnas att vi också kan estimera det totala antalet forskare i vårt fiktiva forskningsfält genom att dividera antalet artiklar (i detta fall 8 318) med antalet artiklar som en normalproduktiv forskare producerar: 8 318/1,68 = 4 951, vilket åter är en mycket god estimering av det faktiska antalet 5 000. Vid skarp tillämpning av metoden kan empiriska data ifrågasätta om fördelningsantagandet är rimligt och vi kan knappast hoppas på så exakta estimat som här redovisats.

Vi har nu referensvärden för antal erhållna citeringar inom olika ämnesområden samt referensvärden för antal publicerade artiklar inom olika forskningsområden. För givet lärosäte beräknas nu normaliserad produktivitet per makroklass genom att identifiera hur lärosätets artiklar fördelar sig över de 34 klasserna och dividera respektive antal med motsvarande referensvärde. Vi har då ett normaliserat värde vilket i stor utsträckning bör återspegla lärosätets samlade resurser - direkta statsanslag och externa forskningsresurser -  detta då ökade resurser medför mer personal, vilka i sin tur producerar artiklar. Det är också ett värde som kan tolkas som ett värde på hur många normalproduktiva forskare som antalet av artiklar motsvarar. Innan de normaliserade produktivitetsvärdena för varje forskningsområde summeras, multipliceras de med motsvarande normaliserad citeringsgrad (minns att detta är en kvot som är lika med 1 om artiklarna i genomsnitt citeras lika mycket som världsgenomsnittet). Efter summeringen har varje lärosäte ett värde vilket är en kombination av vetenskaplig produktivitet och vetenskapligt genomslag. Detta värde utgör tillsammans med en indikator för erhållna externa medel, basen för fördelningen av de konkurrensutsatta direktanslagen.

Avslutande observation

En viktig observation blir nu att om ett givet lärosäte kan vrida publiceringarna - speciellt i forskningsområden med hög utväxling såsom humaniora, utbildningsvetenskap och samhällsvetenskap - mot en något ökad andel artiklar i internationella tidskrifter ges en större utdelning av de konkurrensutsatta medlen. Detta under förutsättning att den normaliserade citeringsgraden samtidigt inte avsevärt försämras. Ett undantag föreligger i fallet humaniora där endast normaliserad artikelproduktion räknas (normaliserad citeringsgrad sätts till 1, det vill säga, lika med världsgenomsnittet), detta då citeringsdata för de humanistiska områdena är alltför instabila. Man skulle till och med kunna hävda att bland annat humanister faktiskt befinner sig i en relativt fördelaktig situation då de har en mycket låg andel artiklar i den aktuella databasen och en moderat ökning torde ge stora utslag.

Sidan uppdaterad 2015-08-16






Genom att surfa vidare på JU.se godkänner du att vi använder cookies. Mer information