lördag, oktober 27, 2007

Anonyma "goda samariter" ger Wikipedia högre kvalitet

En av "sanningarna" kring öppna, användargenerade alternativ som Wikipedia är att det är de trogna anhängarna som borgar för den höga kvaliteten, och att anonyma enstaka ändringar stjälper snarare än hjälper. Det stämmer inte, visar forskare från amerikanska Dartmouth College.

Forskarna studerade ändringar i franska och holländska Wikipedia, utförda av såväl anonyma som identifierade användare (även anonyma användare har ett slags "identitet" i och med att de identifieras genom IP-numret till den dator de satt vid, och de flesta tenderar att ha samma IP-nummer över tiden). Forskarnas mått för kvaliteten på en ändring var baserat hur mycket av den gamla texten som behölls vid nästa ändring.

I genomsnitt gjorde en användare 9 ändringar, men antalet varierade stort: vissa gjorde bara en ändring, andra 50 ändringar. Generellt bidrog registrerade användare med mer ändringar över ett vidare spann av ämnen. Anonyma användare bidrog däremot med bättre ändringar - tvärtemot vad man generellt förväntar sig. Intressantast var den kategori som forskarna kallar "goda samariter"; de anonyma icke återvändande användare som bara gör en eller ett fåtal ändringar. Deras ändringar hade nämligen hög kvalitet, högre än den för ickeanonyma registrerade användare som gjorde ett liknande antal ändringar. Gränsen för den effekten gick vid fem ändringar. Sammantaget ökade kvaliteten med antalet ändringar för registrerade användare, och minskade med antalet för anonyma användare.

Resultatet baseras på ett slumpmässigt urval av runt 1750 användare från varje kategori och för varje språk. För båda språken var de oregistrerade användarna i verkligheten ungefär tio gånger fler än de registrerade. Därmed undersöktes en betydligt större del av de registrerade användarna än av de oregistrerade, och resultaten viktades för att kompensera för detta. (Totalt fanns vid tidpunkten för insamlingen 53901 användare för den franska delen och 33217 användare för den holländska delen, och drygt 7000 ingick i studien).

Det främsta problemet med metoden, som jag kan se, är att den riskerar att övervärdera kvaliteten på ändringar i sådana artiklar som inte många läser (och som därför sannolikt går oändrade längre, trots att de kanske egentligen är fel). Det är svårt att uttala sig om hur stor del av franska och holländska Wikipedia som utgjordes av sådana artiklar våren 2005 (när datainsamlingen till studien påbörjades), och forskarna diskuterar inte problematiken kring ojämnt fördelade läsare i sin artikel.

Vad jag gillar med det här resultatet är att det stöder min tes om att anonymitet inte är något automatiskt "farligt", såsom alltför många människors magreaktioner verkar få dem att tro. Det skulle vara intressant att göra något slags motsvarande undersökning på till exempel bloggkommentarer (där fördelningen av anonym resp. registrerad/identifierad verkar vara den motsatta), men det blir så klart lite krångligare att hitta ett tillförlitligt och smidigt sätt att mäta "kvalitet"...

Länkar
nyhetsrelease
artikeln (utkast, dvs ej publicerad och granskad, via Dartmouth College - fritt tillgänglig)
New Scientist

Andra bloggar om: , , , ,

9 kommentarer:

Hans sa...

Inte särskilt förvånande. En person med ett specialintresse ser något sakfel och rättar det. Personer som skriver i måmna ämnen är kanske inte fullt så initierade i alla ämnen, menär mer "skrivglada".
Ungefär vid tiden för Wikipedias tillkomst var jag ny på internet och kände inte till wikis och Wikipedias existens. Men jag fick idén att man (någon kunnig) borde göra en encyklopedi där alla kunde hjälpa till. Alla jag pratade med om det sa att det inte skulle fungera...

Malin Sandström sa...

så ironiskt.

Anonym sa...

"Forskarnas mått för kvaliteten på en ändring var baserat hur mycket av den gamla texten som behölls vid nästa ändring."

Jag är skeptisk till deras kvalitetsmått, låter mer som kvantitet än kvalité.

Malin Sandström sa...

Jag är skeptisk till deras kvalitetsmått, låter mer som kvantitet än kvalité.

Jag tror tanken var att om man behåller en text är det också en bedömning; att man rensar sådant som är dåligt och låter det som är bra stå kvar.

Det är naturlitvis inte ett idealiskt mått, men det är svårt att hitta ett bra mått som går att anvnda storskaligt och "automatiskt".

Amiechan sa...

Jag håller med Hans och tänkte skriva detsamma. Jag har själv bara ändrat i två artiklar i svenska wikipedia. Båda var inom mitt specialområde (obskyr litteratur ;) ) och jag ramlade förbi artiklarna och upptäckte att de innehöll sakfel.

Malin Sandström sa...

Amiechan: så numer kan du kalla dig god samarit :)

Nej, det är klart att det inte är särskilt förvånande. Men det kan likväl behöva påpekas att inte alla som gör enstaka ändringar gör det dåligt.

vänsterwiki sa...

Trist att det inte fungerar så bra i politiska artiklar. Allt som har med kommunism och socialism att göra skrivs om efter en egen agenda. Kuba är en flerpartistat, östblocket var inte kommunistiskt och DDR censurerade inte sina media. Allt detta försöker en liten kärna av hårdföra kommunister lägga in gång efter annan ivrigt påhejade av ett par administratörer.

Ingvar Åstrand sa...

Svar till vänsterwiki.

Samma gäller nya vetenskaliga fakta som stoppas av Wikipedias status quo-bevarande åsiktspoliser.

vänsterwiki sa...

Ingvar, alla vetenskapliga fakta som har genomgått en peer-review och/eller publicerats i en ansedd publikation tas in förutsatt att man hänvisar till denna. Problemet är att kreti och pleti vill ha in sina egensnickrade slutsatser om allt möjligt skit. Egna slutsatser som inte delas av mer än ett kompisgäng kan man inte ta in. Det urholkar trovärdigheten men det ligger lite i det du säger. Det finns några admin med dålig utbildning och skygglappar som raderar artiklar de inte förstår sig på. Som tur är är det inte så ofta det händer.