onsdag, februari 28, 2007

Wikipedia: Fler kockar, bättre soppa

Wikipedias mest editerade artiklar håller också högst kvalitet. Det rapporterar två forskare från HP Labs.

6.4 miljoner artiklar på 250 språk, med 236 miljoner editeringar (ändringar och tillägg) utförda av 5.77 miljoner användare. Låter det rörigt? Det är det säkert, men det är också ett recept på framgång.

Forskarna studerade Wikipedias engelska del, med 1.48 miljoner artiklar och 50 miljoner editeringar från 4.79 miljoner användare mellan januari 2001 och november 2006. Framför allt räknade de antalet editeringar på de 1211 artiklar som utsets till "featured article" (svenska motsvarigheten: utmärkt artikel), och som därför kan anses vara de bästa. De visade sig också vara högt editerade, det vill säga ha genomgått många tillägg och ändringar jämfört med de övriga artiklarna, och ha ändrats av många personer.

Den avgörande faktorn, enligt forskarna, är att ändringarna och tilläggen inte är slumpmässiga, utan att många ändringar i sig drar till sig fler ändringar, statistiskt räknat. Därför finns det många artiklar (de som gäller änen av stort allmänt intresse och hög relevans) som håller hög kvalitet, och som också fortsätter att utvecklas.

När Wikipedia startade, 2001, dominerade ändringar gjorde av en "elit av administratörer" - de stod för cirka 50% av de totala ändringarna. Nu är siffran 10%, och den är fortfarande påväg neråt, enligt forskare som Nature News har talat med.

Mer olika användare ger alltså bättre artiklar, säger Nature News. Det verkar ju sannolikt, men eftersom de baserar det argumentet på ännu icke publicerat material som inte går att få tag på är det lite svårt att veta hur solitt underlag de har. Äldre artiklar lär ju bli bättre med tiden oavsett hur olika användarna är. Och är de bästa artiklarna också de som har den mest heterogena mängden användare som gör ändringar?

Om det stämmer borde det innebära att artiklar på "världsspråken", bland annat engelska, också blir bättre eftersom de är tillgängliga för användare som är utspridda över världen och kommer från olika bakgrunder - inte bara för att de är tillgängliga för ett större antal användare. Intressant tanke.

Länkar
Nature News
artikel (preprint via arXiv, fritt tillgängligt)

Andra bloggar om: , , ,

1 kommentar:

Tore Kullgren sa...

Antalet användare på varje språkdomän är för det mesta i proportionell mot antalet internetanvändare i språkområdet. Det gäller också svenska Wikipedia. (Det mer politiskt korrekta namnet är "Svenskspråkiga Wikipedia".)

Svwiki är speciellt genom att det finns extremt många artiklar per användare, och att artiklarna i snitt är mycket kortare, jämfört med andra språkdomäner.

Det finns många orsaker till detta. En är att en liten klick användare länge tävlat om att skapa artiklar med jämna tusental.

Allmän statistiksida:
http://stats.wikimedia.org/SV/Sitemap.htm

Statistiksida med tusentalstävlingen:
http://sv.wikipedia.org/wiki/Wikipedia:Statistik