lördag, juni 27, 2009

Ack, Dagens Forskning, vad du har fallit...

Som ett led i en helt annan bloggpost (om vetenskapsjournalistik) begav jag mig till Dagens Forsknings dåvarande webbplats. Tidskriftens slut var ju inte vidare vackert, men jag tänkte att kanske fanns något innehåll kvar. Tills jag insåg att det faktiskt var ett bra tag sedan tidningen lades ner (2003! Tiden flyger!)... och noterade att dess webbsida ersatts av en klassisk splogg tillhörande ett svenskt SEO-företag. Ingen större nyhet där, jag är inte först med att lägga märke till det. Men ändå sorgligt, av flera skäl:

* De flesta av sidans inlänkar är legitima sådana, bland annat från en handfull svenska universitet (och från ett flertal länksidor som listar svenska tidskrifter). Antagligen står de för en stor del av sidans pagerank, vilket i princip innebär att sploggen hålls uppe av webbsidor drivna med skattemedel.

* Sidan är blockerad (via robots.txt) i Wayback Machine, så man kan inte se vad som fanns där förut heller eller veta om den någonsin varit oblockerad.

Det sista stör jag mig på ju mer jag funderar över det; om det är något jag inte gillar med Internet Archive/Wayback Machine så är det deras policy att retroaktivt ta bort alla kopior av en sida när tillgången till sidan blockerats via robots.txt, utan att ta hänsyn till eventuella ägarbyten eller meddela när blockeringen först ägde rum. Nu går det inte att avgöra om det är vad som hänt här*, men att möjligheten att blockera material existerar är i sig störande. (Frågan är om det blockerade materialet slängs ut av Wayback Machine så att blockeringen inte senare går att häva - jag skulle gissa att så är fallet, de borde ju ha gigantiska problem med lagringsutrymme.)

Jag gissar att det mesta av Dagens Forsknings webbmaterial kom från den tryckta tidningen, och därmed finns arkiverat (om än mer svårtillgängligt). Men vad händer med rena nätmagasin (eller för den delen bloggar) när de dör? Man kan inte vänta sig att en lågbudgetproduktion som inte burit sig har sin webbsida/domänregistrering kvar mer än max några år, och när domänen efteråt byter ägare kan man åtminstone inte lita på Wayback Machine som en källa till fortsatt tillgång.

Gissningsvis är KB:s Kulturarw3e-projekt (som lagrar svenska webbsidor) inte lika restriktivt. Det går inte riktigt att avgöra från webbinformationen; jag hittar gamla dokument från millennieskiftet som indikerar att Kulturarw3e inte lagrar sidor vars robots.txt indikerar att det inte är önskvärt, men Kulturarw3e lär knappast tillämpa Wayback Machines retroaktiva princip.

Hur som helst lär även de bästa lagringsinitiativ lär ha problem att täcka in ens en bråkdel av det som publiceras på nätet; internet växer trots allt närmast exponentiellt i innehåll. Föråldrade utspridda fenomen, som nätdebatter, lär bli svåra att följa när stora delar av inläggen försvinner ut i tomma intet.

Jag har hittills tyckt att bloggar i bokform är ett småfånigt fenomen. Jag borde kanske tänka om.

*dvs, om det är SEO-företaget i fråga som blockerat tillgången till Dagens Forsknings gamla material. Jag vet inte tillräckligt om sploggar för att lätt kunna plocka ut det logiska valet - sploggare borde väl vilja bli indexerade? Eller överväger det faktum att indexering från sådana arkiv gör det lättare att jämföra med gmla sidan och upptäcka sploggens nuvarande tveksamma status?

4 kommentarer:

Sara sa...

jag saknar verkligen den tidningen! En av de få riktigt intressanta publikationerna jag läst!

BTW. Om du verkligen behöver något från pappersversionen har jag ett eget arkiv ;-) Alla nummer utom det första...

Malin Sandström sa...

Sara: tack för erbjudandet! Men i just det här fallet - när jag besökte webbplatsen - var jag mer ute efter Dagens Forskning som generellt exempel. Det blev den också, men inte alls som jag hade avsett...

malte sa...

Mer i samma stil: Inför k-märkning för webbplatser, skriver Johan Groth i Computer Sweden (se även här).

Malin Sandström sa...

malte: bra artikel, tack för tipset.