Google Library… Hoe doen ze dat eigenlijk??
Het Google bibliotheek-project is een veelbesproken ontwikkeling. Over wat de omvang van het project in de praktijk betekent lees je niet zoveel.
Neem bv de bibliotheek van de Universiteit van Michigan. Google heeft daarmee in 2005 een overeenkomst gesloten om de volledige collectie te scannen en toegankelijk te maken. Google dacht toen daar zes jaar voor nodig te hebben. Een termijn die door kenners zeer onwaarschijnlijk werd geacht. Wat zou dat namelijk betekenen?
Er zijn ongeveer zeven miljoen boeken in de bibliotheek van de universiteit, met een gemiddelde omvang van 250 pagina’s elk. Dat is in totaal 1.75 miljard pagina’s, die een scantempo van 800.000 pagina’s per dag, of ongeveer 33.000 pagina’s per uur, vierentwintig uur per dag vereisen om in zes jaar de klus te klaren. Bovendien moet elk gescand boek met optische karakter-herkennings software (optisch lezen) worden doorgenomen om de tekst doorzoekbaar te maken.
Er zijn ook afspraken met de Universiteit van Californië betreffende het digitaal weergeven van minstens 2.5 miljoen boeken. Uit het contract met Google zijn onlangs enkele details bekend geworden, waaronder de vastgelegde snelheid van scannen.
Voor de eerste zestig dagen, moet de bibliotheek Google van 600 boeken per dag voorzien. Beginnend op dag 61, is het minimum aantal boeken dat de bibliotheek moet leveren 3.000 per dag! Dat is precies het aantal dat 18 maanden geleden totaal ongeloofwaardig leek.
En dan nog al die andere contracten die inmiddels zijn vastgelegd. Oxford, Madrid, Library of Congres, enz. !!??
Een aardig artikel over het project verscheen in het mei/juni nummer van het Amerikaanse blad ‘Fine Books & Collections Magazine’.
Hier meer info van Google zelf en nog meer ‘news & views‘.
>> 29 October 2006 | Posted in Diversen | Comments (0) | Email dit bericht

