Sjätte delen i Scrapingskolan

Ett nytt avsnitt av Scrapingskolan är äntligen klart! Och det var verkligen på tiden!

I samband med en kurs på Fojo försvann prestationsångesten för att få ur mig ett nytt avsnitt. I stället byttes den ut mot inspiration – som är en mycket bättre drivkraft.

Det är så roligt att träffa människor som tittat in här och inse att människor faktiskt läser och har glädje av bloggen. Att föreläsaren avslöjade att han ägnat sin föräldraledighet åt att titta igenom Scrapingskolan var helt avgörande för att den här delen kommer just nu.

Här går vi igenom hur man använder Google Refine för att samla ihop information som finns på ett antal webbsidor vars adresser är konstruerade utifrån en speciell mall – till exempel genom en id-kod som finns listad på annan plats.

I bokens exempel handlar det om skolor vars id-nummer finns i Excel-fil på nätet. Den del i webbadressen som unikt identifierar varje skolsida är uppbyggd med hjälp av det speciella id-numret.

Kolla igenom i lugn och ro – och njut av det längsta avsnittet av Scrapingskolan så här långt! (Det är därför det är uppdelat i två delar.)

Särskilt du, Daniel Olsson – tack för inspirationen! Och kursansvarige, Per Nygren! Och alla klasskamrater!

En kommentar till “Sjätte delen i Scrapingskolan”

Lämna ett svar

Din e-postadress kommer inte publiceras.