Femte delen i Scrapingskolan

Efter en tids uppehåll är nu äntligen den femte delen i Scrapingskolan här! Jag går igenom hur man använder kalkylbladet i Google Docs för att scrapa material från flera webbsidor samtidigt.

Hemligheten är att göra det i flera steg. I det första steget scrapar man ihop ett antal länkar. I det andra steget använder man sedan de länkarna som argument till ytterligare en importXML-funktion – som scrapar själva de data man var ute efter.

I och med denna del av Scrapingskolan lägger vi Google Docs bakom oss. I nästa avsnitt ska vi sätta tänderna i Google Refine i stället!

Lycka till!

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *