Ses vi i Uppsala?

Festen i all ära, men det är i kaffepauserna som det verkligen bränner till.

Den 7-8 april är det dags för årets Grävseminarium i Uppsala.

Vi är många journalister som kan vittna om seminariets betydelse för vår egen yrkesmässiga utveckling. Att det dessutom är ett trevligt tillfälle att knyta kontakter med kollegor från alla håll i landet, gör det inte sämre.

Bland årets föreläsare finns internationella stjärnor som Paul Myers och Susanne Craig och inhemska storheter som Malin Crona, Kerstin Weigl, Nils Hanson och Fredrik Laurin.

Dessutom får man höra metodbeskrivningar av alla de 26 gräv som tävlar om årets guldspadar.

Själv kommer jag att avslöja alla detaljer om den så kallade strumpskandalen, samt tillsammans med Marja Grill försöka ta något slags rekord genom att gå igenom 60 idéer på 60 minuter.

Hela programmet hittar du här.

Gästblogg: Skydda dig mot klickbetesfällan!

En av våra favoritkollegor i genren journalistikbloggare är Ulrika Hedman, som forskar på JMG om journalisters användning av sociala medier. Hon har på sin utmärkta blogg Eftertänkt uppmärksammat en norgehistoria som inte är särskilt rolig – men extremt intressant och lärorik. Det handlar om en teknik som i Sverige bland annat använts av nätektiven Peter Forsman när han hjälpte Plus att lokalisera ett lotteriföretag. Det norska fallet är lite tvärtom eller hur man ska uttrycka det…och Ulrikas post är så intressant att vi med glädje återpublicerar den här!

Skärmdump från loggen på Blasze. Loggen visar de ip-adresser som klickat på en viss länk som försetts med en spårare. Via en ip-tjänst är det lätt att ta reda på var ip-adresserna finns, eller triangulera med andra loggar.

I slutet av förra veckan briserade en liten bomb i Medienorge – en mediereporter på Dagens Næringsliv hade spytt galla över kollegor, konkurrenter och källor under pseudonym på Twitter. Det var en journalist på Medier24 som tillsammans med kollegor på VG och Aftenposten stod för avslöjandet: Bak en anonym Twitter-konto har DNs mediejournalist rakket ned på kilder, sjefer og kollegier.

Om det lämpliga i att som journalist spy galla över kollegor, konkurrenter och källor i skydd av en pseudonym kan man tycka mycket, och det gör jag också. Det är naturligtvis inte bra och skadar trovärdigheten för inte bara den enskilda journalisten utan för hela journalistiken. Och förr eller senare kommer man att bli avslöjad, hur väl man än försöker gömma sig – tro inte annat. Med de orden lämnar jag just den aspekten på det här avslöjandet, för att i stället titta närmare på hur själva avslöjandet gick till.

För att ringa in och avslöja personen bakom det anonyma kontot användes ett verkligt klickbete. Med klickbete menar jag här inte det vanliga klickbetet i form av en känslovinklad rubrik som ska locka publiken att klicka sig vidare till en text. Utan jag menar klickbete som i honeytrap, alltså en fälla.

Så här funkar det: Med en tjänst Blasze IP logger skapar du en särskild url till valfri länk. Med andra ord tar du en länk och klistrar in i sökrutan, och ut kommer en länk som ser ut som en förkortad länk men som dessutom innehåller en tracker, alltså en spårare. Du delar sedan den särskilda Blazse-länken, och alla som klickar på den loggas sedan med bland annat ip-nummer (se skärmdumpen). Vill du maskera ditt klickbete använder du sedan en ”vanlig” länkförkortare, som till exempel bit.ly – för vem misstänker väl en bit.ly-länk?

Sedan är det bara att triangulera. Journalisterna i det norska avslöjandet skickade en länk via Twitters direktmeddelanden till det anonyma kontot, och kunde konstatera att personen bakom det befann sig på samma plats som en av personerna på listan över misstänkta. Ett alternativ är att jämföra ip-nummer. Det gäller bara att ha lite koll på vem du delar länken med.

Den här metoden är naturligtvis väldigt användbar för journalister i det normala nyhetsarbetet, kanske framför allt för att avslöja anonyma konton på nätet – det kan röra sig om näthatare, personer som hotar, politiker som sprider främlingsfientliga åsikter eller foliehatterier när de tror att ingen ser.

Men den kan också användas för att avslöja journalister som använder sig av anonyma nätidentiteter för att kunna researcha och röra sig i miljöer där journalister normalt sett inte är välkomna. Eller som använder en anonym nätidentitet för att kommunicera med en källa för att inte riskera att avslöja källans identitet.

Så vad kan du göra som journalist? Även om du inte har ett behov av att vara anonym kanske du inte vill avslöja var du befinner sig vid ett givet tillfälle? Visst, ”klicka aldrig någonsin på en länk” kanske låter som ett gott råd, men det fungerar naturligtvis inte i det dagliga arbetet. Följande tips kan användas var för sig eller tillsammans, beroende på vilken säkerhetsnivå du anser nödvändig:

  • Använd Tor och Tails för att skydda din anonymitet på nätet.
  • Använd vpn! (Själv använder jag just nu en vpn-tjänst som skickar min mobiltrafik över en server i Tyskland, det syns på den andra loggningen i bilden ovan.)
  • Koppla aldrig upp dig på ”gratis” eller ”fri” wifi. (Aldrig någonsin, de läcker som ett såll.) Om du ändå måste använda ett sådant nät, använd vpn!
  • Använd en särskild telefon med kontantkort och kontant surfpott för de gånger du måste röra dig anonymt på nätet. Använd också den telefonens nät för att koppla upp dig mot nätet från andra enheter. Använd aldrig den telefonen som ”dig själv” för att undvika den typen av ip-triangulering jag beskriver ovan.
  • Läs iss-guiden om digitalt källskydd för journalister av Sus Andersson, Fredrik Laurin, Petra Jankov Picha och Anders Thoresson. Där finns många andra viktiga råd om hur du som journalist skyddar både dig själv och dina källor.

Ulrika Hedman

Fotnot: Det finns många andra tjänster än Blasze och bit.ly som gör samma saker. Det finns också en rad tjänster som visar var en ip-adress finns, till exempel ipnr.se.

Så får du ett roligare tv-liv samtidigt som du blir en betydligt grymmare journalist redan i kväll!

Så bra!Detta är ju fullkomligt fantastiskt!

Även i år har Utbildningsradion spelat in några av de mest intressanta föreläsningarna från grävseminariet.

Jag såg på plats och kan hejdlöst rekommendera bland annat Mats Amnells crash course i hur man använder offentlighetsprincipen för att få ut intressanta handlingar, och Kristoffer Örstadius 40 minuter om hur man avslöjar missförhållanden med data.

Dessutom har jag hört lovord hagla över både Linda Kakulis och Malin Cronas föreläsningar, om personkartläggningar respektive fakturagranskningar. Och de är inte de enda som fått beröm…

Kvällarna är helt enkelt räddade ett bra tag framöver. Nu får tv-serierna vänta ett tag till förmån för supergranskningskompetensökningsstreaming-underhållning från Göteborg.

Alla de inspelade föreläsningarna från Gräv 16 finns samlade här.

(Och om du till äventyrs missade någon av föreläsningarna från Gräv 15 så finns de här.)

Tipsen du missade 2015

Nu tittar vi ditåt.
Nu tittar vi ditåt.

Ett nytt år nalkas, och det har blivit dags att summera 2015. Vi gör det genom att tipsa om några poster du möjligen kan ha missat under det gångna året.

Kommer du till exempel ihåg hur lätt man kan beskriva Story Based Inquiry-metoden? För den som blivit nyfiken på SBI har vi även rekommenderat en föreläsning på Youtube med en av metodens upphovsmän (den med en mer kontroversiell föreläsningsteknik, som uppmärksammades kritiskt av Joakim Jardenberg).

En rad poster handlade om hur man lägger upp sin granskning lite smartare, bland annat denna om hur man applicerar sin bästa idé (som man ofta redan har) på ett givet format för att komma framåt i processen, och den här om värdet av att faktiskt begära ut de där dokumenten och inte bara nöja sig med de muntliga svaren.

Och för den handlings-inspirerade har vi sedan i en liten miniserie (del 1 och del 2) listat tio typer av dokument som vi kanske inte alltid tänkt på att begära ut.

På en mer grundläggande nivå gick vi igenom varför man över huvud taget bör satsa på egen journalistik i dessa tider (svar ja, det är just i dessa tider man bör göra det!) samt hur man ska komma igång.

Sedan har vi gnällt lite uppgivet över hur dumma frågor (jo, de finns!) kan sabotera även den smartaste undersökning, men även blåögt missionerat om att det med rätt metodik faktiskt är möjligt för de allra flesta att få tid att gräva.

I kategorin under granskningen (åtminstone vad gäller avslöjandeambitioner) finns det klassiska tredagarsjobbet, som vi beskrev hur man enklast lägger upp för att nå ett lyckat reslutat.

Till kategorin superkonkreta tips hör detta om metoden att söka bara under en viss domän eller webbadress, för att (till exempel) hitta bloggformuleringen som den nya partiledaren vill glömma.

Superkonkreta var nog också tipsen om två smarta Twitter-verktyg som de flesta inte upptäckt, och orden som gör att din sociala medier-sökning träffar rätt. Vi tipsade därtill om två sätt att hålla koll på sajters förändringar.

Handfasta guider röner alltid uppskattning, inte minst när de handlar om hur man gör sökningar på Facebook som man inte trodde var möjliga.

Dessutom har vi tipsat om några utmärkta metoder som hjälper dig förstärka ditt digitala källskydd.

Ett lunchsamtal med två kloka kollegor resulterade i två poster om paradoxer: ska man egentligen ringa mer eller mindre som reporter, och ska man utgå från ämnet eller från det konkreta fallet när man väljer ämne för sin granskning?

Vi har också rett ut vad som gäller för journalister som vill besöka asylboenden (vilket journalister både kan och ska göra).

Bland årets gästposter blev Peter Jonrikssons om hur man hittar polisanmälningar en av de allra mest uppskattade, liksom Åsa Erlandsons (kanske lite mer lättsamma) Redaktörerna från helvetet (som senare följdes upp med skribenterna med motsvarande ursprungsadress).

Andra uppmärksammade gästbloggar skrevs av Emma Johansson om hur man spårar pengar i offentliga ekonomisystem, och av Marja Grill om hur man säkrar sin story med Line-by-line-metoden respektive genomför enkäter på rätt sätt. Marjas post om hur man förbereder ansvarsintervjuer fick ny spridning genom att den publicerades i Grävande Journalisters utmärkta tidskrift Scoop.

Till sist tillhör det inte vanligheterna att våra poster innehåller riktiga nyheter (bortom journalistik-metodik-sfären alltså), men Leo Wallentins praktiserade datajournalistik om röstgränser i Växjö fick välförtjänt cred när SVT Småland upptäckte innehållet.

Därmed stänger vi butiken för 2015, hör gärna av er (t ex i kommentarsfältet nedan) och berätta vad ni vill att vi ska skriva om under 2016!

Analysera sambanden i politiken

I sin blogg på Dagens Nyheters webbplats skriver statsvetardoktoranden Anders Sundell bland annat om sambandet mellan benägenheten att rösta på Sverigedemokraterna och Feministiskt initiativ å ena sidan, och utbildningsnivån å den andra.

Jag blev nyfiken på hur jag skulle kunna göra samma analys bara för Skåne, där jag arbetar. Och samtidigt – kolla hur sambandet ser ut när det gäller exempelvis andra partier.

Valresultatet hittade jag förstås på Valmyndighetens sajt.

Tabellen längst ner på sidan är enkel att skrapa från sidan, exempelvis med hjälp av Chrome-tillägget Scraper. Sedan man installerat det, markerar man bara en bit av tabellen, högerklickar och väljer ”Scrape similar”. Därefter dyker den upp som en tabell som är enkel att exportera vidare till Google Drive.

En bra sak här är att kommunerna redan står i bokstavsordning. Det kan vi ha glädje av senare.

Därifrån valde jag att exportera det vidare till Excel.

En färdig tabell över utbildningsnivån i landet från 2013 finns nedbruten på kommunnivå på Statistiska centralbyråns sajt. Det är den tredje uppifrån på den här sidan.

Jag gick vidare med att skapa ett nytt kalkylblad i Excel. Jag plockade ut Skånekommunerna ur SCB-statistiken (tips: de står efter varandra!) och la in dem. Genom att sortera dem i bokstavsordning är det sedan enkelt att bara ställa upp valstatistiken intill.

I mitt Exceldokument har jag då kommunnamnen i första kolumnen, utbildningsnivån i den andra och därefter valresultaten i procent. Kolumnen med de absoluta siffrorna har jag plockat bort.

Däremot såg jag ingen anledning att inte behålla kolumnerna ”ÖVR” (övriga), ”BLANK” (blankröster), ”OG” (ogiltiga) samt ”VDT” (valdeltagande). De stör ju ingen.

När vi nu skaffat oss lite ordning och reda på det underlag vi behöver, är det dags att begripliggöra siffrorna. För att enkelt kunna publicera diagrammet på webben kan man exempelvis använda tjänsten Infogram.

Efter att ha skapat ett konto väljer vi Create, därefter Charts och slutligen Scatter. Klicka på Add chart. Dubbelklicka på diagrammet för att få fram tabellen. Ta bort exemplet, och lägg därefter in kommunnamnen i första kolumnen, utbildningsnivån i andra kolumnen och valresultatet för Sverigedemokraterna i den tredje.

Ändra inställningarna genom att klicka på fliken Settings. Ange till exempel ”X Axis label” till ”Andel med lång högskoleutbildning” och ”Y Axis label” till ”Andel som röstade på Sverigedemokraterna”. Klicka på Done.

Spännande! Resultatet i Skåne liknar ju det som den bloggande statsvetaren fick fram för riket.

Vi snyggar till vårt diagram lite till.

Dubbelklicka på rubriken och ange ”Andel sverigedemokrater vs utbildningsnivå i Skåne”. Dubbelklicka på textrutan under själva diagrammet och ange ”Källa utbildningsnivå: SCB. Källa valresultat: Valmyndigheten.” Klart!

Klicka på knappen Share och välj sedan det alternativ som passar dig bäst. För att bädda in på bloggen väljer jag bland alternativen längst ner.

Finns det något annat intressant samband? Det visade sig direkt efter valet att universitetsstaden Lund stack ut åt andra hållet – ett ovanligt svalt intresse för Sverigedemokraterna i kombination med en ovanligt hög utbildningsnivå. Kan valdeltagande över lag har något med utbildningsnivå att göra? (Ja!) Låt oss kontrollera – vi har ju den kolumnen. Gör alltså som tidigare i Infogram, men lägg in kolumnen ”VDT” längst till höger i stället för SD:s valresultat. Uppdatera axlar, rubrik och informationsruta i enlighet med det.

Nu frågar sig förstås den nyfikne hur sambandet mellan Fi-röstande och utbildningsnivå ser ut i Skåne. Enligt Anders Sundell var det ju påtagligt i riket. Vi går vidare i Infogram med rösterna på Feministiskt initiativ.

Här är det inte alls lika tydligt att utbildningsnivå och en lagd röst på Feministiskt initiativ hänger ihop. I stället verkar röstandet vara mer utspritt i väljarkåren. Jag konstaterar bara det. Analyserna har vi ju statsvetare till. Folkpartiet och Miljöpartiet då? Hur ser det ut?

En koppling mellan bildning och Jan Björklund verkar det alltså finnas. Kopplar de intellektuella också ihop miljöfrågorna med Miljöpartiet?

Också här är det enkelt att urskilja ett samband!

Nu uppstår förstås frågan hur jag har kunnat gissa så bra. Det verkar ju som om det ofta blir ett ganska tydligt samband. Hur har jag kunnat chansa så bra?

Det finns ett statistiskt mått på hur starka den här typen av samband är – alltså hur väl de olika variablerna korrelerar med varandra. Det är förstås mycket lätt att beräkna det här måttet i Excel.

del av Excelark
Korrelation i Excel

På raden längst ner i mitt kalkylblad har jag lagt in formeln för att beräkna korrelationen mellan valresultaten i den aktuella kolumnen och andelarna med högutbildade. Det är ganska enkelt att göra det med hjälp av funktionen KORREL().

I det aktuella fallet kan det till exempel vara =KORREL($B2:$B34;C2:C34). Första argumentet är den ena kolumnen, och andra argumentet är den andra. För att jag ska kunna kopiera formeln till höger men alltid jämföra valresultatet med utbildningsnivån och inte med ett annat parti, så har jag satt dollartecken framför kolumnbokstäverna i första argumentet – det fryser dem.

Man får ett mått mellan –1 och +1. Ju närmare –1 respektive +1 man hamnar, desto starkare är korrelationen. Tal närmare 0 visar att variablerna inte samvarierar i lika stor utsträckning.

Första värdet på rad 35 handlar om Moderaterna och det tredje om Folkpartiet. Med hjälp av de här siffrorna kan vi alltså i någon mån i förband lista ut vilka korrelationer det är värt att göra ett diagram på.

Korrelationen mellan SD-röster och utbildningsnivå är nästan starkast, –0,84. Men det finns en som är lika stark, fast positiv, +0,84. Det är den mellan utbildningsnivå och valdeltagande över huvud taget.

Alla andra är svagare. I Skåne. Så då vet vi det.

Sjunde delen i Scrapingskolan

Det har blivit dags för ett nytt avsnitt av Scrapingskolan. I denna sjunde del går vi igenom hur man använder gratisverktyget OutWit Hub för att scrapa sajter på innehåll.

Finessen är att programmet kan använda sig av de next-länkar som finns på vissa sidor då ett långt sökresultat presenteras uppdelat på ett antal sidor. I stället för att man manuellt måste klicka sig vidare mellan sidorna, så automatiserar programmet den processen.

Sjunde delen av Scrapingskolan är uppdelad i två avsnitt:

Hej då 2013! Detta gjorde vi…

...men först var vi inte. (Tack Bertholof Brännström; tidningen finns på Strömbäcks folkhögskola.)
…men först var vi inte. (Tack Bertholof Brännström; tidningen finns på Strömbäcks folkhögskola.)

Ett år nådde sin ände och ett nytt passerade dörren. Det gamla fick byline och det nya rubrik. En ava följdes av en påa.

Under 2013 fick vi ur oss sådär 90 inlägg, och en återblick visar att vi åtminstone täckt in ett gäng sub-kategorier under ”journalistik” och ”teknik”.

Mycket webb har det förstås blivit, till exemel om hur man fiskar i framtiden – alltså automatiserar bevakningen av sina stories och ämnen – med hjälp av agenter och larm, och hur man kan göra avgränsningar som plockar bort skräp från svensk politik. (Till exempel alltså. Men oj vad vi var nöjda med den rubriken!)

En sajt som visar hur många sekunder det är kvar till jul kan ju vara till nytta efter helgerna, liksom en som kan besvara ett nästan oräkneligt antal andra faktafrågor (nej det är inte Wikipedia).

Vi berättade om tio smarta sätt att maxa nyttan med den populära webbläsaren Chrome, och om nya webbresurser kring allmänna handlingar och sociala medier.

Men årets i särklass största webbildningsinsats var förstås Elias’ Scrapingskola, som hittills tagit sig igenom inte mindre än sex lektioner (del 1, del 2, del 3, del 4, del 5 och del 6).

Vid sidan om webben har vi förstås en särskild förkärlek för tv-makande, ett ämne där Elias bland annat fördjupat sig i körschemats hemligheter och inspirerat till smartare klippning med hjälp av kortkommandon.

Om man utnyttjar våra tips för att få mer tid i inslaget så kan tiden till exempel användas för bättre användning av miljöljud. Vi gav också ett gäng andra exempel på hur man kan göra det tråkiga formulär 1A-inslaget mer spännande formmässigt.

Programlederi i tv hade ingen av oss några större erfarenheter av – fram till att Elias under året intog Sydnytts morgonsändningar. Vilket han naturligtvis bloggade om i tre initierade poster (om förberedelserna, smygpremiären och premiären).

Redan 2012 hade vi dock kunnat erbjuda programledartips från svt-kollegan Lina Lindahl, och även 2013 kom gästbloggarna att skapa några av våra allra mest omtyckta och uppmärksammade poster.

Bo Torbjörn Ek skrev om ett klassiskt sätt att hitta hemliga handlingar, Jenny Berggren och Björn Wendelborn Barr om hur dejtingsajter kom till nytta när grävet sprängde landsgränserna, Jens Mikkelsen om granskningen där offentlighetsprincipen kunde användas på Facebookmeddelanden och Sofia Nordén om värdet av goda ansvarsintervjuer vid granskning av dysfunktionella torgtoaletter.

Researchern Jenny Küttim har jobbat med granskningar av Thomas Quick-fallet med både Hannes Råstam och Dan Josefsson. För oss skrev hon en mycket uppskattad checklista för research. På motsvarande sätt lärde Therese Bergstedt ut en rad lärdomar om vetenskapsjournalistikens fallgropar.

Frilansjournalisten och nätresearchvirtuosen Leo Wallentin har under året gett oss två spännande poster, den ena om försämrad offentlighet kring uppgifter om vem som registrerat en .se-adress (där vi via kommentarsfältet så småningom fick veta att försämringen inte blivit riktigt så omfattande som Leo varnade för) och den andra om hur man ska göra för att bedöma sajters storlek – inte. Med exempel från en statlig myndighets mindre lyckade (men mycket uppmärksammade) bedömning av extremistsajter. Myndighetskritik, mediekritik och webbresearchutbildning i ett med rätta uppmärksammat inlägg!

Årets mest populära gästblogg, räknat i antalet besökare här på bloggen, skrevs av granskande konsumentreportern och Plus-programledaren Åsa Avdic, och handlar om hur man lär sig känna igen och hantera falska pudlar. Posten nådde en sådan spridning att falskpudeln utnämndes till veckans nyord, och inlägget blev ett av våra allra mest lästa.

Novus-chefen Torbjörn Sjöström skrev en gästpost om hur man avgör legitimiteten i undersökningar, ett ämne som avhandlades i ett par poster i årets början (första här och andra här) med anledning av en uppmärksammad opinionsundersökning om Annie Lööfs fallande stöd. Många deltog i diskussionen (som också togs upp av Sveriges radios Medierna) men allt fick en snopen vändning när det visade sig att Expressen (som var måltavla för kritiken) helt enkelt skrivit fel om den statistiska säkerställningen av undersökningen (se uppdateringarna av posterna).

Om vi vågar oss på en förutsägelse om det kommande året (och många kommande år) så lär diskussionen om journalisters relation till statistik inte vara avgjord i och med detta (hej supervalåret!).

Konstig användning av statistik är inte det enda man kan gnälla på i en journalistblogg. Vi har under året tagit fram det gnälligare tonfallet i poster om arbetsledare som väljer stories negativt och uppmuntrar gräv med metoder som ger motsatt resultat. Samtidigt vill vi förstås vara varje åsiktsrikning behjälplig, och har således även publicerat en tio skäl att aldrig gräva!

Men inte bara chefer gör misstag. Reportrar låter bli att ringa hem och berätta och undviker att ta med de bästa bitarna i reportagen – beteenden vi försökt uppmuntra till förändring av.

Vi har publicerat en rad tipslistor, bland annat fem råd för den som vill sälja in en frilansartikel (en text som fick kloka kompletteringar av kunniga personer i kommentarsfältet) och tio gyllene regler för sommarvikarien.

Sommarvikarierna ja. Glädjande rykten har nått oss om att flera av årets poster kom att göra nytta under årets allra varmaste månader bland medarbetarna med de minst säkra anställningsvillkoren. Förutom tipslistan ovan även våra sommarvänliga råd för egna nyheter och görbara granskningar. (Ni som hänger upp våra bloggposter på redaktionen – skicka oss gärna en bild så vi kan släppa tvivlet på att detta verkligen händer :-))

Till kategorin vardagstips för alla oavsett årstid och anställningsform får väl räknas Elias poster om hur man kommer ihåg namn och hur man kan ersätta ”folk på stan” med roligare grejer — och mina egna om surfplattor som anteckningsblock, smartare presskonferensjobb, snabbare skrivande, vikten av att då och då ringa NYPD samt metoder för att fixa bättre batteritid på mobilen.

Vår egen intervjuskola började redan 2012 men den sammanfattande posten med konkreta exempel (och länkar bakåt till alla delarna) publicerades 2013.

För den som till vardags vill försöka hitta nyheter rekommenderas de 25 nyhetskällorna som inte är tingsrätten (och tja, även nödnyheter kan ju ha sitt värde), och för den som har svårt med strukturen på storyn kan ”manus först” vara en strategi att testa. Har man inte varit förutseende nog att göra ”manus först” så måste materialet struktureras senare i processen, och i så fall rekommenderar jag den här metoden.

Apropå ”manus först” så var min favoritläsning under året förstås Story Based Inquiry, en 88-sidors gratisbok som jag rekommenderat så ofta på och utanför bloggen att det nog kan ha gränsat till missionerande.

SBI har bland annat inspirerat till posten om hur man pratar med experter, och de om tipsaren som alltid har rätt och alltid fel, och som (därför) bör utnyttjas ordentligt redan tidigt i processen – bland annat för att man ska kunna ställa rätt fråga till storyn. Och för övrigt anser jag att foliehattarna har rätt!

Om man har svårt att strukturera sin granskning kan man fundera på om man borde förstärka något av granskningens tre ben, eller om den kanske tittar åt fel håll, och om man ska göra en ansvarsintervju kan det vara bra att ta reda på argumenten först. Men om datorn man använder sen ska slängas, lämnas bort eller säljas så bör granskaren förstås se till att alla känsliga uppgifter försvinner på riktigt.

En annan inspirationskälla har faktiskt varit tv-programmet Arga doktorn, som hittade ett (i alla fall för mig) helt nytt sätt att komma runt ansvarigas ovilja att kommentera ”enskilda fall”.

Har dessa journalisttips inte varit dig tillräckliga? I så fall kanske du behöver andra sorters tips – och i så fall får jag väl avsluta med posten som handlar om hur du går till väga för att få väldigt många…tips.

God fortsättning på det nya journaliståret!

Sjätte delen i Scrapingskolan

Ett nytt avsnitt av Scrapingskolan är äntligen klart! Och det var verkligen på tiden!

I samband med en kurs på Fojo försvann prestationsångesten för att få ur mig ett nytt avsnitt. I stället byttes den ut mot inspiration – som är en mycket bättre drivkraft.

Det är så roligt att träffa människor som tittat in här och inse att människor faktiskt läser och har glädje av bloggen. Att föreläsaren avslöjade att han ägnat sin föräldraledighet åt att titta igenom Scrapingskolan var helt avgörande för att den här delen kommer just nu.

Här går vi igenom hur man använder Google Refine för att samla ihop information som finns på ett antal webbsidor vars adresser är konstruerade utifrån en speciell mall – till exempel genom en id-kod som finns listad på annan plats.

I bokens exempel handlar det om skolor vars id-nummer finns i Excel-fil på nätet. Den del i webbadressen som unikt identifierar varje skolsida är uppbyggd med hjälp av det speciella id-numret.

Kolla igenom i lugn och ro – och njut av det längsta avsnittet av Scrapingskolan så här långt! (Det är därför det är uppdelat i två delar.)

Särskilt du, Daniel Olsson – tack för inspirationen! Och kursansvarige, Per Nygren! Och alla klasskamrater!

Femte delen i Scrapingskolan

Efter en tids uppehåll är nu äntligen den femte delen i Scrapingskolan här! Jag går igenom hur man använder kalkylbladet i Google Docs för att scrapa material från flera webbsidor samtidigt.

Hemligheten är att göra det i flera steg. I det första steget scrapar man ihop ett antal länkar. I det andra steget använder man sedan de länkarna som argument till ytterligare en importXML-funktion – som scrapar själva de data man var ute efter.

I och med denna del av Scrapingskolan lägger vi Google Docs bakom oss. I nästa avsnitt ska vi sätta tänderna i Google Refine i stället!

Lycka till!

Fjärde delen i Scrapingskolan

Här – äntligen – kommer nästa del i Scrapingskolan. Den här gången tittar vi lite mer på xpath-språket som man använder för att formulera sina sökfrågor mot de webbsidor man vill hämta hem sina data ifrån.

Är det något du vill få djupare eller annorlunda förklarat? Eller saknar du något? Kom gärna med kommentarer och inspel!