I dati confessano sempre
«Se li torturi abbastanza a lungo, i dati confessano sempre» ripeteva spesso uno dei miei professori di statistica all'Università. A sentirsi torturati, dalle sue varianze e vettori, eravamo spesso noi studenti, ma è impossibile non pensare alla battuta quando ci si mette a compilare un dataset per raccontare una storia in maniera giornalistica. Chi pensa a una specie di "waterboarding dei dati" rischia però di finire fuori strada. Preparare dataset da utilizzare per un prodotto giornalistico è un'operazione complessa e diversa da quella che fanno i ricercatori puri. Talvolta è abbastanza rapida, altre volte estremamente laboriosa.
Marc McCormick e i suoi colleghi del DataBlog del Guardian hanno riassunto in una bella infografica che cosa fanno ai dati dal momento in cui cominciano a raccoglierli fino a quando, alla fine, li pubblicano sotto forma di storia e di dataset pubblico.
I colleghi del Guardian, che qualche settimana fa hanno presentato cose bellissime al Festival di Perugia, stanno svelando i contenuti della loro cassetta degli attrezzi sulle pagine dell'Open Platform, ma anche nel retrobottega di iData siamo al lavoro.
Ecco qui di seguito un primo benchmarking preparato da Elisabetta Tola (su twitter) che lavora con me al progetto.
Su questo blog torneremo ancora sui singoli strumenti e su come utilizzarli. Continueremo a espandere la lista e chi volesse segnalarne altri fa cosa graditissima.


