Inserisci i post nel tuo blog! Guarda come

News

Commenti

Tagcloud

Meta

Valid XHTML 1.0 Transitional   Valid CSS!

[Valid RSS]   Some rights reserved

Get Firefox   BlogItalia.it - La directory italiana dei blog

Add to Technorati Favorites

Blog Information
Profile for caccio

View Stefano Cazzella's profile on LinkedIn

Powered by FeedBurner

My status


Locations of visitors to this page

Archive for December, 2006

Buon Natale e Felice 2007

Sunday, December 24th, 2006

Buon Natale e Felice 2.007

Quello che si sta concludendo è stato per me (ma credo non solo per me) un anno ricco di eventi e cambiamenti che sono stati, nel bene e nel male, un’occasione di crescita personale ancor prima che professionale.

I progetti per il 2007 sono come sempre tanti e ambiziosi, ma si sa che la vita stupisce sempre dove meno te lo aspetti! Non mi resta quindi che augurare a tutti che l’anno nuovo possa essere un anno ancora migliore di quello passato!

Buon Natale e Felice 2007

Internet killed the Video star!

Monday, December 18th, 2006

Lo ammetto, non ho resistito alla tentazione di pubblicare sul mio blog gli esperimenti fatti con Swivel alla ricerca di qualche verità nascosta o qualche conferma sperimentale. L’analisi è stata condotta come caso d’uso del servizio, ma i risultati analitici prodotti sono coerenti con altri studi di settore

Il tema prescelto è l’influenza che ha avuto la diffusione di Internet sull’audience televisiva, con particolare riferimento all’informazione. La tesi da dimostrare (o da sfatare) è che Internet nel suo complesso costituisca una fonte alternativa di informazione la cui diffusione, in forte crescita, porta ad un calo negli ascolti televisivi dei programmi di informazione.

http://swivel.com/graphs/show/1163380

Per misurare l’andamento degli ascolti televisivi sono stati scelti, a titolo esemplificativo, gli ascolti di due dei principali programmi di informazione serale statunitensi: CBS Evening News e ABC World News Tonight. Tali dati corrispondono a quanto rilevato dal Nielsen Media Research. Per quanto riguarda la diffusione di Internet, i dati sono relativi ad un sondaggio condotto annualmente da The Pew Research Center for the People and the Press in cui viene stimata la quota di utenti Internet.

Nel grafico sono riportate le variazioni percentuali, rispetto ai loro massimi, delle tre misure prese in considerazione. Dalla loro comparazione appare evidente che i trend dell’audience di entrambi i programmi televisivi hanno un andamento analogo e in controtendenza rispetto a quello dell’utilizzo di Internet: gli ascolti televisivi sono in calo quasi-costante (negli ultimi 12 anni entrambi i programmi hanno perso circa il 40% dei loro telespettatori) mentre la diffusione di Internet cresce con un tasso medio del 5,5%.

Il livello di correlazione (diretto e inverso) fra le serie è elevato: -0,81 fra i dati di Internet e CBS; -0,85 fra quelli di Internet e ABC; 0,89 fra quelli di CBS e ABC. E’ noto che non è possibile dedurre un rapporto di causa-effetto dalla semplice correlazione dei dati presentati: è la TV che spinge la gente a rivolgersi ad Internet; è Internet che ruba il pubblico alla TV; esiste una causa comune esterna; sono solo fenomeni contemporanei ma non legati da rapporto causale? Resta comunque il fatto che gli ascolti televisivi calano mentre la gente che usa Internet cresce. Tale fenomeno è ampiamente studiato e discusso per capire quali meccanismi siano in atto dietro quanto mostrato dai dati; fra questi è interessante analizzare The State of the News Media 2006 che è stato condotto su dati analoghi a quelli mostrati e affronta il tema dal punto di vista degli operatori del settore dell’informazione.

Per quel che riguarda lo studio di caso, Swivel ha dimostrato, pur essendo ancora in rodaggio, di avere a disposizione alcuni data set utili ad affrontare i temi di analisi più comuni. Le fonti utilizzate si sono dimostrate attendibili anche se, da questo punto di vista, il caso d’uso non è particolarmente significativo dal momento che l’utente che ha portato i dati in Swivel è anche un collaboratore interno del progetto stesso.

Swivel: lo “YouTube” dei Dati

Monday, December 11th, 2006

SwivelDopo un anno di sviluppo vede la luce il progetto di Dmitry Dimov e Brian Mulloy: realizzare lo “YouTube” dei dati. Sotto l’attenta supervisione di Minor Ventures (giovane e abile venture capital della valley con all’attivo già importanti successi quali il co-finanziamento di Salesforce.com) Dimov, Mulloy & co. hanno realizzato una Web App 2.0 per la condivisione, l’esplorazione e la re-distribuzione di dati. Il modello di business è fra i più sfidanti nell’era 2.0: nessun costo per chi condivide dati e risultati, un canone per chi vuole usufruire del servizio in maniera riservata. Come si affronta una sfida così ardua?

Il servizio

L’idea centrale del progetto è quella di realizzare un repository di dati di varia natura, alimentato e gestito dagli utenti stessi via web; i dati raccolti possono essere visualizzati (creando dei grafici) e comparati fra loro alla ricerca di correlazioni interessanti o stravaganti. Attraverso un’interfaccia abbastanza semplice da usare, il sistema assiste gli utenti segnalando fra i data set disponibili quelli maggiormente correlati con i dati che si stanno analizzando; inoltre vengono calcolati alcuni indici numerici che consentono di misurare il livello di correlazione presente fra i dati comparati.

I grafici che riassumono i risultati delle analisi possono poi facilmente essere pubblicati in blog esterni con un semplice copy&paste di codice HTML. I dati e i risultati pubblicati liberamente su Swivel appartengono alla comunità (anzi a tutti, poiché per visualizzarli e manipolarli non è neanche necessario essere registrati come utenti): chiunque può effettuare ulteriori speculazioni a partire dai risultati raggiunti da altri in piena logica collaborativa. Swivel integra inoltre un sistema di valutazione della popolarità di un grafico o di un data set con due indicatori distinti: il voto degli altri utenti e il numero di volte che il grafico/data set è stato visto. Inoltre è prevista la possibilità di commentare un grafico consentendo di gestire discussioni verticali sul tema proposto dal grafico stesso.

Così, ad esempio, nei primi giorni di “apertura” al pubblico di Swivel è emerso, incrociando due data set forniti da due utenti differenti, una curiosa correlazione inversa fra “crimini violenti” e “consumo di vino” negli stati uniti.

http://swivel.com/graphs/show/1169349

Una di quelle correlazioni che ci si aspetterebbe di trovare in Freakonomics di Steven Levit (non a caso Dubner - il coautore del libro - ha recensito Swivel sul proprio Blog qualche giorno prima della sua apertura, ricevendo commenti ironici/increduli circa la realizzabilità del progetto stesso).

Il modello di business

Come guadagnare da un servizio di questo tipo senza ricorrere al classico inserimento di avvisi pubblicitari contestuali? La risposta è nell’individuazione di una serie di funzionalità PRO che giustifichino il pagamento di una fee senza penalizzare l’usabilità e il senso di quanto disponibile gratuitamente. Questa strada, seguita anche da Flickr e altri virtuosi servizi web 2.0, richiede una profonda convinzione nel valore che gli utenti PRO possono attribuire al servizio PRO.

Il servizio PRO offerto da Swivel consiste nel fornire agli utenti PRO la possibilità di incrociare in modo sicuro i loro dati riservati con quelli pubblici forniti dagli altri utenti: in cambio di una fee (ancora non nota) un utente PRO può importare in Swivel i propri dati riservati, che rimarranno naturalmente invisibili agli altri utenti, ed applicare gli algoritmi di Swivle incrociando tali dati con altri dati da lui forniti o pubblicati liberamente da altri utenti; i risultati della comparazione saranno naturalmente anch’essi riservati. La versione PRO del servizio sarà attivata al termine della fase di preview.

E’ interessante riflettere sulla reale natura del servizio PRO offerto: i dati di pubblico dominio possono essere scaricati da Swivel in formato CVS e quindi incrociati con i dati riservati senza bisogno di portare questi ultimi in Swivel; inoltre gli algoritmi di correlazione sono fra i più comuni e non sono presenti funzionalità di calcolo delle statistiche o di preparazione dei dati (fasi fondamentali in qualunque indagine di tipo statistico o semplicemente di analisi dei dati). Quale è allora il reale servizio su cui puntano Dimov e Mulloy per convincere gli utenti PRO a portare i loro dati in Swivel e pagare un canone per mantenerli riservati? A mio avviso tale servizio si basa su due caratteristiche del sistema (a regime):

  • l’ampia disponibilità di data set che spazino in diversi campi applicativi: dall’economia alla salute pubblica, dall’istruzione alle abitudini alimentari;
  • la possibilità di individuare, dato un data set (magari riservato), quelli che, fra tutti i data set pubblicamente disponibili, sono altamente correlati con il primo.

Il secondo punto vuole essere una risposta a domande del tipo: ok, i dati presenti nel mio database mi dicono che è in atto questo fenomeno, quali altri fenomeni correlati al mio sono in atto in contemporanea? Il che sottintende la domanda successiva: quali di questi sono in un possibile rapporto di causa-effetto con il fenomeno di interesse?. A questa seconda domanda sono chiamati a rispondere i business analyst (o analoghe figure professionali), ma la prima richiede spesso costose azioni di indagine all’esterno dell’azienda per raccogliere e/o acquisire i dati di confronto. Se si ha già un’idea della direzione in cui cercare, tali costi possono essere radicalmente ridotti

Tali considerazioni ci riportano al primo punto, come raccogliere informazioni con diverse profondità temporali e che spazino in campi diversi? La risposta Web 2.0 è offrire un servizio di condivisione di tali informazioni affinché tutti (tutti gli appassionati del genere) possano beneficiarne e siano incentivati a contribuire con i dati in loro possesso. Questo approccio al problema consente di offrire a ciascun interlocutore il servizio di cui ha bisogno nelle giuste modalità e in maniera sostenibile. Viene proposta una versione gratuita del servizio per chi usa lo strumento a fini hobbistici, soddisfacendo così un desiderio di informazioni ampiamente sentito in chi si diletta nella nobile arte di “incrociare e analizzare i dati” e che difficilmente sarebbe potuto essere soddisfatto diversamente. Parallelamente viene offerto uno strumento a pagamento per i professionisti che usufruiscono del contributo degli hobbisti pagando chi ha permesso che tutto ciò si realizzasse.

Uno degli elementi chiave di successo del progetto sarà l’attendibilità dei dati pubblici; in questo senso esperienze come Wikipedia possono essere di conforto circa la qualità dei contributi auto-gestiti dagli utenti e l’efficacia delle forme di controllo collettivo.