La data science è una branca del sapere che si fonda su conoscenze relative all’integrazione dei dati, allo sviluppo di algoritmi e alle capacità tecnologiche: di fatto si concentra sulla risoluzione analitica di problemi complessi.
Il cuore della data science, ovviamente, sono i dati e il data scientist è colui che è in grado di utilizzare i dati in modo creativo per generare valore. Un professionista della data scientist coniuga la formazione matematica con competenze informatiche e intuizioni strategiche.
Siamo di fronte ad un approccio di tipo multidisciplinare che si concentra su due diversi fronti.
Il compito principale di un data scientist è quello di esplorare i dati. Sulla base di precise domande – tipicamente richieste del business e relative, ad esempio, all’andamento della produzione o delle vendite o alla riorganizzazione delle risorse – il data scientist diventa un vero e proprio investigatore e mette in campo tutta la sua creatività analitica. Armato di strumenti tecnologici (come l’Analytics Platform di Knime) e algoritmi di machine learning riesce ad esaminare e prevedere scientificamente correlazioni tra fenomeni che ad una prima analisi risultano invisibili. Il suo obiettivo è ottenere insights quanto più accurati per fornire al business una panoramica precisa del problema da risolvere.
Possono i dati produrre altri dati utili? Certo che sì! La data science nasce per comprendere i dati e analizzarli, ma pure per valorizzarli e far sì che, adeguatamente interrogati e correlati, generino informazioni utili non solo a capire i fenomeni, ma pure ad orientarli. Amazon, Netflix, Spotify – ma pure il filtro antispam di Gmail – impiegano quotidianamente applicazioni sviluppate dai data scientists che sfruttando intelligenze artificiali sempre più accurate consentono alle macchine di costruire motori di raccomandazione (che ci suggeriscono cosa comprare, cosa guardare, cosa ascoltare in base ai nostri gusti) o di apprendere quali sono le comunicazioni che non desideriamo proprio ricevere.