PRESENTATION OUTLINE
DATI “GRANDI”, ANALITICI E SINTETICI
BIG DATA: LE 3 +3 V
- Volume (quantità)
- Velocità (accumulo, obsolescenza)
- Varietà (eterogeneità)
- ——————
- Veridicità (attendibilità ...)
- Valenza (utilizzabilità)
- Valore (capitale)
STRUMENTI PER GESTIRE I DATI
STRUMENTI PER GESTIRE I DATI
- Metodi numerici (probabilità e statistica)
- Metodi sintattici
- Metodi semantici
- Metodi visuali
IL CICLO DI VITA DEI DATI
ORGANIZZARE, NORMALIZZARE , RAPPRESENTARE
INTEGRARE, CORRELARE ,DECIDERE
VERS0 UNA TEORIA ECONOMICA DEI DATI
VERS0 UNA TEORIA ECONOMICA DEI DATI
TAKE AWAY
- I dati costano (ed il costo è pressochè lineare alla quantità di dati da trattare)
- Le operazioni di pulizia, organizzazione, correlazione e sintesi sono le più costose
- Ergo .. bisogna decidere quanto, cosa e come si è disposti ad investire
- Non troverai mai nulla se non sai cosa stai cercando
- Meglio meno ma meglio, il problema è generare (dati sintetici) il meglio ...