Big Data Analytics e Big Data Management: il futuro nei dati

big data analytics e big data management

Indice per Big Data Analytics e Big Data Management

Big Data Analytics e Big Data Management: 10 cose che devi assolutamente sapere sui big data

Conoscere cosa gira intorno al mendo dei Big Data è importante semplicemente perché ogni cosa del nostro mondo contemporaneo è connessa e genera dati; basti pensare al nostro smartphone con tutte le sue applicazioni da quelle meno pesanti a quelle tipo Facebook che scambiano quantità importanti di dati ecc.

Big Data Analytics perché i dati hanno un effetto sull’impatto nella vita di tutti i giorni e nell’IoT (Internet of Thinks) l’internet delle cose; aiutano a tracciare modelli e prendere delle decisioni, aiutano a comprendere i fenomeni (KPI o metriche) e quindi a sapere cosa fare.

Big Data Management perché tutta questa mole di dati deve essere gestita, conservata e mantenuta per quel che serve e nel tempo che serve, proprio al fine di poter fare delle query che sono sempre più frequenti e sempre più in relazione ad algoritmi di intelligenza artificiale.

Se andiamo a rileggere un post del 2012 tratto da COMPUTERWORLD.COM, esso conteneva già una predizione calcolata proprio per il 2020 ossia che ognuno di noi, indipendentemente da uomini, donne o bambini, avrebbe generato 5.200 gb di dati, considerando che il grosso di essi non passa tramite le nostre mani bensì viene generato proprio dai sistemi che dialogano tra di loro.

I numeri di cui sopra sono veramente spaventosi ma la gran maggior parte di essi, se pur generata, non viene utilizzata ma rimane silente seppur potrebbe risultare utile.

big data analytics e big data management

Big Data Analytics e Big Data Management: esempi di quanti dati vengono generati

La mole di dati generati giornalmente è talmente alta che le risorse per poter gestire tutto questo elevato numero di informazioni deve essere al di sopra dell’immaginabile…

Tutte queste statistiche rilevate dal sito INTERNETLIVESTATS.COM (se lo visitate vedrete che saranno già cambiate di molto) danno l’idea di quanta mole di dati può essere prodotta e che necessita di risorse di livello devono essere messe in campo per la sola analisi dei dati.

Ora vi diamo un “saggio” delle statistiche tra due date proprio per renderci conto di quanto i Big Data relativi alle azioni (in questo caso Big Data Analytics) crescano a dismisura la prima al 31 marzo 2020 e la seconda, al giorno odierno che scriviamo, ossia il 05 ottobre 2020 (e questo influisce sul Big Data Management).

big data e1601903174892
big data 05102020

UTENTI TOTALI DI INTERNET 4.517.295.074 sono gli utenti internet nel mondo al 31 marzo 2020 su una popolazione totale di 7.530.000.000 di persone

big data: utenti internet

1.760.112.297 il numero di siti web presenti in rete

234.691.422.222 e-mail inviate solo oggi

6.367.266.286 ricerche effettuate all’interno del motore di ricerca Google

6.089.703 post scritti nella sola giornata odierna

6.495.686.845 video visti su Youtube oggi

694.298.082 i tweet fatti dagli utenti nella sola giornata odierna

130.661.933 post scritti sul social Tumblr

76.418.304 foto caricate oggi su Instagram

2.462.581.363 gli utenti di Facebook ad oggi attivi

807.074.031 gli utenti di Google+

284.244.253 utenti attivi su Pinterest

358.637.469 gli utenti Twitter ad oggi

353.156.804 le chat effettuate su Skype

136.016 i siti hackerati nella giornata odierna

3.845.503 gli smartphone venduti oggi

620.949 i computers venduti oggi

6.996.126.755 i GB di traffico movimentati oggi

380.066 i tablet venduti oggi

3.724.132 i MWh di Elettricità consumati e

3.039.645 le tonnellate di emissioni di CO2 generate dalla rete internet

Tutte queste statistiche rilevate dal sito INTERNETLIVESTATS.COM (se lo visitate vedrete che saranno già cambiate di molto) danno l’idea di quanta mole di dati può essere prodotta e che necessita di risorse di livello devono essere messe in campo per la sola analisi dei dati.

Più andiamo avanti con gli anni, più cresce la mole dei dati che vengono rilevati a qualsiasi livello, per poter studiare comportamenti, analizzare le vendite, studiare gli effetti di decisioni ecc.

I dati ed oggi quindi i Big Data, sono fondamentali per comprendere i fenomeni; i dati sono una risorsa essenziale per la crescita economica, la competitività, l’innovazione, la creazione di posti di lavoro e il progresso della società in generale.

Vediamo come la COMMISSIONE EUROPEA ha strutturato la presente infografica che ci fa render conto di quanti aspetti possono essere toccati dall’elaborazione dei Big Data:

big_data_infografica

Big Data Analytics e Big Data Management: le potenzialità di elaborazione

La decodifica del genoma umano nel 2003 impiegava 10 anni di tempo, con le capacità di calcolo odierne impieghiamo 1 settimana mentre nel futuro ci potrebbero volere solo poche ore.

Tutto questo in quanto abbiamo a disposizione delle autostrade (banda larga) che consentono lo scambio di grandi quantità di dati mentre, grazie alla raccolta via cloud possiamo disporne anche a distanza e, per effetto delle alte performances di computers attuali possiamo generare report, modelli statistici e quant’altro con grande naturalezza.

Big Data Analytics e Big Data Management: le applicazioni reali

In ogni aspetto della nostra vita, i dati e la loro conoscenza, possono condizionare in positivo i miglioramenti che ci consentono e ci consentiranno di aumentare a 360 gradi la nostra vita di tutti i giorni accrescendone ogni aspetto.

Negli spostamenti possono aiutare a governare semafori intelligenti e flussi di traffico, possono migliorare la comprensione e la diagnostica dei problemi legati alla salute migliorando la nostra vita media sia in termini di qualità con minori malattie che in termini di allungamento reale della vita vissuta.

Nelle filiere agro-zootecniche possono aiutare a rendere sempre più efficienti gli utilizzi delle risorse naturali, mentre nella produzione industriale contribuiscono ad implementare efficienza e produttività.

Nella nostra casa possono aiutare a gestire intelligenti sistemi di smart home.

Big Data Analytics e Big Data Management e new economy

Tutto il mondo che gira intorno all’elaborazione di grandi quantità di dati ed ai sistemi di intelligenza artificiale ha tratto beneficio negli ultimi 20 anni di ingenti investimenti operati dai principali operatori del mercato.

Più passano gli anni e più le compagnie che trattano big data acquisiscono importanza e vengono a loro volta acquisite da compagnie più grandi in quanto, nel futuro, tra gli elementi di cui non si potrà fare proprio a meno troviamo:

Lo storage ed in generale il cloud computing

L’elaborazione e gestione dei big data

Le infrastrutture di comunicazione

I sistemi di intelligenza artificiale

Crowdstrike ed Elastic hanno raggiunto grandi valutazioni al momento dell’IPO (rispettivamente $ 7 miliardi e $ 5 miliardi).

Altre IPO includevano PagerDuty ($ 1,8 miliardi), Anaplan ($ 1,8 miliardi) e Domo ($ 500 milioni).

Ci sono state importanti acquisizioni, come Qualtrics (acquisita da SAP per 8 miliardi di $), Medidata (acquisita post-IPO da Dassault per una cifra pari a 5,8 miliardi di $), Hortonworks (fusa con Cloudera aggiungendo 5,2 miliardi di $ di valore), Imperva (acquisita da Thoma Bravo per 2,1 miliardi di $), AppNexus (acquisita da AT&T per 2 miliardi di $), Cylance (acquisita da BlackBerry per 1,4 miliardi di $), Datorama (acquisita da Salesforce for 800 milioni di $), Treasure Data (acquisita da Arm per 600 milioni di $), Attunity (acquisita post-IPO da Qlik for 560 milioni di $), Dynamic Yield (acquisita da McDonalds per 300 milioni di $) e la lista è ancora lunga.

Anche a livello di startup gli investimenti sono sempre più ingenti come sempre di più sono le aziende sul mercato… la nostra Big Data Innovation Group ne è la prova concreta.

Sul sito di MATTTURK.COM Matt Turck viene aggiornata annualmente la tavola esplicativa di tutti i raggruppamenti di aziende che operano in questo mondo e che pubblichiamo: Big_Data_Landscape_Final

2019 Matt Turck Big Data Landscape Final Fullsize

Big Data Analytics e Big Data Management secondo IBM

Svariati grandi attori di questo campo, danno definizioni pressoché univoche ai Big Data ma ne caratterizzano gli aspetti in modalità differenti:

Secondo uno dei principali operatori nel mondo dei big data, IBM perlappunto, tali grosse fonti di dati vengono caratterizzate da 4 V:

Volumi di dati e quindi ampiezza di quantità, Variety o varietà di dati e quindi tipologie, Veracity o attendibilità degli stessi e Velocity ossia velocità per la loro raccolta ed elaborazione.

Nella tavola successiva tutte le caratteristiche essenziali secondo loro:

http://www.ibmbigdatahub.com/infographic/four-vs-big-data

4 Vs of big data scaled

Big Data Analytics e Big Data Management: le fonti secondo IBM

Le_fonti_dei_big_data

Big Data Analytics e Big Data Management: le loro evoluzioni

Abbiamo visto finora come le interazioni che svolgiamo tutti i giorni con Facebook, Whatsapp, email, navigazione web, acquisti ecc, comporti la raccolta di dati da parte di una miriade di soggetti che, al di la del giusto trattamento degli stessi secondo le norme vigenti nei vari paesi per il trattamento dei dati sensibili (GDPR sulla privacy), viene memorizzata da un\’altrettanta miriade di fonti.

Pensate solo alle Universal Analytics di Google o le Facebook Insights che rappresentano da sole quantità impressionanti di Big Data da analizzare e correlare tra loro.

Le capacità di calcolo odierno hanno reso possibile il mettere in relazioni fonti dati pressoché inesauribili per poterle strutturare o comunque relazionare dopo averle razionalizzate.

Big Data Analytics e Big Data Management: tipologie di Big Data

Strutturato: formato dati organizzato con uno schema fisso, esempio RDBMS

Semi-strutturato: dati parzialmente organizzati che non hanno un formato fisso, esempio tipo XML, JSON ecc.

Non strutturato: dati non organizzati con uno schema sconosciuto come file audio, file video ecc.

Big Data Analytics e Big Data Management: valore nel presente e nel futuro

Come sempre più spesso si dice… il futuro è nei dati e, soprattutto, nella correlazione tra di essi.

Sempre maggiori capacità di calcolo forniranno la possibilità di mettere in relazione insiemi di dati e tracciare dei modelli.

Sempre maggiori capacità di archiviazione ci permetteranno di estendere le ricerche su periodi più lunghi fornendo maggiore attendibilità ai modelli stessi.

error: Alert: Content is protected !!