Chi conosce le basi dell’Artificial Intelligence (AI) sa quanto siano fondamentali i dati per l’addestramento in Machine Learning o Deep Learning. Tuttavia, la maggior parte del lavoro ruota attorno ad approcci focalizzati sul modello. È giunto il momento di rompere il paradigma e iniziare a concentrarci su approcci incentrati sui dati.  In questo articolo mostreremo l’altro lato della medaglia: l’approccio Data-Centric AI.

Sia chiaro che il nuovo approccio focalizzato sui dati non sostituisce quello incentrato sul modello. Infatti, il successo di un’Artificial Intelligence risiede nel bilanciare entrambi.

Quali sono le differenze tra l’approccio Model-centric e il Data-centric?

 

Model-centric approach

Tale approccio comporta lo sviluppo di una ricerca sperimentale con l’obiettivo di migliorare il modello di Machine Learning. I dati rimangono invariati poiché si lavora unicamente sul codice o sull’architettura del modello. Trovare la giusta soluzione non è facile, dato l’ampio spazio di possibilità da ridurre per tentativi.

 

Data-centric approach

Il Data-centric approach parte dal presupposto che per aumentare l’accuratezza delle applicazioni di Machine Learning sia necessario partire dal data-set. Teniamo in considerazione che la quantità non è tutto! Infatti, questo approccio lavora sul miglioramento sistematico dei dati.

 

 Le caratteristiche del Data-centric approach

 

Dati orientati verso un obiettivo

Prima di tutto, per avere un data-set efficiente è importante che i dati siano orientati verso un obiettivo. Facciamo un esempio banale di un’Artificial Intelligence che deve riconoscere degli abeti. Non basteranno immagini dell’albero, poiché durante il periodo a ridosso delle feste natalizie, molti di questi avranno le lucine e gli addobbi. Se vogliamo riconoscere anche questi bisognerà trovare il giusto equilibrio di dati perché il computer capisca che anche gli abeti con gli addobbi fanno parte della categoria, ma che non tutti gli alberi che hanno gli addobbi sono abeti. Se per assurdo volessimo riconoscere non solo gli abeti reali, ma anche quelli dipinti, servirebbero ancora altri dati di tipo diverso. Dipenderà quindi dall’obiettivo che vogliamo raggiungere attraverso l’Artificial Intelligence. Più i dati saranno specifici sulle varie eccezioni che vogliamo individuare e più il modello sarà accurato.

 

Etichettatura dei dati

Secondo punto: i dati devono essere etichettati correttamente. L’etichettatura è il processo di assegnazione di una o più etichette ai dati. Ad esempio in una foto dove è presente un cane, inserirò l’etichetta “cane” nell’area in cui è l’animale, in modo che la macchina apprenda come riconoscerlo. Se addestriamo un modello su un data-set con un significativo numero di immagini etichettato in modo errato, il risultato sarà un’Artificial Intelligence che non funzionerà correttamente. Al contrario, se etichettiamo correttamente le immagini avremo un modello più accurato e che necessiterà di un minor numero di dati per imparare. Nel Data-centric approach quindi l’attenzione è spostata sulla qualità e non sulla quantità dei dati.

 

Data-set rappresentativo della realtà

Terza caratteristica: perché un modello funzioni, il data-set deve essere rappresentativo della realtà. Tuttavia, la realtà è relativa e dipende dal tempo. Ciò significa che il data-set deve essere aggiornato perché rappresenti in modo continuo la realtà. Per esempio se addestriamo un modello per il riconoscimento delle automobili, è possibile che dopo qualche anno non riesca a riconoscere gli ultimi modelli d’auto se questi differiscono particolarmente da quelli esistenti nel momento della creazione del modello.

Capiamo bene che fare Machine Learning o Deep Learning è qualcosa che va oltre l’algoritmo. I dati non sono solo la base da cui partire, ma il fattore abilitante dell’Artificial Intelligence.

 

Soluzioni di Pragma Etimos

Pragma Etimos offre soluzioni di Computer Vision su misura alle esigenze del cliente. Questo perché crediamo fortemente che non sia il lavoro umano a doversi adattare alla tecnologia, ma che debba essere quest’ultima ad essere ideata e ottimizzata per le necessità dell’uomo.

 

Ricerca targa: l’inserimento di un numero di targa nel campo di ricerca abilita la funzione di elaborazione in background di analisi del video. Qualora si dovesse intercettare un veicolo con la targa in oggetto verrà proposto nell’interfaccia il frame dove è stata intercettata e verrà scritto un file immagine con le stesse informazioni per un accurato controllo successivo.

 

Ricerca oggetti: è possibile avviare una ricerca di oggetti (veicoli, monopattini, animali, ecc.). La selezione della ricerca oggetti abilita la funzione di elaborazione in background di analisi del video. Nel frattempo il software continuerà la ricerca dell’oggetto in altri frame.

 

Ricerca persone: è possibile identificare gruppi di persone e singoli soggetti in real-time. Qualora si dovesse intercettare la persona o il gruppo richiesto, verrà proposto nell’interfaccia il frame dove sono stati intercettati e verrà scritto in un file immagine con le stesse informazioni per un accurato controllo successivo.

 

Analisi dei volti: a partire da un volto restituisce informazioni sull’età, il genere e l’emozione di una persona. Inoltre è in grado di confrontare due visi e capire se si tratta o meno dello stesso soggetto.

POTREBBE INTERESSARTI ANCHE…

Computer Vision

I 5 STEP DI BASE PER COSTRUIRE MODELLI DI RETI NEURALI UTILI ALLA COMPUTER VISION

La Computer Vision (CV) è oggi uno dei rami dell’Artificial intelligence più in via di sviluppo. Ne abbiamo parlato in vari articoli, ma oggi entreremo nel dettaglio di come costruire  modelli di reti neurali per il riconoscimento di vari oggetti: veicoli, targhe,…

Leggi tutto

image recognition - computer vision-face recognition

IMAGE & VIDEO RECOGNITION: L’AI CHE ESTRAE VALORE DAI DATI VISIVI

Sono sempre di più le soluzioni di Intelligenza Artificiale che permettono alle macchine di comprendere i dati visivi. In particolare, possiamo definire quella branca di AI che replica le funzioni dell’apparto visivo umano come Computer Vision. Un esempio è l’Image…

Leggi tutto

Modelli di Reti Neurali utili alla Computer Visio

 

Modelli di reti Neurali: come costruirli con l’approccio Data Centric AI

I modelli di reti neurali partono dai dati:L’approccio Data Centric AI

I modelli di reti neurali e il deep learning

Il futuro è seguire l’approccio Data-Centric AI. Infatti, per una sostenibilità digitale non possiamo farne a meno. Nell’articolo abbiamo visto brevemente di cosa si tratta.

Spieghiamo come migliorare il Machine Learning. Tuttavia, è importante trovare equilibrio. 

Differenza tra Model e Data approach

Vediamo di capire la differenza.

Siamo soliti utilizzare l’approccio sul modello. Perché? Vediamo insieme:

i dati sono base da cui partire. Per esempio: ogni Intelligenza artificiale parte dai dati. 

Ecco perché avere dei dati di qualità è importante. Anzi, fondamentale. Senza questi non avremo risultati efficienti. Se vogliamo che il modello funzione, dobbiamo partire dai dati.

Computer Vision e Data Centric Approach

Perché è importante nella Computer Vision un approccio basato sui dati. Innanzitutto, l’AI parte proprio dai dati. 

Frase breve. Ecco a voi:

  • Data Centric AI
  • Computer Vision
  • Intelligenza Artificiale
  • Modelli neuronali

Per riassumere: partite dai dati.

 

Share This