Lo scenario odierno nel mondo è quello di una grande ricchezza di dati. Anche il mondo della MotoGp non fa eccezione a questa regola. In particolare, oggi ci si riferisce a questa ricchezza come “Big Data” proprio per definire come questi possano essere assolutamente rilevanti nelle loro dimensioni prima che a dati caratterizzati ad esempio anche dalla loro “velocità” cioè dati che possano essere utilizzati e analizzati in tempo reale.
Il Machine Learning è un campo dell’Intelligenza Artificiale che fa uno specifico uso di dati ed algoritmi
Questo porta però anche dei grandi vantaggi per chi ovviamente possa farne uso. Il mondo delle MotoGp recentemente è entrato nel novero degli utilizzatori dei Big Data ed in particolare del Machine Learning, con la Ducati Corse. In questo senso le prove di corsa, saranno ottimizzate, infatti mediante un numero elevato di sensori (circa 100 nella moto) hanno permesso la raccolta dei dati è stato possibile analizzare e successivamente simulare le diverse configurazioni portando ad una ottimizzazione di risultati su pista.
Questa è certamente una importante caratteristica delle tecniche di Machine Learning, le quali presentano proprio come specifico obbiettivo quello di garantire l’ottimizzazione delle performances di sistema ottenute. La ragione dell’importanza di queste tecniche è che esse permettono un vantaggio competitivo per chi laddove vengano combinate con competenze e tecnologie avanzate. Ma cos’è il Machine Learning e perché risulta oggi essere così decisivo? Il Machine Learning è un campo dell’Intelligenza Artificiale (definita spesso come AI) che fa uno specifico uso di dati ed algoritmi (quindi nello specifico fa uso di metodologie di analisi dei dati e statistiche) che portano all’apprendimento di tali dati senza spesso rendere necessaria una programmazione del computer.
Il Machine Learning viene utilizzato per predire dati stessi
In particolar modo il Machine Learning viene utilizzato per predire dati stessi, a partire da insiemi di dati considerati a priori (questo in pratica nel “Learning Supervisionato” proprio in quanto siamo interessati a modellizzare quanto “conosciamo”). Questo è quindi quello che può essere esplicitamente fatto facendo uso di sensori, si raccolgono determinati dati i quali possono essere considerati all’interno processo analitico stesso. Maggiori i dati a disposizione, migliori saranno chiaramente le predizioni, in quanto l’algoritmo si allena su insiemi di dati definiti training set (dati di allenamento) al fine di calibrare correttamente i parametri dell’architettura considerata. A quel punto ci sarà una procedura di validazione del modello stesso su ulteriori dati (dati utilizzati come test). In molti casi è possibile considerare anche approcci che facciano uso di più algoritmi (definiti anche classificatori) che permettano di combinare più metodi.
E’ vero infatti che algoritmi diversi possono funzionare molto bene in alcuni specifici casi ma in altri possano avere capacità predittive inferiori. Questa è la specifica ragione per cui è necessario considerare metodi diversi. A partire dai modelli è possibile a quel punto fare delle simulazioni in condizioni, le più diverse, al fine di ottimizzare le prestazioni di corsa riducendo ad esempio i tempi di gara. Mediante le simulazioni, basate dunque su modelli molto realistici della realtà (compito del Machine Learning è proprio “identificare le caratteristiche cruciali dei sistemi complessi e permettere una loro replica) è possibile ad esempio ridurre il numero di prove in pista al fine di migliorare le prestazioni con minori costi e tempo.
Carlo Drago, Ricercatore in Probabilità e Statistica Matematica
Fig.1 una rete neurale: un tipico algoritmo di Machine Learning (immagine ottenuta facendo uso di neuralnet si veda Fritsch e Guenther 2016).
Riferimento:
Stefan Fritsch and Frauke Guenther (2016). neuralnet: Training of Neural Networks. R package version 1.33. https://CRAN.R-project.org/package=neuralnet