This PhD dissertation summarizes research questions and related answers achieved in the context of the PhD program of “Analytics for Economics and Management” of University of Brescia, Department of Economics and Management, attended by the author in the years 2018-2021. Main research activity is related to applying data science methodologies, and machine learning in particular, to sport, focusing on basketball. Intended goals are both proposing tools to help coaching staff in matches’ preparation, and facing the classification problem of outcome prediction of a match. The second research activity is focused on natural language processing applied to the bibliometric field, to offer valuable tools in finding and evaluating papers in a specific research domain (e.g. data science and sport, or COVID-19). The set of techniques includes, among others, Decision Trees, Random Forests, Recursive Partitioning, Deep Learning, Topic Models. All implementations are written in R language, and source code is available on demand.
Questa tesi di dottorato riassume gli obiettivi di ricerca e le relative risposte ottenute nell’ambito del programma di dottorato “Modelli e Metodi per l’Economia e il Management” dell’Università di Brescia, Dipartimento di Economia e Management, cui l’autore ha partecipato negli anni 2018-2021. La principale attività di ricerca è relativa all’applicazione delle metodologie di data science, e in particolare il machine learning, allo sport, focalizzandosi sul basket, col duplice scopo di fornire allo staff tecnico strumenti per preparare e analizzare un match, e di affrontare il problema di classificazione della previsione del risultato di una partita. La seconda attività di ricerca affrontata è focalizzata sull’utilizzo del linguaggio naturale nel settore bibliometrico, al fine di offrire strumenti utili alla individuazione e valutazione di articoli rilevanti per uno specifico contesto scientifico (ad esempio data science e sport, oppure COVID-19). L’insieme di tecniche utilizzate include, tra le altre, gli Alberi di Decisione, le Random Forests, il Recursive Partitioning, il Deep Learning, i Topic Models. Tutte le implementazioni sono scritte nel linguaggio R, e il codice sorgente è disponibile su richiesta.
Statistical models and algorithms for data mining and machine learning - Applications to sports analytics and bibliometrics / Migliorati, Manlio. - (2022 Jan 20).
Statistical models and algorithms for data mining and machine learning - Applications to sports analytics and bibliometrics
MIGLIORATI, Manlio
2022-01-20
Abstract
This PhD dissertation summarizes research questions and related answers achieved in the context of the PhD program of “Analytics for Economics and Management” of University of Brescia, Department of Economics and Management, attended by the author in the years 2018-2021. Main research activity is related to applying data science methodologies, and machine learning in particular, to sport, focusing on basketball. Intended goals are both proposing tools to help coaching staff in matches’ preparation, and facing the classification problem of outcome prediction of a match. The second research activity is focused on natural language processing applied to the bibliometric field, to offer valuable tools in finding and evaluating papers in a specific research domain (e.g. data science and sport, or COVID-19). The set of techniques includes, among others, Decision Trees, Random Forests, Recursive Partitioning, Deep Learning, Topic Models. All implementations are written in R language, and source code is available on demand.File | Dimensione | Formato | |
---|---|---|---|
MiglioratiThesis_PDFA_1b.pdf
accesso aperto
Descrizione: TESI
Tipologia:
Tesi di dottorato
Dimensione
13.09 MB
Formato
Adobe PDF
|
13.09 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.