This PhD dissertation summarizes research questions and related answers achieved in the context of the PhD program of “Analytics for Economics and Management” of University of Brescia, Department of Economics and Management, attended by the author in the years 2018-2021. Main research activity is related to applying data science methodologies, and machine learning in particular, to sport, focusing on basketball. Intended goals are both proposing tools to help coaching staff in matches’ preparation, and facing the classification problem of outcome prediction of a match. The second research activity is focused on natural language processing applied to the bibliometric field, to offer valuable tools in finding and evaluating papers in a specific research domain (e.g. data science and sport, or COVID-19). The set of techniques includes, among others, Decision Trees, Random Forests, Recursive Partitioning, Deep Learning, Topic Models. All implementations are written in R language, and source code is available on demand.

Questa tesi di dottorato riassume gli obiettivi di ricerca e le relative risposte ottenute nell’ambito del programma di dottorato “Modelli e Metodi per l’Economia e il Management” dell’Università di Brescia, Dipartimento di Economia e Management, cui l’autore ha partecipato negli anni 2018-2021. La principale attività di ricerca è relativa all’applicazione delle metodologie di data science, e in particolare il machine learning, allo sport, focalizzandosi sul basket, col duplice scopo di fornire allo staff tecnico strumenti per preparare e analizzare un match, e di affrontare il problema di classificazione della previsione del risultato di una partita. La seconda attività di ricerca affrontata è focalizzata sull’utilizzo del linguaggio naturale nel settore bibliometrico, al fine di offrire strumenti utili alla individuazione e valutazione di articoli rilevanti per uno specifico contesto scientifico (ad esempio data science e sport, oppure COVID-19). L’insieme di tecniche utilizzate include, tra le altre, gli Alberi di Decisione, le Random Forests, il Recursive Partitioning, il Deep Learning, i Topic Models. Tutte le implementazioni sono scritte nel linguaggio R, e il codice sorgente è disponibile su richiesta.

Statistical models and algorithms for data mining and machine learning - Applications to sports analytics and bibliometrics / Migliorati, Manlio. - (2022 Jan 20).

Statistical models and algorithms for data mining and machine learning - Applications to sports analytics and bibliometrics

MIGLIORATI, Manlio
2022-01-20

Abstract

This PhD dissertation summarizes research questions and related answers achieved in the context of the PhD program of “Analytics for Economics and Management” of University of Brescia, Department of Economics and Management, attended by the author in the years 2018-2021. Main research activity is related to applying data science methodologies, and machine learning in particular, to sport, focusing on basketball. Intended goals are both proposing tools to help coaching staff in matches’ preparation, and facing the classification problem of outcome prediction of a match. The second research activity is focused on natural language processing applied to the bibliometric field, to offer valuable tools in finding and evaluating papers in a specific research domain (e.g. data science and sport, or COVID-19). The set of techniques includes, among others, Decision Trees, Random Forests, Recursive Partitioning, Deep Learning, Topic Models. All implementations are written in R language, and source code is available on demand.
20-gen-2022
Questa tesi di dottorato riassume gli obiettivi di ricerca e le relative risposte ottenute nell’ambito del programma di dottorato “Modelli e Metodi per l’Economia e il Management” dell’Università di Brescia, Dipartimento di Economia e Management, cui l’autore ha partecipato negli anni 2018-2021. La principale attività di ricerca è relativa all’applicazione delle metodologie di data science, e in particolare il machine learning, allo sport, focalizzandosi sul basket, col duplice scopo di fornire allo staff tecnico strumenti per preparare e analizzare un match, e di affrontare il problema di classificazione della previsione del risultato di una partita. La seconda attività di ricerca affrontata è focalizzata sull’utilizzo del linguaggio naturale nel settore bibliometrico, al fine di offrire strumenti utili alla individuazione e valutazione di articoli rilevanti per uno specifico contesto scientifico (ad esempio data science e sport, oppure COVID-19). L’insieme di tecniche utilizzate include, tra le altre, gli Alberi di Decisione, le Random Forests, il Recursive Partitioning, il Deep Learning, i Topic Models. Tutte le implementazioni sono scritte nel linguaggio R, e il codice sorgente è disponibile su richiesta.
Statistical models and algorithms for data mining and machine learning - Applications to sports analytics and bibliometrics / Migliorati, Manlio. - (2022 Jan 20).
File in questo prodotto:
File Dimensione Formato  
MiglioratiThesis_PDFA_1b.pdf

accesso aperto

Descrizione: TESI
Tipologia: Tesi di dottorato
Dimensione 13.09 MB
Formato Adobe PDF
13.09 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11379/551996
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact