Laurea magistrale in Data Science

Laurea magistrale in Data Science

Probability for data science (2020/2021)

Codice insegnamento
4S009077
Crediti
12
Coordinatore
Francesco Giuseppe Cordoni
Settore disciplinare
MAT/06 - PROBABILITÀ E STATISTICA MATEMATICA
Lingua di erogazione
Inglese

Pagine collegate al corso



L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti
Parte I 4 I semestre Paolo Dai Pra
Parte II 7 I semestre Francesco Giuseppe Cordoni
Teoria 1 I semestre Luca Di Persio

Vai all'orario delle lezioni

Obiettivi formativi

Il corso fornirà un'introduzione auto-contenuta e matematicamente rigorosa alle moderne tecniche di analisi dei dati e modellizzazione dei fenomeni aleatori, con particolare attenzione alle basi teoriche, proprie della teoria delle probabilità, necessarie per sviluppare soluzioni efficaci alle sfide caratterizzanti ambiti eterogenei, e.g., finanza, fault-detection, innovation forecasting, energy prediction, etc., tipici della Industria 4.0, con particolare riferimento alle sfide poste in ambito big data analytics. La presentazione di concetti, problemi e relative soluzioni teorico/pratiche, verrà orientata alle applicazioni, anche facendo uso di software statistico specifico (e.g.: Matlab, R, KNIME, etc.) sempre mantenendo un elevato livello di rigore matematico. All'interno del corso verranno ricordate le nozioni di base della teoria della Probabilità moderna (e.g.: variabili casuali, le loro distribuzioni e principali proprietà statistiche, teoremi di convergenza e applicazioni), con particolare attenzione ai processi stocastici fondamentali (e.g. : catene di Markov, processi di nascita e morte, teoria della code con applicazioni del mondo reale) e le loro applicazioni all'interno di scenari del mondo reale e caratterizzati dalla presenza di big data e serie temporali correlate.

Al termine del corso lo studente dovrà dimostrare di:

● conoscere le basi formali della teoria della probabilità
● saper utilizzare i concetti di variabile aleatoria (tanto in ambito discreto che continuo)
● saper sviluppare modelli basati su modelli probabilistici noti, e.g., v.a. binomiali, di Poisson, Gaussiane, misture di Gaussiane, etc.
● aver compreso e saper utilizzare la teoria di base dei processi stocastici, con particolare riferimento alla teoria delle catene di Markov (a tempo discreto e continuo), ai processi di nascita e morte ed applicazioni correlate
● conoscere e saper utilizzare i concetti di base in ambito statistico descrittivo ed inferenziale

Programma

Probabilità, condizionamento e indipendenza.

Variabili aleatorie e distribuzioni. Distribuzioni discrete. Valor medio e varianza. Distribuzioni continue.

Vettori aleatori. Indipendenza di variabili aleatorie. Covarianza e correlazione.

Teoremi limite: Legge dei Grandi numeri e Teorema Limite Centrale. Approssimazione normale.

Vettori aleatori normali.

Catene di Markov a tempo discreto. Markov Chain Monte Carlo.

Processi di Poisson ed elementi di Teoria delle Code. Catene di Markov a tempo continuo.

Introduzione alle reti aleatorie.

Modalità d'esame

L’esame si svolge in due parti.
La prima parte, obbligatoria per tutti gli studenti, consiste di una prova scritta con esercizi.
La seconda parte può essere svolta, a scelta dello studente, con una delle seguenti modalità:
- prova orale, in cui lo studente dovrà essere in grado di esporre le nozioni e i modelli descritti nel corso, sia negli aspetti teorici che in quelli applicativi;
- un progetto assegnato dal docente, che includerà la scrittura di un codice per una simulazione.

Testi di riferimento
Attività Autore Titolo Casa editrice Anno ISBN Note
Parte II S. Ross A First Course in Probability (Edizione 10) Pearson 2018
Parte II P. Baldi Calcolo delle Probabilità McGraw Hill 2007 9788838663659
Parte II S. Ross Introduction to Probability models (Edizione 12) Academic Press 2019
Teoria Durret, R. Random graph dynamics Cambridge university press 2007
Teoria Bolloas, B. Random graphs Cambridge university press 2001
Teoria Chung, F. R. K. and Lu, L. Random graphs AMS Bookstore 2006
Teoria Duflo, M. Random Iterative Models, Applications of Mathematics, 34 SpringerVerlag, Berlin 1997
Teoria Albert, R. and Barab´asi, A.-L. Statistical mechanics of complex networks. Reviews of modern physics, 74(1):47. 2002 Reviews of modern physics, 74(1):47.




© 2002 - 2021  Università degli studi di Verona
Via dell'Artigliere 8, 37129 Verona  |  P. I.V.A. 01541040232  |  C. FISCALE 93009870234