Metodi Statistici Multivariati
Propedeuticità
Elementi di statistica descrittiva (media, varianza, rapporti indici, retta di regressione). Strumenti di base dell’analisi matematica (sistemi di equazioni lineari, funzioni, derivate, integrale e relativo significato geometrico).
Finalità del corso
Fornire una introduzione generale ai principi delle tecniche di “data science”, e alle loro applicazioni in campo aziendale e di business intelligence. Durante il corso gli studenti apprenderanno l’ambiente per l’analisi dei dati R, realizzando personalmente applicazioni dei modelli di data mining e business intelligence oggetto del corso.
Obiettivi del corso
Programma
- Modulo I. Elementi di probabilità ed inferenza statistica
- Probabilità elementare
- Variabii aleatorie discrete e continue
- Variabili aleatorie doppie e multiple
- Elementi di inferenza statistica
- Matrici dati
- Modulo II. Modelli di Data Mining e Knowledge Discovery per l’azienda
- Statistica aziendale e Data Mining
- Apprendimento supervisionato e non supervisionato
- Regole associative e Market Basket Analysis
- Classificazione Naïve Bayes
- Alberi di decisione
- Clustering I: algoritmi gerarchici
- Clustering II: k-means
- Modulo III. Laboratorio
- Il laboratorio è parte integrante del corso. Sarà utilizzato il software di analisi dei dati R, liberamente disponibile sul network del CRAN all’indirizzo http://cran.r-project.org. Durante il corso di laboratorio sarà erogata un’introduzione approfondita ad R, e verranno mostrati casi pratici di studio relativi a tutti gli argomenti teorici riguardanti la seconda parte del corso.
Testi consigliati
Riferimento generale per la preparazione dell’esame:
- M. Bilancia (2016) Dispense per il Corso di Metodi Statistici Multivariati – Dipartimento Jonico, liberamente distribuite agli studenti su richiesta.
Di utile consultazione per approfondimento/consultazione sulle metodologie descritte a lezione (ma non richiesti ai fini della preparazione dell’esame) possono essere:
- S. Borra, A. Di Ciaccio (2014) Statistica – Metodologie per le Scienze Economiche e Sociali 3/ed., Mc-Graw Hill, ISBN: 9788838667404
- S. Dulli, S. Furini, E. Peron (2009) Data Mining: Metodi e Strategie, Springer Science & Business Media, ISBN 9788847011632
- P. Giudici (2005) Data Mining – Metodi Informatici Statistici ed Applicazioni 2/ed., McGraw Hill, ISBN: 9788838672125.
Le dispense fornite dal docente coprono completamente anche la parte di laboratorio. Tuttavia una utile guida integrativa a riguardo è la seguente:
A.M. Mineo, Una Guida all’Utilizzo dell’Ambiente Statistico R, 2003. Disponibile sul sito del CRAN
Modalità di accertamento conoscenze
- Esoneri: No
- Prova Scritta: Si
- Colloquio Orale: No
Forme di assistenza allo studio
- Corso presente nella zona in e-learning del Sito Web di Facoltà:
Organizzazione della didattica
- Lezioni frontali: Si
- Cicli interni di lezione: No
- Corsi integrativi: No
- Esercitazioni: Si
- Seminari: No
- Attività di laboratorio: Si
- Project work: No
- Visite di studio: No