





tel: 0574 570489
mob: 320 4267676
Gestione Globale d'Impresa


KNIME Analytics Platform
corso base
Introduzione
Questo corso, della durata di quattro ore e composto da cinque sezioni, è rivolto a chi lavora con i dati nelle proprie attività e desidera applicare tecniche avanzate di data analysis e machine learning senza dover imparare un linguaggio di programmazione come Python o R.
Grazie a KNIME Analytics Platform, un ambiente completo e open-source per l'analisi dei dati, è possibile sfruttare i più diffusi algoritmi di data mining attraverso un'interfaccia visuale intuitiva.
Il software utilizza componenti modulari chiamati nodi, che possono essere combinati tra loro per elaborare, trasformare e visualizzare qualsiasi tipologia di dati. Inoltre, KNIME offre la possibilità di integrare codice Python o R quando necessario, rendendo la piattaforma estremamente flessibile e potente.
Sezione 1: Installazione e configurazione di KNIME
Inizieremo con l'installazione del software, esplorando il processo di download e configurazione su diversi sistemi operativi. Analizzeremo poi la nuova interfaccia utente introdotta nella versione 5, confrontandola con la Classic UI per comprendere le principali differenze e miglioramenti.
Successivamente, ci occuperemo delle estensioni, strumenti che ampliano le funzionalità di KNIME, spiegando come installarle e gestirle. Approfondiremo poi il Workbench, l'ambiente di lavoro principale, e il KNIME Hub, una risorsa indispensabile per accedere a workflow preconfigurati, documentazione e supporto dalla community.
Per personalizzare al meglio l'ambiente di lavoro, vedremo le opzioni disponibili nel Workflow Editor e l'utilizzo di strumenti come il KNIME Explorer e la finestra Description, utili per navigare tra i progetti e ottenere informazioni dettagliate sui nodi.
Infine, analizzeremo strumenti diagnostici come la console, utile per intercettare errori e problemi nei workflow, e il Node Explorer, che consente di esplorare e selezionare i nodi disponibili in KNIME.
Sezione 2: Importazione, esportazione e gestione dei dati
Esploreremo come importare ed esportare un workflow, facilitando la condivisione e il trasferimento dei progetti tra sistemi diversi. Studieremo inoltre come KNIME gestisce i dati locali e remoti, analizzando il concetto di mount point per migliorare l'accesso e l'organizzazione delle risorse.
Un aspetto cruciale dell’analisi dei dati è la lettura e la scrittura di file. Vedremo quindi come utilizzare nodi specifici come il CSV Reader, Table Reader e Excel Reader per accedere ai file in vari formati. Infine, approfondiremo come collegarsi a un database, interrogando e gestendo dati strutturati in modo efficiente.
Sezione 3: Manipolazione e aggregazione dei dati
La manipolazione dei dati è una fase essenziale per la preparazione e l’analisi. In questa sezione esploreremo le principali tecniche di filtraggio, utilizzando nodi come Row Filter e Column Filter per selezionare i dati di interesse.
Vedremo poi come effettuare la conversione tra tipi di dati e come utilizzare il nodo Column Expression per applicare trasformazioni personalizzate alle colonne. Approfondiremo anche le tecniche di aggregazione, sfruttando nodi come GroupBy, Pivot, Joiner e Concatenate per riorganizzare e combinare dataset.
Infine, introdurremo concetti avanzati come i Metanode e i Component, strumenti utili per strutturare workflow complessi e migliorare la modularità e la riusabilità dei processi.
Sezione 4: Visualizzazione, data mining, creazione di report
La visualizzazione è fondamentale per interpretare i dati. Esploreremo strumenti come il Data Explorer, che fornisce una panoramica statistica delle variabili, e Scatter Plot, utile per identificare relazioni tra variabili.
Approfondiremo poi le viste interattive, che permettono di esplorare i dati dinamicamente. Passeremo quindi al data mining, distinguendo tra approcci supervised e unsupervised. Studieremo il funzionamento dei nodi Learner e Predictor, fondamentali per l'addestramento e la previsione nei modelli di machine learning.
Parleremo degli algoritmi chiave del machine learning, tra cui il Decision Tree per la classificazione, il Regression Learner per le previsioni numeriche, la Logistic Regression per i problemi di classificazione binaria e il K-Means, uno dei più noti algoritmi di clustering.
KNIME consente di trasformare i risultati delle analisi in report chiari e professionali. Approfondiremo l’utilizzo di BIRT (Business Intelligence and Reporting Tools), uno strumento avanzato per la creazione di report con tabelle, grafici e analisi personalizzate.
Vedremo inoltre il nodo Report Creator, che facilita la generazione di report direttamente all'interno dei workflow e permette l’esportazione in vari formati.
Sezione 5: Anomaly Detection: una applicazione pratica di KNIME
Individuare anomalie nei dati è un'operazione fondamentale in numerosi contesti, come la manutenzione predittiva. In questa lezione analizzeremo un caso pratico di Anomaly Detection applicato alla diagnostica di un motore elettrico, sfruttando le misurazioni dei suoi sensori.
Tratteremo i seguenti argomenti:
-
Pre-elaborazione dei dati: allineamento temporale e aggregazione dei dati raccolti.
-
Training di modelli autoregressivi (AR): utilizzo di modelli AR per il rilevamento delle anomalie.
-
Visualizzazioni interattive: creazione di heatmap e grafici per l’analisi e interpretazione dei risultati.
Durata: 4 ore