Documentazione
-
Sii-Mobility: DE4.2a-Sistema di acquisizione e Aggregazione dati, dal concetto al dato, dal dato al database con ETL, e dal database al modello ontologico (ITA, ENG)
-
GUIDA alla programmazione: Programmazione ETL per Data Warehouse (ITA)
-
manuale utente per la creazione di ETL per dati statici e dinamici
-
SLIDE: Km4City Sii-Mobility: Data Ingestion Tutorial, Overview, Parte 1
-
VIDEO: Km4City Sii-Mobility: Data Ingestion Tutorial, Overview, Parte 1
-
SLIDE esercitazioni produzione ETL: Km4City Sii-Mobility: Data Ingestion Tutorial, Parte 2: Teoria ed esercitazioni, vedi anche video
-
VIDEO Parte 2a, teoria: Data Ingestion Tutorial
-
VIDEO Parte 2b, Esercitazione su ETL, data ingestion Tutorial
-
Slide 2014-2015 Programmazione ETL per DataWarehouse (Parte 8): from open data to triples, OD 2 RDF, OD and PD, static and Dynamic OD, Problemi architetturali, programmazione ETL, esempi concreti, massive data mining and crawling, quality improvement, geolocalization, triplification, reasoning and rendering, example of km4city data ingestion.
-
esempi di processi formalizzati in ETL per il DataWarehouse
-
Testi consigliati
-
Pentaho Data Integration 4 Cookbook - PACKT Publishing (A. S. Pulvirenti, M. C. Roldàn)
-
Pentaho Kettle Solutions - Wiley (M. Casters, R. Bouman, J. van Dongen)
-
pagina web Km4City: http://www.km4city.org
-
pagina Open Source di DISIT Org: http://www.disit.org/6763
-
Scarica il Flyer di Km4City: http://www.km4city.org/km4city-booklet-v02-21x21-md1.pdf
-
P. Bellini, M. Benigni, R. Billero, P. Nesi and N. Rauch, "Km4City Ontology Bulding vs Data Harvesting and Cleaning for Smart-city Services", International Journal of Visual Language and Computing, Elsevier, http://dx.doi.org/10.1016/j.jvlc.2014.10.023 http://www.disit.org/6573
Macchina Virtuale, VMSDETL, gia' pronta
Version 2019:
VM for download to be put in execution via VMware player:
Version 2019
User Manual to download:
Version 2017:
VMSDETL, con Linux Ubuntu 14.04 (root: ubuntu, password: ubuntu)
La VM contiene un sistema di sviluppo preparato con i segunti tool che sono elencati per vostra conoscenza, ma che
non devono essere installati, ma in certi casi avviati:
-
Oracle Java 7 JDK (requisito per Penthao Data Integration e per Apache HBase)
-
Penthao Data Integration (PDI) ver. 5.0.1 (tool ETL)
-
XAMPP (Database MySQL)
-
http://wiki.ubuntu-it.org/Server/Xampp
-
Avvio con il comando sudo /opt/lampp/lampp start da lanciare da shell.
-
Arresto con il comando sudo /opt/lampp/lampp stop da lanciare da shell.
-
Accesso da PDI con username=disit e password=ubuntu .
-
Apache HBase ver. 0.90.5 (Database NoSQL), in uso come stand alone
-
https://archive.apache.org/dist/hbase/hbase-0.90.5/
-
Avvio con il comando start-hbase.sh da lanciare da shell una volta dentro la cartella /bin.
-
Arresto con il comando stop-hbase.sh da lanciare da shell una volta dentro la cartella /bin.
-
Verifica dell'esecuzione con il comando jps da shell.
-
Verifica dell'esecuzione da interfaccia web con accesso a http://localhost:60010/master.jsp .
-
h-rider ver. 1.0.3.0 (tool opzionale di visualizzazione/manipolazione dei dati memorizzati su HBase), noSQL database per big data
-
Karma data integration ver. 2.024 (necessario per la fase di triplification)
Esempi/sorgenti processi ETLe database setting
-
la macchina virtuale VMSDETL contiene gia questi dati, in questa sezione saranno messi anche gli aggiornamenti a questi dati qualora la VMSDETL si piu' vecchia.
-
Database MySQL
-
dump db Elaborato_Sis_Distr contenente le tabelle MappingCity,ServiceCategory,tbl_toponimo_BIS,process_manager2 (dump_db_elaborato.sql)
-
per i sorgenti di processi ETL di esempio con le tre fasi, si veda cartella sul desktop della VM con il nome "trasformazioni". Dentro vi sono altre due cartelle con i due esempi.
ultima modifica: 29-04-2016
Bookmark/Search this post with: