|
|
|
|
|
Chi siamo |
Scrivi un graffito sul nostro muro! |
Blog |
Inviaci un articolo
|
||
| Tema: l’arte della recensione | Numero 3 del 07-03-2010 | |
| navigazione per: numeri / rubriche | scegli il numero: |
|
08 - Pentaho: la business intelligence è servita di Antony Star ![]() Nell'editoriale, abbiamo paragonato le recensioni alla business intelligence, in verità è come accostare il diavolo all'acqua santa, vista la distanza tra le due discipline. Se per un attimo, però, ci dimentichiamo che da una parte abbiamo delle analisi scritte in lingua naturale e dall'altra l'aggregazione di dati numerici, ecco che questa distanza si riduce e di parecchio.
Come già accennato nell'editoriale, se ci astraiamo da cosa trattano e ci concentriamo sulle competenze e sul modus operandi, ecco che ci rendiamo conto che entrambe le materie tentano di fare la medesima cosa. Prendere una realtà, rappresentata in uno scritto/audivisivo nel primo caso o sintetizzata da dati numerici, nel secondo e darne una o più interpretazioni. Abbiamo parlato di Ipercubi, prendendo anche ad esempio il cubo di Rubik. Supponendo di avere un cubo magico i cui tasselli colorati rappresentano la realtà descritto nel film/libro o nel sistema informativo di un'azienda, cosa fa una recensione o un software di BI? semplicemente muoverà righe e colonne del cubo per capire che significato hanno gli accostamenti tra tasselli diversi che magari prima erano così distanti tra loro da non far apparire un legame. Qui in questo articolo scendermo più nel dettaglio e prendendo come spunto un software open source (pentaho), faremo la recensione del recensore e coglieremo anche l'opportunità di capire come funziona un software di BI e quali sono le sue potenzialità. Dico fin d'ora che vista la tematica, in alcuni punti la trattazione potrebbe risultare un po' complicata. In ogni caso non è nè mia intenzione esaurire l'argomento con questo articolo, nè tanto meno abbandonare i lettori al proprio destino, quindi oltre la promessa di trattare in un prossimo futuro di database, sistemi informativi e quant'altro, ho creato una sezione di commenti appositi per questo particolare articolo, dove poter porre domande ed eventualmente esplicitare le vostre necessità (qualora chi ci dovesse leggere ha a che fare con dati ed è interessato ad avere un software per poterli analizzare). Detto questo addentriamoci nell'analisi di pentaho. Prima di tutto: perchè pentaho? Per tre motivi: - primo perchè è open source e ha a disposizione una community molto attiva, quindi per chi si avvicina a questa disciplina c'è la possibilità di attingere da parecchio materiale online, seppur in inglese. - secondo perchè mi è stato consigliato da un consulente che conosco e stimo e di cui mi fido. - terzo perchè lo sto mettendo sotto una lente d'ingrandimento proprio in questo periodo per capire se può fare al caso mio nell'analisi di alcuni problemi che ho sul lavoro. Secondo me è bene far chiarezza su cosa intendiamo qui per open source. Il modello open source non è sinonimo di gratis, altrimenti le aziende che poggiano su questo modello sarebbero già tutte fallite, non è nemmeno sinonimo di ragazzino in un garage che si inventa una certa utility per fare qualcosa senza controllo. Nei software per aziende, open source vuol dire che le aziende non pagano le licenze del software, ma pagano le competenze che servono per gestirlo. Ovvero, nel caso di pentaho vi sono due versioni del programma, una commerciale che dà diritto, dietro pagamento, al supporto e alla garanzia che la software house si occuperà di risolvere problemi dovuti ai bug; l'altra versione è detta di community, in quanto chi la scarica può farci ciò che vuole, ma non ha nessun supporto da pentaho, nè per la sistemazione di eventuali malfunzionamenti, nè come supporto sul suo utilizzo. Un utente della versione community deve far riferimento al materiale e al supporto online della community stessa, quindi forum, wiki e così via. Per i miei scopi ho fatto il download della versione community. E' possibile scaricare il software dal sito (http://sourceforge.net/projects/pentaho/) e per avere supporto si può far riferimento al forum (http://forums.pentaho.org) o a wiki (http://wiki.pentaho.com). In ogni caso esiste anche una guida su come operare molto comoda in pdf, sempre downlodabile dal sito di pentaho. Per far partire il sistema ci vogliono 3 passaggi semplicissimi e non va installato nulla: - si "scomprime" (unzip) in una cartella scelta da noi il file .zip che si ottiene da sourceforge - si lancia (con un semplice doppio click) il file start-pentaho.bat che si trova nella cartella /pentaho/server/biserver-ce/ - si lancia il file start-pac.bat nella cartella /pentaho/server/administration-console/ A questo punto si apre un browser internet e tutto avviene interagendo con esso: - all'indirizzo http://localhost:8099/ si avranno tutte le funzionalità per amministrare pentaho (dopo aver inserito la login e la password che sono scritte nel manuale pdf) - all'indirizzo http://localhost:8080/ si avranno tutte le funzionalità utente per la gestione e creazione dei report di business intelligence I tool di amministrazione consentono di gestire: - la creazione e la modifica degli utenti che possono utilizzare pentaho per fare le analisi - la creazione e la modifica dei ruoli con i quali accedono a pentaho - le connessioni al database che si decide di analizzare - alcune funzioni per la pulizia dell'ambiente (cancellazione vecchi files, archiviazione, ecc...) - un motore per schedulare delle azioni di manutenzioni ed eseguirle automaticamente Non entreremo nei dettagli dell'amministrazione di pentaho, in quanto la gestione dei sistemi informatici (siano essi di business intelligence che di altro) non è argomento di questo articolo. La parte di Business Intelligence vera e propria si raggiunge come detto utilizzando l'indirizzo http://localhost:8080/. Anche se è di fatto eseguita in un browser web, il "look & fill" è quello delle applicazioni windows standard (stile office 2003 e non 2007 per intenderci): una barra menù in alto con le solite voci quali File, View, Tools ed Help, una serie di icone nel menù contestuale sottostante e infine nella parte principale della schermata alcuni link di scorciatoia verso le funzionalità del sistema. ![]() Partiamo dalla prima delle tre funzionalità: New report. Nella parte alta scelgo quale base di dati andare ad analizzare nel report (nel caso in oggetto io ho scelto la tabella orders). Quindi scelgo il template nel quale riporre i dati nella seconda metà dell'area di lavoro (ad esempio pentaho). E infine in che formato produrre l'anteprima del report (ad esempio HTML). ![]() Vado ad indicare secondo quali parametri (che guarda caso sono i parametri delle diverse entità del database) voglio aggregare l'analisi. Qui si vede bene il discorso del cubo di Rubik, infatti io posso aggregare secondo 5 livelli di analisi e secondo tutti i parametri che compongono il mio database. Un esempio, io potrei voler capire che tipo di legame c'è tra il territorio e le quantità ordinate di una certa merce, allora io aggrego al primo livello i dati per "territory" e poi nel secondo livello aggrego per "Product line" e nel terzo per "Quantity ordered". Sto dando una vista ben precisa dei dati che ho raccolto e la sto dando con un'enfasi diversa da come li ho raccolti. Presumibilmente io ho registrato gli ordini cliente per cliente, ordine per ordine, qui invece sto analizzando come i miei ordini si distribuiscono sulle mie linee di prodotto e sulla geografia. Interpreto i dati, ne do una visione, accostando due o più parametri i cui legami possono anche non essere facilmente visibili durante l'attività di tutti i giorni. ![]() Scelgo alcuni criteri di visualizzazione (tipo se visualizzare i dati con ordinamento crescente o decrescente e se metterli in orizzontale o verticale) e produco il mio report. ![]() Ovviamente se invece che "New report" decido di seguire l'altra via, ovvero "New analysis View" in modo analogo si potrà ottenere un'analisi grafica dei dati immagazzinati nel database. ![]() Ovviamente tutto ciò che abbiamo utilizzato fino ad ora è completamente personalizzabile, sia il template, sia i dati che vengono utilizzati per costruire il report. Come funziona pentaho? Supponiamo di dover analizzare un database costruito per risolvere un certo problema, non importa quale, nel nostro esempio l'obiettivo è consentire ad un operatore di registrare gli ordini che vengono effettuati dai propri clienti. Quindi il software che usa, probabilmente consentirà di svolgere quel lavoro nel seguente modo: in una schermata inserirà i dati del cliente, che presumibilmente finiranno in una tabella del database, in un'altra schermata invece registrarà l'ordine indicando sull'ordine anche il codice cliente per legarlo a chi lo ha effettuato e questi dati finiranno in un'altra tabella. Quando l'ordine viene stampato il software andrà nelle due tabelle e ricaverà i dati utili per effettuare la fatturazione, la spedizione e tutte le funzioni che regolano la vendita. Il software che gestisce gli ordini ragiona mettendo al centro il cliente. Pentaho invece ha come obiettivo quello di rendere possibile la navigazione di quei dati, mettendo al centro dell'analisi oggetti diversi dal cliente ed anche più oggetti contemporaneamente. Quindi pentaho si collega a quel database e importa la struttura. Da qui in poi il gioco è nelle mani dell'analista di BI, che alle relazioni che servono a seguire il processo di ordini/fatturazioni, affianca delle nuove relazioni, dei veri e propri percorsi che consentono di navigare i dati. Questi percorsi sono le rotazioni che faccio compiere al mio cubo di Rubik per far si che due tasselli molto lontani tra loro arrivino a contatto. Nel nostro caso le costruiamo affinchè vi sia un percorso tra la nazione del compratore, il tipo di prodotto che può acquistare e il suo costo. Non importa quanti passi debbo compiere per arrivare dall'uno all'altro, l'importante è che questo percorso esista. Quando attivo un report, pentaho non fa altro che iniziare a scorrere le relazioni e "sommare" i dati simili secondo le caratteristiche che sono state richieste. Nel nostro solito esempio somma i costi, prodotto per prodotto di quelli venduti in una stessa nazione. In modo che io possa rispondere alla domanda: a quanto ammontavano gli ordini dei trenini elettrici in nord america? Banale? Non proprio, se pentaho riesce a calcolare questo tipo di rapporto, evidentemente nel database originale i dati giusti ci sono, ma quello che può risultare difficile è fare in modo che il quei dati possano essere aggregati. Devo analizzare la struttura del DB, trovare i percorsi giusti, trovare il modo di aggregarli. Vuol dire in poche parole, avere ben chiaro come funziona il software originale e lo scopo per il quale è stato creato, ma non solo, bisogna aver ben chiaro anche quali sono gli obiettivi delle analisi che debbono essere compiute su quei dati. Ecco perchè nell'editoriale si sono accomunate le recensioni alla business intelligence, perchè se prendiamo ad esempio un libro, quello che succede è che l'autore organizza i fatti del libro a secondo della propria esigenza narrativa. Ciò che invece fa chi quel libro lo recensisce è cercare di capire quella struttura e quindi creare delle associazioni che l'autore non ha esplicitato, collega fatti distanti, collega quel libro con altri, lo scompone e lo ricompone mille e mille volte e alla fine inizia a percorrere i legami che ha creato riuscendo così a portare alla luce un determinato aspetto. Approfondimenti: COMMENTA su INQ - COMMENTA su SFERO
|
||||||||||||||||||||||
|
|
|||
|
tutti gli articoli di questa sezione sono pubblicati sotto licenza creative commons (leggi le condizioni) ad esclusione delle fonti di informazioni giornalistiche che sono di proprietà dei siti indicati nei link sottostanti. | ||