(um es vorweg zu nehmen: es geht um Superset und Redash und ich hab mich mal wieder bei der Zangenanwendung gehen lassen)

Ganz im Widerspruch zur Schlagzeile geht es hier und heute nicht um Polstergarnituren. Es geht auch nicht um Exhibitionistenwiederholungstäter. Es geht um sogenannte "Business Intelligence / Analytics"-Lösungen. Also (Web-)Applikationen, die zuvor zu definierende Metriken, wie etwa Zeitserien, graphisch einfach erfassbar visualisieren - und im besten Falle auch noch dynamisch filterbar präsentieren.

A-, B-, C-Promis auf dem BI-Schlachtfeld

Prominente Vertreter hier sind etwa Tableau, PowerBI oder auch Pentaho. Blitzblank-neue, moderne und umsonstene, Lösungen in dieser Kategorie sind Airbnb Superset (ehemals Caravel) sowie redash. Mich interessieren ganz besonders die beiden letztgenannten - auch im beruflichen Kontext, aber ganz besonders im privaten. Die kosten nun mal nichts und sind außerdem mal wieder sehr containerfreundlich angelegt. Juhu!

Oracle's Tafelfertig-Kunde

Die Aus-der-Box-Kompatibilität zu einem der größten Datenbankvertreter, nämlich Oracle, ist mal wieder äußerst stiefmütterlich; und ich denke, das hat Oracle selbst zu verantworten, da es seinen "Instantclient" mitsamt Lizenz behandelt wie ein mittleres Staatsgeheimnis. Allein die URL (http://www.oracle.com/technetwork/topics/linuxx86-64soft-092277.html) ist schon fast museumsreif. Aber auch da gibt es Wege drumherum, nur leider sind dies Wege, die einen Automatic Build auf DockerHub (und damit eine "Vervielfältigung") eher hürdenreich bis unmöglich machen. Aber man kann ja auch manuell...hach ja. Dazu komm' ich später einmal. Zumindest im beruflichen Kontext ist Oracle noch ein recht großes Ding, daher widme mich auch dieser eigentlich unnötigen Thematik, hätte Oracle denn einen gesunden Sinn für Realität. Wer ungeduldig ist, der kann aber schon einmal hier vorschnuppern:

Red nich! Mach mal!

Praktische Erfahrungen in der Anbindung beider Dashboard-Lösungen an Postgresql (und auch an Oracle) liegen jedenfalls auch jetzt schon vor und prinzipiell tun sich beide nicht viel. Ich persönlich finde Redash jedoch "angenehmer". Das hat mit meinen Präferenzen zu tun, aber auch mit z.B. der Art und Weise wie man (Multi-)Filter für eine Visualisierung definieren kann. Bei Superset blicke ich das entweder nicht ganz durch oder es sind eher nur Dashboard-weite Filter vorgesehen, und auch das finde ich nicht sonderlich eingängig und verständlich. Ich gebe aber zu, dass ich manchmal den Wald vor lauter Bäumen nicht sehe. Ein Brett vor'm Kopf habe. Etwas belämmert bin. Nicht mehr alle Latten am Zaun...ach, lassen wir das.

Ich werde in folgenden Posts vermutlich, eventuell, vielleicht noch einmal genauer auf Unterschiede "Redash vs. Superset" eingehen, vorerst aber wirble ich erst einmal nur Redash durch eure Kupferleitung.

Ich mache: Erkundigungen für Armaturenbretter

Queries zu editieren ist recht eingängig - das Autocomplete des SQL-Editors grätscht zwar manchmal dazwischen weil es nicht merkt, dass ich in der Lage war, das Schema selber vor die Tabelle zu schreiben (was in "SELECT * FROM schema.schema.tabelle" resultiert), aber sonst ist das alles ganz fein:

Vorteile in diesem Bereich zu Superset: keine ernsthaften. Damit SQL't sich genauso gut, auch wenn ich Redash für meine Arbeitsgewohnheiten angenehmer finde. Nachdem man die Query geschrieben hat, lassen sich auch gleich an derselben Stelle in der Applikation 1-n Visualisierungen daran hängen.

Recht angetan bin ich ja von der Pivot-Tabelle, die einem User im Dashboard ein äußerst dynamisches Re-Arrangieren ermöglicht (weil die Daten sich schon alle im Frontend befinden). Als ersten Gehversuch habe ich somit auch ein Dashboard erzeugt, welches als erstes Widget einen Graph über die volle Bildschirmbreite posaunt (Min/Mean/Max-Bitcoin-Preise von 2011-2017, Anzahl Samples im Zeitraum) und als zweites Widget eben jene Pivot-Tabelle darunter klebt:

Apropos: Ich habe gerade einmal Widget bei LEO nachgeschlagen und belustigt festgestellt, dass es (unter anderem, natürlich) "Mätzchen" oder "Dingsbums" bedeutet. Klasse. Beides gehört sowieso zu meinem Standardwortschatz.

Multi-Filter gibt es, wie oben angesprochen, auch schon, und wie folgt werden sie definiert:

Kann auch, siehe unten, ein bisschen schäl aussehen, so eine Multifilter-Auswirkung, aber es geht mir ja erstmal nur um die funktionale Verdeutlichung. Eingrenzung einer Entität auf 1-n Werte ist aber definitiv ein äußerst nützliches Feature - und in Redash auch äußerst bequem zu erreichen, finde ich. Wie gesagt, bei Zeitserien mit Line-Graph sieht das etwas ulkig aus:

Pivot-Tabellen bringen übrigens für die verwendeten Zeilen- und Spaltenparameter Multi-Auswahl gleich mit. Im obigen Beispiel wären das also "year" und "month".

Was kann Redash eher nicht so?
  • Resizing von Dashboard-Widgets nachdem man sie in's Dashboard eingefügt hat. Hier geht anscheinend nur "Entfernen, in neuer Größe oder Reihenfolge wieder hinzufügen".
  • Superset bietet vier (glaube ich) Widget-Größen an bzw. ist freier im Resizen. Redash bietet genau zwei Größen: Halbe Dashboard-Breite und volle Breite. Größenänderung in der Vertikalen geht gar nicht. Hemdsärmelig, aber für mich definitiv "good enough".
So, das soll erst einmal reichen

Jawohl.