<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<channel>
	<title>Wangenrot - Visual Data Mining</title>
	
	<link>http://www.wangenrot.at</link>
	<description>Visual Data Mining</description>
	<lastBuildDate>Thu, 16 Jun 2011 08:08:57 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
		<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/wangenrot" /><feedburner:info uri="wangenrot" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><item>
		<title>Der Traum eines Datavis-Experten</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/vq5WbiU8wPc/</link>
		<comments>http://www.wangenrot.at/2011/320-der-traum-eines-datavis-experten/#comments</comments>
		<pubDate>Thu, 16 Jun 2011 08:08:57 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Visualisierung]]></category>

		<guid isPermaLink="false">http://www.wangenrot.at/?p=320</guid>
		<description />
			<content:encoded><![CDATA[<p><iframe width="560" height="349" src="http://www.youtube.com/embed/zyMfpJh3h4A?rel=0" frameborder="0" allowfullscreen></iframe></p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2011/320-der-traum-eines-datavis-experten/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/vq5WbiU8wPc" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2011/320-der-traum-eines-datavis-experten/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2011/320-der-traum-eines-datavis-experten/</feedburner:origLink></item>
		<item>
		<title>Tableau – mächtiges Desktop-Tool</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/LHI53NaVhTQ/</link>
		<comments>http://www.wangenrot.at/2010/293-tableau/#comments</comments>
		<pubDate>Mon, 20 Sep 2010 13:30:44 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Tools]]></category>
		<category><![CDATA[Bewertung]]></category>
		<category><![CDATA[Evaluierung]]></category>
		<category><![CDATA[Kritik]]></category>
		<category><![CDATA[Review]]></category>
		<category><![CDATA[Tableau Desktop]]></category>

		<guid isPermaLink="false">http://www.wangenrot.at/?p=293</guid>
		<description><![CDATA[Nachdem ich bisher nur mit Tableau Public ein wenig gespielt habe, wollte ich mit möglichst wenig Aufwand einen Dashboard-Prototypen für Reportingdaten erstellen. Die Entscheidung fiel auf Tableau, und hier sind meine Erfahrungen nach einer recht intensiven zweiwöchigen Evaluierung von Tableau Desktop in Kombination mit dem Tableau Server. Mein Fazit: Pro: Sehr mächtig und vor allem [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_303" class="wp-caption alignnone" style="width: 310px"><a href="http://www.tableausoftware.com/products/tour"><img class="size-medium wp-image-303" title="Tableau Screenshot" src="http://www.wangenrot.at/wp-content/uploads/2010/09/tableau-300x205.png" alt="Tableau Screenshot" width="300" height="205" /></a><p class="wp-caption-text">Tableau Screenshot</p></div>
<p>Nachdem ich bisher nur mit <a href="http://www.tableausoftware.com/public/">Tableau Public</a> ein wenig gespielt habe, wollte ich mit möglichst wenig Aufwand einen Dashboard-Prototypen für Reportingdaten erstellen. Die Entscheidung fiel auf Tableau, und hier sind meine Erfahrungen nach einer recht intensiven zweiwöchigen Evaluierung von <a href="http://www.tableausoftware.com/products/desktop">Tableau Desktop</a> in Kombination mit dem <a href="http://www.tableausoftware.com/products/server">Tableau Server</a>. Mein Fazit:</p>
<ul>
<li>Pro: Sehr mächtig und vor allem eine sehr intuitive Benutzeroberfläche</li>
<li>Con: Grenzen bei der Automatisierung bzw. Integration</li>
</ul>
<h3>Was kann Tableau?</h3>
<p><em>Tableau Desktop</em> kann aus verschiedenen Datenquellen lesen, diese nach Bedarf transformieren, also z.B. aggregieren, und die ausgewählte Datensicht in dafür geeigneten Charttypen darstellen. Folgende Charttypen werden unterstützt:<br />
<span id="more-293"></span></p>
<ul>
<li>Text Table</li>
<li>Heat Map</li>
<li>Highlight Table</li>
<li>Pie</li>
<li>Aligned Bar</li>
<li>Stacked Bar</li>
<li>Side-by-Side Bar</li>
<li>Bar with Measure on Color</li>
<li>Line (Discrete oder Continuous)</li>
<li>Dual Axis</li>
<li>Gantt</li>
<li>Scatter</li>
<li>Scatter Matrix</li>
<li>Circle</li>
<li>Histogram</li>
<li>Map</li>
<li>Bullet Graph</li>
</ul>
<p>Wie man sieht, fehlen Visualisierungsmethoden für Netzwerke und Graphen vollständig.</p>
<p>Die entstandenen Charts können einzeln oder zu einer Ansicht kombiniert (= Dashboards) auf verschiedene Weise dem Publikum zugänglich gemacht werden:</p>
<ul>
<li>Als <em>Tableau Workbook</em> kann man sie mit dem kostenlosen Tableau Reader auf jedem Windows System öffnen und anschauen.</li>
<li>Die Charts können als PDF oder Bild als statische Version exportiert werden.</li>
<li>Die Charts können auf einen eigenen Tableau Server (oder auf den Tableau Public Server) hochgeladen werden. Dort können sie entweder mit dem mitgelieferten Webinterface angeschaut werden oder auch per Url in die eigene Anwendung eingebettet werden. Die verwendete Technologie scheint eine ausgeklügelte Kombination aus Flash und Javascript zu sein, ein Kompromiss aus Interaktivität und Performance bzw. Ladezeit. Bei mir liefen die Webversionen erstaunlich flüssig mit einem nur geringen Nerv-Faktor.</li>
</ul>
<p>Dabei rangiert die Desktop Version zwischen $1000 und $1800. Die Gratisvariante ist seit Anfang 2010 <em>Tableau Public</em>. Es hat im Kern den identischen Funktionsumfang, unterscheidet sich aber darin, dass die Charts und die dafür benötigten Daten nur online im Tableau Public Server gespeichert werden können &#8211; für interne Daten also nicht geeignet. Außerdem kann es nicht aus Datenbanken auslesen, sondern akzeptiert nur CSV und Excel.</p>
<h3>Für welche Daten ist Tableau geeignet?</h3>
<p>Zuerst einmal ganz simpel eine einfache Tabelle im CSV oder Excel (.xls) Format. Auch verknüpfte Tabellen können als .xls verarbeitet werden, wenn jede Tabelle auf einem eigenen Tabellenblatt steht. Weiters kann Tableau Daten direkt aus einer Vielzahl von Datenbanken auslesen. Dabei können bestehende Tabellenverknüpfungen angegeben werden, die Tableau direkt übernimmt. So kann das eigene Datenmodell 1:1 für Mappings verwendet werden, ohne dass zuerst eine Denormalisierung (= eine SQL Abfrage, die das gewünschte Subset in einer einzigen Tabelle zusammenfasst) nötig wäre. Tableau unterstützt auch <strong>Live-Data</strong>, d.h. Änderungen in der Datenbank werden bei jedem Reload der Datenquelle bzw. der Webseite reflektiert. Leider muss die Datenbank auf dem selben Rechner wie Tableau Server sein, bzw. im gleichen Netzwerk. <strong>Denn mit einem Webservice kann sich die Software nicht verbinden.</strong></p>
<p><strong>Geodaten</strong>, also Postleitzahlen, Länderkennungen, State/Province und Regions (USA) werden problemlos erkannt und auf einer Karte angezeigt.</p>
<p>Granulare Daten werden nach Bedarf aggregiert. Habe ich zum Beispiel Kunden- und Produktdaten auf der granularen Ebene von einzelnen Bestellungen, so kann ich mir meistverkaufte Produkte pro Kunde oder pro Monat anzeigen lassen, wobei Tableau die Datentransformationen vollkommen transparent im Hintergrund macht. Das ist natürlich sehr praktisch. Allerdings kann Tableau nicht auf ein System aufsetzen, dass die Daten bereits transformiert liefert, denn es kann pro Chart nur eine Datenquelle angegeben werden.</p>
<p><strong>Auch eine API fehlt.</strong> Die Charts müssen mit der Desktop-Version zusammengeklickt und abgespeichert werden. Dynamische Anpassungen an sich ändernde Daten, z.B. wechselnde Mappings, sind nicht möglich.</p>
<h3>Wie benutzt man es?</h3>
<p>Nach der Installation (Windows only!) muss man zuerst die Datenquelle auswählen. Gegebenenfalls müssen noch Tabellenverknüpfungen angegeben werden. Sind die Daten geladen, werden die Felder und ihre Einheiten/Typen in einer Liste angezeigt. Tableau versucht den Datentyp zu erraten (nominal, numerisch, Währung, Datum, Geodatum, etc.). Evtl. muss man da noch nachhelfen. Dann wählt man einige Felder aus und zieht sie auf die Chartfläche. Über den &#8220;Show me&#8221; Button kann jetzt ein passender, also schlüssiger Charttyp ausgewählt werden. Danach kommt das Feintuning: weitere Felder anzeigen lassen, das Mapping anpassen (z.B. statt über Balkenlänge über Balkenfarbe anzeigen), Filter erstellen, Beschriftung anpassen, Titel oder Tooltips erstellen. So kommt man sehr schnell zu Ergebnissen. Die Frage ist nur, ob das die Ergebnisse sind, die man haben wollte. Es braucht natürlich einige Übung, um genau die Ansicht zu bekommen, die man haben wollte. Teilweise sind wichtige Features, wie die Dual Axis, in einer speziellen Drag&amp;Drop Aktion versteckt und können über das Menü nicht angesteuert werden.</p>
<p>Zum Schluss können die Charts zu einem Dashboard zusammen gestellt werden. Die Gestaltungsmöglichkeiten sind sehr gering: Schriftart und -größe, Hintergrundfarbe, das war&#8217;s auch fast schon. Das Dashboard oder einzelne Charts werden abgespeichert bzw. Server hochgeladen.</p>
<h3>Besondere Features?</h3>
<p>Die Charts bieten interessante Interaktionsmöglichkeiten über <strong>Filter</strong> an. Zum Beispiel für numerische Werte Rangefilter, für kategorische Werte Mehrfachauswahl, für Zeitangaben Granularität: pro Jahr, pro Monat, pro Tag oder auch pro Sekunde. Möchte ich dem Webuser allerdings die Möglichkeit geben, zwischen einer Ansicht  &#8220;meistverkaufte Produkte pro Monat&#8221; und &#8220;umsatzstärkste Produkte pro  Monat&#8221; zu wechseln, kann das nicht mehr über einen Filter gelöst werden, da hier das Mapping dynamisch gewechselt werden müsste.</p>
<p>Es gibt übrigens umfangreiche Online-Ressourcen, Dokus und Videos im Tableau <a href="http://www.tableausoftware.com/learning">Learning Center</a>. Und einmal im Jahr eine große Anwenderkonferenz in Seattle, die sehr beliebt ist.</p>
<h3>Fazit</h3>
<p>Es hat großen Spaß gemacht mit dem Tool zu arbeiten. Es bietet sich vor allem an, um einen ersten Überblick über eine Datenmenge zu bekommen und erste Visualisierungsmöglichkeiten zu erörtern. Auch für den schnellen Chart zwischendurch, für Präsentationen, für&#8217;s Blog und für den internen Gebrauch ist es sehr gut geeignet. Spezielle Sonderwünsche, Design in der eigenen CI und allzu dynamische Anforderungen ist Tableau allerdings (noch) nicht gewachsen. Trotzdem ist es momentan das mächtigste Visualisierungstool, das auf dem Markt ist.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2010/293-tableau/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/LHI53NaVhTQ" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2010/293-tableau/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2010/293-tableau/</feedburner:origLink></item>
		<item>
		<title>IV10 in London &amp; mein Paper</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/Wa5QD9w6N9s/</link>
		<comments>http://www.wangenrot.at/2010/268-iv10-london-mein-paper/#comments</comments>
		<pubDate>Thu, 16 Sep 2010 14:49:27 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[News]]></category>
		<category><![CDATA[Tools]]></category>

		<guid isPermaLink="false">http://www.wangenrot.at/?p=268</guid>
		<description><![CDATA[[portfolio_slideshow timeout=4000] Ende Juli war ich auf der IV10, der großen Infovis Konferenz, die dieses Jahr in London stattfand. Dort habe ich mit einer Präsentation mein Paper vorgestellt: A Theme Landscape for Tagged Data. Damit ist dieses wissenschaftliche Werk aus meiner Zeit am Boltzmann Institut für Medien.Kunst.Forschung jetzt endlich offiziell publiziert! Auf Anfrage schicke ich [...]]]></description>
			<content:encoded><![CDATA[<p><br style="clear:left;"><br />
[portfolio_slideshow timeout=4000]<br />
Ende Juli war ich auf der IV10, der großen Infovis Konferenz, die dieses Jahr in London stattfand.<br />
Dort habe ich mit einer Präsentation mein Paper vorgestellt: <a href="http://www.computer.org/portal/web/csdl/doi/10.1109/IV.2010.29">A Theme Landscape for Tagged Data</a>. Damit ist dieses wissenschaftliche Werk aus meiner Zeit am <a href="http://media.lbg.ac.at/de/index.php">Boltzmann Institut für Medien.Kunst.Forschung</a> jetzt endlich offiziell publiziert!</p>
<p>Auf Anfrage schicke ich das Paper gerne per Mail zu.</p>
<p>In den 3 Tagen der Konferenz gab es natürlich eine Menge interessanter Präsentationen von Infovis Wissenschaftlern aus der ganzen Welt. Besonders gefallen hat mir die Keynote von Mikael Jern, in der er den <a href="http://ncva.itn.liu.se/explorer?l=en">eXplorer for advanced Statistical Visualization</a> vorstellte. Dieses Tools bietet ein Dashboard für geografisch-statistische Daten und beeindruckt durch seinen ausgereiften Funktionsumfang und die benutzerfreundliche Oberfläche. Auch gibt es verschiedene Versionen online, z.B. der <a href="http://vitagate.itn.liu.se/GAV/eXplorer/OECDFactbook/">OECD Factbook eXplorer</a> mit 256 bereits vorgeladenen zeitbasierten Indikatoren für OECD Länder. Das muss ich mir noch mal genauer anschauen!</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2010/268-iv10-london-mein-paper/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/Wa5QD9w6N9s" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2010/268-iv10-london-mein-paper/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2010/268-iv10-london-mein-paper/</feedburner:origLink></item>
		<item>
		<title>A Theme Landscape for Tagged Data</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/h4ZMhFniuYI/</link>
		<comments>http://www.wangenrot.at/2010/254-theme-landscape/#comments</comments>
		<pubDate>Sun, 25 Jul 2010 12:25:36 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Referenzen]]></category>
		<category><![CDATA[Flash]]></category>
		<category><![CDATA[Icons]]></category>
		<category><![CDATA[Media Art]]></category>
		<category><![CDATA[Tagged Data]]></category>

		<guid isPermaLink="false">http://www.wangenrot.at/?p=254</guid>
		<description><![CDATA[Mein wichtigstes &#38; liebstes Projekt in meiner Zeit am Ludwig Boltzmann Institut Media.Art.Research war die Theme Landscape. Es ist ein Tool zur Visualisierung von getaggten Daten. Für den Prototypen haben wir Daten vom Prix Ars Electronica verwendet. Man kann damit Werke der Interaktiven Kunst entdecken und Zusammenhänge erkennen. Die Werke wurden anhand ihrer relativen Ähnlichkeit [...]]]></description>
			<content:encoded><![CDATA[<p><br style="clear:left;"></p>
<div id="attachment_260" class="wp-caption alignnone" style="width: 500px"><a href="http://www.wangenrot.at/wp-content/uploads/2010/07/tl_project2.png"><img class="size-full wp-image-260" title="Theme Landscape" src="http://www.wangenrot.at/wp-content/uploads/2010/07/tl_project2.png" alt="A Theme Landscape for Tagged Data" width="490" height="229" /></a><p class="wp-caption-text">A Theme Landscape for Tagged Data</p></div>
<p>Mein wichtigstes &amp; liebstes Projekt in meiner Zeit am <a href="http://media.lbg.ac.at/en/index.php">Ludwig Boltzmann Institut Media.Art.Research</a> war die <a href="http://vis.mediaartresearch.at/webarchive/public/view/mid:8">Theme Landscape</a>.</p>
<p>Es ist ein Tool zur Visualisierung von getaggten Daten. Für den Prototypen haben wir Daten vom Prix Ars Electronica verwendet. Man kann damit Werke der Interaktiven Kunst entdecken und Zusammenhänge erkennen. Die Werke wurden anhand ihrer relativen Ähnlichkeit in eine Landschaft platziert &#8211; umso ähnlicher zwei Werke sind, umso näher liegen sie beieinander. Zusätzlich zeigen die Icons  die Tags der Werke.</p>
<p>Das Tool ist online im <a href="http://vis.mediaartresearch.at/webarchive/public/view/mid:8">Visualization Showcase</a> des Instituts, dort gibt es auch noch mehr Infos.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2010/254-theme-landscape/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/h4ZMhFniuYI" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2010/254-theme-landscape/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2010/254-theme-landscape/</feedburner:origLink></item>
		<item>
		<title>Spannender Daten-Krimi</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/57gTJvsc530/</link>
		<comments>http://www.wangenrot.at/2010/229-datenkrimi/#comments</comments>
		<pubDate>Thu, 15 Jul 2010 07:56:33 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Beispiele]]></category>
		<category><![CDATA[Bubbles]]></category>
		<category><![CDATA[Data Stories]]></category>
		<category><![CDATA[Public Data]]></category>
		<category><![CDATA[video]]></category>

		<guid isPermaLink="false">http://www.wangenrot.at/?p=229</guid>
		<description><![CDATA[Hans Rosling gibt in seinem TED talk von 2006 über Weltgesundheit und Demographie einen spannenden Einblick, wie beeindruckend informativ Datenvisualisierung sein kann. Er zeigt anhand von öffentlich zugänglichen Datensätzen, dass die Welt sich seit 1963 stark verändert hat und es nicht mehr &#8220;die 3. Welt&#8221; gibt, die leider immer noch in unseren Köpfen existiert. Dieses [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_230" class="wp-caption alignnone" style="width: 421px"><a href="http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html"><img class="size-full wp-image-230 " title="hans_rosling_stats" src="http://www.wangenrot.at/wp-content/uploads/2010/07/hans_rosling_stats.png" alt="Hans Rosling shows the best stats you've ever seen" width="411" height="317" /></a><p class="wp-caption-text">Hans Rosling shows the best stats you&#39;ve ever seen</p></div>
<p>Hans Rosling gibt in seinem <a href="http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html">TED talk von 2006</a> über Weltgesundheit und Demographie einen spannenden Einblick, wie beeindruckend informativ Datenvisualisierung sein kann. Er zeigt anhand von öffentlich zugänglichen Datensätzen, dass die Welt sich seit 1963 stark verändert hat und es nicht mehr &#8220;die 3. Welt&#8221; gibt, die leider immer noch in unseren Köpfen existiert. Dieses 30 min Video (auf englisch) wird diese Sichtweise verändern. Garantiert. <span id="more-229"></span></p>
<p>Hier ist auch noch ein aktueller <a href="http://www.ted.com/talks/hans_rosling_on_global_population_growth.html">TED talk</a> aus dem Jahr 2010 von ihm, diesmal ganz undigital mit mit analogen Objekten visualisiert. Sehr schön!</p>
<div id="attachment_239" class="wp-caption alignleft" style="width: 360px"><a href="http://www.gapminder.org/"><img class="size-full wp-image-239" title="gapminder" src="http://www.wangenrot.at/wp-content/uploads/2010/07/gapminder.png" alt="Gapminder Visu Tool" width="350" height="250" /></a><p class="wp-caption-text">Gapminder Visu Tool</p></div>
<p>Und <a href="http://www.gapminder.org/">Gapminder</a> ist das Visu-Tool, das Hans Rosling in seinem TED talk vorstellt.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2010/229-datenkrimi/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/57gTJvsc530" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2010/229-datenkrimi/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2010/229-datenkrimi/</feedburner:origLink></item>
		<item>
		<title>Visual Data Mining</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/sTHfn5icaz0/</link>
		<comments>http://www.wangenrot.at/2010/28-visual-data-mining/#comments</comments>
		<pubDate>Tue, 06 Jul 2010 12:23:43 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Lexikon]]></category>

		<guid isPermaLink="false">http://www.rezeptemaschine.de/salzmonster/?p=28</guid>
		<description><![CDATA[Using naked numbers to tell stories might just be the first great art form of the 21st Century. (aus: londonist.com) Was ist Visual Data Mining? Visual Data Mining ist Data Mining mit Hilfe von Bildern. Es sind Bilder, die komplexe Daten darstellen und von einem Menschen gelesen werden können. Sie enstehen unter Verwendung von Methoden [...]]]></description>
			<content:encoded><![CDATA[<blockquote><p>Using naked numbers to tell stories might just be the first great art  form of the 21st Century. (aus: <a href="http://londonist.com/2010/07/tfl_tube_data_feed_fails_due_to_ove.php">londonist.com</a>)</p></blockquote>
<p><strong>Was ist Visual Data Mining?</strong></p>
<p>Visual Data Mining ist Data Mining mit Hilfe von Bildern. Es sind Bilder, die komplexe Daten darstellen und von einem Menschen gelesen werden können. Sie enstehen unter Verwendung von Methoden der Informationsvisualisierung.<br />
Visual Data Mining kombiniert die visuellen Fähigkeiten des Menschen mit den analytischen der Technik.</p>
<div id="attachment_215" class="wp-caption alignleft" style="width: 610px"><a href="http://vis.mediaartresearch.at/webarchive/public/view/mid:44"><img class="size-full wp-image-215" title="visual_data_mining" src="http://www.wangenrot.at/wp-content/uploads/2009/01/visual_data_mining.jpg" alt="visual_data_mining" width="600" height="240" /></a><p class="wp-caption-text">Verschiedene Visualisierungsmethoden aus &quot;Mapping  the Archive&quot;</p></div>
<p>Die Ergebnisse eines Data Mining Prozesses werden von klassischen Data Mining Tools visuell dargestellt. Insofern ist Visual Data Mining vielleicht grundsätzlich nichts Neues, jedoch werden hier Potentiale nicht ausgeschöpft.</p>
<p>Oft ist anfangs nur sehr wenig über die Daten bekannt. Wie viele  Datensätze gibt es? Wie viele unterschiedliche Informationsobjekte, wie  hängen sie zusammen? Welche Attribute gibt es? Sind die Daten  vollständig und konsistent? Die Ziele der Datenexploration können daher eventuell nicht genau spezifiziert werden.</p>
<p>Durch Visualisierung der Ausgangsdaten kann ein erster Überblick  geschaffen werden. Daraus ergeben sich erste Fragestellungen, und ein  passendes Data Mining Modell kann abgeleitet und auf die Daten  angewendet werden. Auch die Visualisierung der Zwischenschritte hilft dem Benutzer zu erkennen, ob er sich auf dem richtigen Weg befindet.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2010/28-visual-data-mining/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/sTHfn5icaz0" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2010/28-visual-data-mining/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2010/28-visual-data-mining/</feedburner:origLink></item>
		<item>
		<title>Kategorisierung von Datenstrukturen</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/rQn30NeHFN4/</link>
		<comments>http://www.wangenrot.at/2009/82-kategorisierung-von-datenstrukturen/#comments</comments>
		<pubDate>Mon, 08 Jun 2009 08:50:27 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Daten]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[Datenstrukturen]]></category>
		<category><![CDATA[Evaluierung]]></category>
		<category><![CDATA[Kategorisierung]]></category>

		<guid isPermaLink="false">http://www.rezeptemaschine.de/salzmonster/?p=82</guid>
		<description><![CDATA[Zu beurteilen, ob eine Visualisierungsmethode auf die vorliegenden Daten sinnvoll anwendbar ist, ist oft nicht einfach. Man muss wissen, für welche Datenstrukturen die Methode geeignet ist, und dann die eigenen Daten daraufhin prüfen oder evaluieren. Bisher habe ich aber keinerlei umfassende Kategorisierung von Datenstrukturen gefunden. Und auch die Autoren von Vis-Methoden gehen kaum auf die [...]]]></description>
			<content:encoded><![CDATA[<p>Zu beurteilen, ob eine Visualisierungsmethode auf die vorliegenden Daten sinnvoll anwendbar ist, ist oft nicht einfach. Man muss wissen, für welche Datenstrukturen die Methode geeignet ist, und dann die eigenen Daten daraufhin prüfen oder evaluieren. Bisher habe ich aber keinerlei umfassende Kategorisierung von Datenstrukturen gefunden. Und auch die Autoren von Vis-Methoden gehen kaum auf die Voraussetzungen ein, um die Methode anzuwenden. Und schließlich fehlen Tools, die Daten (typischerweise in Datenbanken) auf ihre Struktur untersuchen. <span id="more-82"></span></p>
<p>Was könnten die Parameter sein:</p>
<ul>
<li>Anzahl verschiedener Objekttypen (Kunstwerk, Autor, Essay)</li>
<li>Art der Verknüpfung dieser Objekte (n:n, &#8230;)</li>
<li>Anzahl der Dimensionen pro Objekttyp (univariate, multivariate, &#8230;)</li>
<li>Typ der Dimensionen (quantitativ, qualitativ, ordinal, kategorisch, &#8230;)</li>
<li>Struktur der Dimensionen: (Temporal, linear, geografisch, Text, hierarchisch, Netzwerk, &#8230;)</li>
<li>Haben mehrere Dimensionen den selben Typ oder Struktur (z.B. bei mehrfach getaggten Objekten)</li>
<li>Wertebereich der Dimensionen</li>
<li>Verteilung der Werte</li>
<li>Verwendeter Schlagwortkatalog: ebenfalls Wertebereich und Verteilung</li>
<li>&#8230; was noch?</li>
</ul>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2009/82-kategorisierung-von-datenstrukturen/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/rQn30NeHFN4" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2009/82-kategorisierung-von-datenstrukturen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2009/82-kategorisierung-von-datenstrukturen/</feedburner:origLink></item>
		<item>
		<title>Kohonen Map</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/xn_cIFDQr7Y/</link>
		<comments>http://www.wangenrot.at/2009/74-kohonen-map/#comments</comments>
		<pubDate>Mon, 04 May 2009 12:35:29 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Methoden]]></category>
		<category><![CDATA[Visualisierung]]></category>
		<category><![CDATA[MDS]]></category>
		<category><![CDATA[multivariat]]></category>
		<category><![CDATA[SOM]]></category>

		<guid isPermaLink="false">http://www.rezeptemaschine.de/salzmonster/?p=74</guid>
		<description><![CDATA[Kohonen Map, auch SOM (Self Organizing Map). Neben MDS eine weitere Möglichkeit, multivariate (multidimensionale) Daten auf zwei Dimensionen abzubilden. Also prima geeignet für die Visualisierung von quantitativen als auch von qualitativen Daten. Dabei wird ein neuronales Netzwerk in der Lernphase in vielen Durchgängen trainiert, die neuen Datensätze bestehenden Koordinaten (genauer: Vektoren) in einem Raster zuzuordnen. [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.wangenrot.at/wp-content/uploads/2009/05/kohsom-30x30-colored.jpg"><img class="alignleft size-medium wp-image-184" title="Kohonen  Self-organized Map" src="http://www.wangenrot.at/wp-content/uploads/2009/05/kohsom-30x30-colored-300x300.jpg" alt="" width="300" height="300" /></a>Kohonen Map, auch SOM (Self Organizing Map). Neben MDS eine weitere Möglichkeit, multivariate (multidimensionale) Daten auf zwei Dimensionen abzubilden. Also prima geeignet für die Visualisierung von quantitativen als auch von qualitativen Daten. Dabei wird ein neuronales Netzwerk in der Lernphase in vielen Durchgängen trainiert, die neuen Datensätze bestehenden Koordinaten (genauer: Vektoren) in einem Raster zuzuordnen. Dabei wird die Ähnlichkeit der Gewichtungen zwischen Datensatz und Vektor verglichen, und die Vektoren auch noch angepasst.</p>
<p>Interessant ist, dass mit der Kohonen Map auch Cluster gebildet werden können. Mir ist nur nicht klar, ob das Cluster über alle Dimensionen sind, oder man dafür eine Dimension auswählen muss.</p>
<p><strong>Kritik</strong>: Der Kohonen Algorithmus basiert stark auf der Anpassung der Parameter in unmittelbarer Umgebung und verliert schnell das große Ganze aus dem Blick.</p>
<p><strong>Beispiele</strong>: <a href="http://www.generation5.org/jdk/screenshots.asp">generation5 JDK</a>, <a href="http://netzspannung.org/about/tools/semantic-map/">netzspannung.org &#8211; Semantic Map</a>, <a href="http://www.ai.rug.nl/~lambert/allographic-fraglet-codebooks/allographic-fraglet-codebooks.html">Allographic fraglet codebooks for writer identification</a></p>
<p><strong>Quellen</strong>: <a href="http://www.fizyka.umk.pl/publications/kmk/96-som-mds.pdf">On global self-organizing maps</a></p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2009/74-kohonen-map/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/xn_cIFDQr7Y" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2009/74-kohonen-map/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2009/74-kohonen-map/</feedburner:origLink></item>
		<item>
		<title>Exploration vs. Representation</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/y5ClaSxmL_4/</link>
		<comments>http://www.wangenrot.at/2009/70-exploration-vs-representation/#comments</comments>
		<pubDate>Wed, 29 Apr 2009 09:26:05 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Lexikon]]></category>

		<guid isPermaLink="false">http://www.rezeptemaschine.de/salzmonster/?p=70</guid>
		<description><![CDATA[Exploration, Erkundung, Erforschung von Datensätzen ist meist ergebnisoffen und erfordert eine interaktive Vorgehensweise. Der Analyst braucht Vorkenntnisse in Datenanalyse, und muss lernen die komplexe Software zu bedienen und die Visualisierung richtig zu deuten. Verwandte Begriffe sind: Exploratory data analysis, Visual Exploration. Das Gegenteil ist representational visualization, auch illustrative visualization oder Infografiken, da geht es darum [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Exploration, Erkundung, Erforschung von Datensätzen</strong> ist meist ergebnisoffen und erfordert eine interaktive Vorgehensweise. Der Analyst braucht Vorkenntnisse in Datenanalyse, und muss lernen die komplexe Software zu bedienen und die Visualisierung richtig zu deuten. Verwandte Begriffe sind: <a href="http://en.wikipedia.org/wiki/Exploratory_data_analysis" target="_blank">Exploratory data analysis</a>, <a href="http://www.infovis-wiki.net/index.php/Visual_Exploration">Visual Exploration</a>.</p>
<p><strong>Das Gegenteil ist representational visualization</strong>, auch illustrative visualization oder Infografiken, da geht es darum eine These zu veranschaulichen, oft verwendet in Präsentationen oder in Zeitschriften und Artikeln.</p>
<p>Bei den meisten Informationsvisualisierungen auf <a href="http://www.visualcomplexity.com/vc/">visualcomplexity</a> handelt es sich eher um explorative Visualisierungen bzw. Interfaces, wobei es hier eher um eine Tendenz als um eine kategorische Trennung geht.</p>
<p>Todo: Beispiele von Methoden &#038; Tools.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2009/70-exploration-vs-representation/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/y5ClaSxmL_4" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2009/70-exploration-vs-representation/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2009/70-exploration-vs-representation/</feedburner:origLink></item>
		<item>
		<title>Extract, Transform, Load (ETL)</title>
		<link>http://feedproxy.google.com/~r/wangenrot/~3/F_rdExIzeAc/</link>
		<comments>http://www.wangenrot.at/2009/67-etl/#comments</comments>
		<pubDate>Mon, 27 Apr 2009 09:03:41 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Daten]]></category>
		<category><![CDATA[Lexikon]]></category>

		<guid isPermaLink="false">http://www.rezeptemaschine.de/salzmonster/?p=67</guid>
		<description><![CDATA[Extract, Transform, Load (ETL) bezeichnet in der Informatik einen Prozess, um Daten aus mehreren Datenquellen mit ggf. unterschiedlichen Strukturen in einer Zieldatenbank zu vereinigen. Dieser Vorgang wird in drei Schritten vollzogen, aus denen sich die Bezeichnung ETL ableitet: Extraktion (Extract) der relevanten Daten aus verschiedenen Quellen Transformation (Transform) der Daten in das Schema und Format [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_204" class="wp-caption alignleft" style="width: 558px"><a href="http://de.talend.com/index.php"><img class="size-full wp-image-204" title="Talend" src="http://www.wangenrot.at/wp-content/uploads/2009/04/talend.png" alt="" width="548" height="223" /></a><p class="wp-caption-text">Aus einem Tutorial auf talend.com</p></div>
<p><strong>Extract, Transform, Load</strong> (<strong>ETL</strong>) bezeichnet in der Informatik einen Prozess, um Daten aus mehreren Datenquellen mit ggf. unterschiedlichen Strukturen in einer Zieldatenbank zu vereinigen. Dieser Vorgang wird in drei Schritten vollzogen, aus denen sich die Bezeichnung ETL ableitet:</p>
<ol>
<li><strong>Extraktion</strong> (Extract) der relevanten Daten aus verschiedenen Quellen</li>
<li><strong>Transformation</strong> (Transform) der Daten in das Schema und Format der Zieldatenbank</li>
<li><strong>Laden</strong> (Load) der Daten in die Zieldatenbank</li>
</ol>
<p>[Quelle: <a href="http://de.wikipedia.org/wiki/ETL-Prozess">Wikipedia</a>]</p>
<p>Und bevor du nun anfängst, selbst ein ETL-Skript zu schreiben: es gibt da ein Open Source Tool. <a href="http://www.talend.com/">Talend</a> bietet ein Klick-mich Wysiwyg-Interface und Unterstützung für so ziemlich alle Datenbanksysteme.</p>
<div align="right" style="float: right; clear:left; padding: 5px 0px 0px 5px;"><a name="fb_share" type="box_count" share_url="http://www.wangenrot.at/2009/67-etl/"></a></div><img src="http://feeds.feedburner.com/~r/wangenrot/~4/F_rdExIzeAc" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.wangenrot.at/2009/67-etl/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.wangenrot.at/2009/67-etl/</feedburner:origLink></item>
	</channel>
</rss>

