<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<channel>
	<title>wana</title>
	
	<link>http://wana.dk</link>
	<description>: social netværksanalyse : Samfundsvidenskab : Methodologi : Organisationsudvikling : Innovation : Ledelse</description>
	<pubDate>Tue, 12 Jan 2010 19:57:15 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6</generator>
	<language>en</language>
			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/Wana" /><feedburner:info uri="wana" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><item>
		<title>Sygehusvæsenet der kunne være bedre</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/T-LO8xLjSis/</link>
		<comments>http://wana.dk/2010/01/12/376/#comments</comments>
		<pubDate>Tue, 12 Jan 2010 19:56:43 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Generel samfundsvidenskab]]></category>

		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[graf]]></category>

		<category><![CDATA[offentlige udgifter]]></category>

		<category><![CDATA[sygehus]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=376</guid>
		<description><![CDATA[Jeg elsker når folk deler deres arbejde: Fornyligt diskuterede Gelman en graf af sammenhængen mellem et lands udgifter til sygehusvæsenet1. Det fik så en vis Frank Hansen til at lægge sin egen lille analyse frem. Jeg har så pudset grafen lidt af, og fremhævet danmark:

Det gik lidt hurtigt med at lave grafen, så jeg fik [...]]]></description>
			<content:encoded><![CDATA[<p>Jeg elsker når folk deler deres arbejde: Fornyligt diskuterede Gelman en graf af sammenhængen <a href="http://www.fivethirtyeight.com/2010/01/healthcare-spending-and-life-expectancy.html">mellem et lands udgifter til sygehusvæsenet</a><sup>1</sup>. Det fik så en vis Frank Hansen til at lægge sin <a href="http://docs.google.com/View?id=dgzd4rk_256cx9zjg2j">egen lille analyse frem</a>. Jeg har så pudset grafen lidt af, og fremhævet danmark:</p>
<p><a href="http://wana.dk/wp-content/uploads/2010/01/dk_health.png"><img class="alignnone size-medium wp-image-377" title="dk_health" src="http://wana.dk/wp-content/uploads/2010/01/dk_health-300x299.png" alt="" width="300" height="299" /></a></p>
<p>Det gik lidt hurtigt med at lave grafen, så jeg fik ikke ekspliciteret at udgifterne er pr. person pr. år i købekrafts justeret USD.</p>
<p>Konklusion: Vi kan godt gøre det bedre.</p>
<p class="akst_link"><a href="http://wana.dk/?p=376&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_376" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><ol class="footnotes"><li id="footnote_0_376" class="footnote">&#8221;Helthcare&#8221;</li></ol><img src="http://feeds.feedburner.com/~r/Wana/~4/T-LO8xLjSis" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2010/01/12/376/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2010/01/12/376/</feedburner:origLink></item>
		<item>
		<title>BNP prognoser - kan de bruges?</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/_15VIG4iDGs/</link>
		<comments>http://wana.dk/2009/11/06/bnp-prognoser-kan-de-bruges/#comments</comments>
		<pubDate>Fri, 06 Nov 2009 12:58:17 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Generel samfundsvidenskab]]></category>

		<category><![CDATA[bnp]]></category>

		<category><![CDATA[prognose]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=371</guid>
		<description><![CDATA[I mangel af bedre kan BNP prognoser helt sikkert bruges til et eller andet. Men jeg er alligevel overrasket over hvor store ueninghederne kan være. For sjov sammenlignede jeg IMF&#8217;s prognose over for CIA&#8217;s prognoser. Resultatet ses nedenfor1.

Hvis IMF og CIA havde været enige - skulle punkterne (som hver repræsentere et land) være fordelt langs [...]]]></description>
			<content:encoded><![CDATA[<p>I mangel af bedre kan BNP prognoser helt sikkert bruges til et eller andet. Men jeg er alligevel overrasket over hvor store ueninghederne kan være. For sjov sammenlignede jeg IMF&#8217;s prognose over for CIA&#8217;s prognoser. Resultatet ses nedenfor<sup>1</sup>.</p>
<p><a href="http://wana.dk/wp-content/uploads/2009/11/gdp_uenighed.png"><img class="aligncenter size-full wp-image-372" title="gdp_uenighed" src="http://wana.dk/wp-content/uploads/2009/11/gdp_uenighed.png" alt="" width="480" height="480" /></a></p>
<p>Hvis IMF og CIA havde været enige - skulle punkterne (som hver repræsentere et land) være fordelt langs den blå linje. I stedet ser vi at CIA generelt er langt mere optimistisk - særligt for lande som IMF vurdere vil have en negativ vækst<sup>2</sup>.</p>
<p>Herudover er det dog slående hvor store forskelle der er mellem enkeltlande. Nederst til højre er fx en prik (Zimbabwe). IMF vurdere realvæksten til ca 4% - CIA vurdere væksten til ca. -14%. Midt øverst er en anden prik. IMF vurdere real-væksten til ca. 0,5%, mens CIA vurdere realvæksten til ca. 14%. Og så videre.</p>
<p>Fremover er jeg mere forsigtig med at tillægge BNP prognoser nogen som helst værdi.</p>
<p>(ps. kilderne er angivet i figuren: IMF: http://2.ly/QR og CIA: http://2.ly/QS)</p>
<p class="akst_link"><a href="http://wana.dk/?p=371&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_371" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><ol class="footnotes"><li id="footnote_0_371" class="footnote">grafen har engelsk følgetekst - jeg lavede den til tweeter, og har smidt scriptet væk. Så istedet for at lave den igen - må I klarer jer med denne</li><li id="footnote_1_371" class="footnote">Den røde linje er regressionslinien mellem de to prognoser, og den kan tolkes sådan at CIA er langt mere forsigtige, hvertfald diskriminere mindre mellem landende</li></ol><img src="http://feeds.feedburner.com/~r/Wana/~4/_15VIG4iDGs" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/11/06/bnp-prognoser-kan-de-bruges/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/11/06/bnp-prognoser-kan-de-bruges/</feedburner:origLink></item>
		<item>
		<title>Indkomst og donation</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/kTUmTVnd-eM/</link>
		<comments>http://wana.dk/2009/10/31/indkomst-og-donation/#comments</comments>
		<pubDate>Sat, 31 Oct 2009 16:44:26 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Generel samfundsvidenskab]]></category>

		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[bidrag]]></category>

		<category><![CDATA[donation]]></category>

		<category><![CDATA[indkomst]]></category>

		<category><![CDATA[indsamling]]></category>

		<category><![CDATA[kommuner]]></category>

		<category><![CDATA[kræftens bekæmpelse]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=366</guid>
		<description><![CDATA[I Danmark forestår den progressive beskatning en, sammenlignet med andre lande, stor omfordeling af indkomsten. Giver de velbeslåede derudover selv lidt ekstra?
Kræftens Bekæmpelse har lagt indsamlingsresultater ud på internettet. Kombineret med data fra de kommunale nøgletal, kan man undersøge samenhængen mellem indsamlingsresultater og forhold som andel af beboer i bymæssig beboelse, befolkningstæthed, region, skattegrundlag m.m. [...]]]></description>
			<content:encoded><![CDATA[<p>I Danmark forestår den progressive beskatning en, sammenlignet med andre lande, stor omfordeling af indkomsten. Giver de velbeslåede derudover selv lidt ekstra?</p>
<p>Kræftens Bekæmpelse har lagt indsamlingsresultater ud på internettet. Kombineret med data fra de kommunale nøgletal, kan man undersøge samenhængen mellem indsamlingsresultater og forhold som andel af beboer i bymæssig beboelse, befolkningstæthed, region, skattegrundlag m.m. Stort set alt er dog insignifikant. Kort sagt: Folk giver det de giver - sikkert en tyver som ligger lommen.</p>
<div id="attachment_367" class="wp-caption alignnone" style="width: 310px"><a href="http://wana.dk/wp-content/uploads/2009/10/cancer_09.png"><img class="size-medium wp-image-367" title="cancer_09" src="http://wana.dk/wp-content/uploads/2009/10/cancer_09-300x225.png" alt="Klik for større udgave" width="300" height="225" /></a><p class="wp-caption-text">Klik for større udgave</p></div>
<p>For de nysgrerrige: Billedet er det samme (inkl. øboernes generøsitet) i 2008. Data stammer fra kræftens bekæmpelses hjemmeside, og de kommunale nøgletal.</p>
<p class="akst_link"><a href="http://wana.dk/?p=366&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_366" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/kTUmTVnd-eM" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/10/31/indkomst-og-donation/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/10/31/indkomst-og-donation/</feedburner:origLink></item>
		<item>
		<title>Rapportering af gennemsnit</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/Z_qm3XdoL2Q/</link>
		<comments>http://wana.dk/2009/10/29/rapportering-af-gennemsnit/#comments</comments>
		<pubDate>Thu, 29 Oct 2009 15:52:26 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[anscombe]]></category>

		<category><![CDATA[gennemsnit]]></category>

		<category><![CDATA[ideer]]></category>

		<category><![CDATA[perception]]></category>

		<category><![CDATA[rapport]]></category>

		<category><![CDATA[statistik]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=352</guid>
		<description><![CDATA[I min sidste post bragte jeg Anscombe&#8217;s kvartet på banen: Fire meget forskellige grafer - der forskelligeheder til trods, deler samme nøgletal: Gennemsnit, korrelation, varians og lineær regressionskoefficient. Lektien var (og er) at det altid kan betale sig at kigge på data via en graf, og aldrig plot stole på gennemsnit m.m.
Hvad betyder det for [...]]]></description>
			<content:encoded><![CDATA[<p>I min <a href="http://wana.dk/2009/10/28/hvordan-formidler-vi-pr%c3%a6cist-og-brugbart-data/">sidste post</a> bragte jeg Anscombe&#8217;s kvartet på banen: Fire meget forskellige grafer - der forskelligeheder til trods, deler samme nøgletal: Gennemsnit, korrelation, varians og lineær regressionskoefficient. Lektien var (og er) at det altid kan betale sig at kigge på data via en graf, og aldrig plot stole på gennemsnit m.m.</p>
<p>Hvad betyder det for de grafer der bruges ude for snævre statistiske cirkler - fx i erhvervslivet? Er den nuværende praksis, hvor excel ofte har sat standarden, optimal? Hvis du har ideer, så skriv dem endelig i kommentarfeltet nedenfor.</p>
<p>Foreløbig har jeg bemærket at de fleste kunder jeg har arbejdet for (ofte forskellige organisatoriske spørgeskemaer), ønsker resultater vist som søjler, hvor søjlerne angiver gennemsnitsværdi.</p>
<p>Argumentet for at fortsætte denne praksis er, at søjlediagrammer er velkendte, og derfor nemme at fortolke (At feinschmeikkre krymper tær når punktnedslag, så som gennemsnit, formidles med en søjle - lader jeg ligge for nu)<sup>1</sup>. På den anden side vister Anscomb&#8217;s eksempel også, at gennemsnit er en dårlig måde at beskrive en fordeling.</p>
<p>I mod søjlediagrammer taler også, at de har et meget lav data-blæk ratio. Dvs. der bruges meget blæk på at beskrive meget lidt data. Så hvorfor - og særligt i disse miljøsympatiske tider - printe en hel søjle, når man blot kan printe en lille prik for den værdi man er interesseret i?</p>
<p><a href="http://wana.dk/wp-content/uploads/2009/10/data_ink_ratio.png"><img class="size-full wp-image-358 alignleft" title="data_ink_ratio" src="http://wana.dk/wp-content/uploads/2009/10/data_ink_ratio.png" alt="" width="173" height="173" /></a></p>
<p>Alt i alt synes jeg der må være god grund til at personalechefer, HR-ansvarlige og andre ledere, overvejer at finde måder at visualisere fx, medarbejdertilfredshed på. Nedenfor er fire forskellige måder at angribe visualiseringen på.</p>
<p>Det er meningen at eksemplet illustrere en virksomhed på ca. 100 ansatte i 8 forskellige kontorer. Graferne nedenfor viser det gennemsnitlige tilfredshedsniveau i hvert kontor.</p>
<p>Øverst til venstre er et almindeligt søjlediagram med de problemer jeg lige har beskrevet. Øverst til højre er de faktiske værdier for hver ansat i hvert kontor, tilføjet søjlediagrammet. Herved fås et klart udtryk for at gennemsnittet i de fleste tilfælde dækker over meget store forskelle blandt medarbejderne. Nederst til venstre er søjle diagrammet skiftet ud med et traditionelt boxplot. Mange kan ikke lide boxplots&#8217; tilsyneladende kompleksitet<sup>2</sup>. Men boxplots (eller box and whisker plots) er faktisk simple. Boksen udgør det område hvor 50 procent af data befinder sig. Stregen inden i boksen angiver medianen. De tynde pinde (whiskers) strækker sig ud til mindste og største værdie i data, <em>med mindre</em> disse værdier er outliers<sup>3</sup>. Hvis der er outliers vises disse som individuelle datapunkter.</p>
<p>Det fremgår tydeligt af boxplottet, at i kontor &#8220;e&#8221; er medarbejderne generelt lige tilfredse, men en enkelt medarbejder er markant mere tilfreds end de andre. I kontor &#8220;c&#8221; derimod er der to medarbejdere som er markant mindre tilfredse end kollegerne. Denne indsigt fremgår ikke af det almindelige søjlediagram. Det fremgår også, at selv om kontor &#8220;c&#8221; og &#8220;d&#8221; næsten har samme gennemsnits scorer - er der alligevel tale om meget forskellige kontorer. I kontor &#8220;d&#8221; er der således generelt meget store forskelle i medarbejdernes trivsel. Vil en personalechef finde det relevant at tage disse forskelle i betragtning når der gennemføres udviklingstiltag i organisationen? Hvis &#8220;ja&#8221;, så er et almindeligt søjlediagram ikke godt nok.</p>
<p>Endelig, nederst til højre, er et dekadent blækorgie, basseret på søjlediagram, med individuelle værdier for hver ansat, tilføjet et baggrundstapet med fortolkningshjælp. Værdier i det røde felt er uacceptabel, værdier i det orange felt er skidt, værdier i det hvide felt er målsætningen, og værdier i det grønne felt er over målsætning.</p>
<p><a href="http://wana.dk/wp-content/uploads/2009/10/infor_quartet.png"><img class="alignnone size-medium wp-image-360" title="infor_quartet" src="http://wana.dk/wp-content/uploads/2009/10/infor_quartet-300x225.png" alt="" width="300" height="225" /></a></p>
<p>En femte fremgangsmåde kunne være et såkaldt beanplot. Beanplottet viser både individuelle datapunkter, gennemsnit på tværs af alle kategorier, median og en distribution af data. I princippet er et beanplot derfor boxplottet overlegent. Men - efter min vurderin - kun ved store datasæt. I organisationsanalser hvor der næsten altid vil være mellem 10 og 20 ansatte i et kontor - højst 30, er boxplottet bedre. Beanplot nedenfor.</p>
<p><a href="http://wana.dk/wp-content/uploads/2009/10/beanplot1.png"><img class="alignnone size-medium wp-image-362" title="beanplot1" src="http://wana.dk/wp-content/uploads/2009/10/beanplot1-300x225.png" alt="" width="300" height="225" /></a></p>
<p>Så hvad der den bedste løsning? Personligt synes jeg boxplottet kommer tætest på - evt. med individuelle datapunkter tilføjet, og medianen (den midterste streg i hver boks) fremhævet meget tydeligt - måske kombineret med en diamant form der angiver gennemsnit. Imidlertid er det stadig ikke helt tilfredsstillende. Vil alle forstå det - og vil undersøgelsens blive taget alvorligt når boxplottet illustrere at hvert kontor rummer mange forskellige meninger? Jeg tror hvertfald - særligt over tid - at det kan betale sig at undersøge om nogle kontorere igen og igen, viser resultater med stor spredning. I givet fald vil det måske bedste egne sig som en særskilt afrapportering?</p>
<p>Jeg håber du, som læser denne post - har et forslag vi kan arbejde videre med&#8230;</p>
<p>nb. alle data er tilfældigt genereret.</p>
<p class="akst_link"><a href="http://wana.dk/?p=352&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_352" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><ol class="footnotes"><li id="footnote_0_352" class="footnote">fordi en søjlegraf altid skal gå fra 0 til dens værdi, og ikke bør kunne gå under 0, er der konsensus om at søjlediagrammer primært bør bruges ved frekvensfordelinger, så som histogrammer</li><li id="footnote_1_352" class="footnote">Dertil kommer at findes i et utal af afskygninger - hvorfor man ikke altid kan være helt sikker på hvordan de skal tolkes. Dette er et validt modargument - men alligevel - den mest vedtagende praksis er den som jeg beskriver ovenfor</li><li id="footnote_2_352" class="footnote">normalt defineres disse som værdier der ligger mere end 1.5 gange forskellen mellem 1. kvartil og 3. kvartil, væk fra enten 1. eller 3. kvartil.</li></ol><img src="http://feeds.feedburner.com/~r/Wana/~4/Z_qm3XdoL2Q" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/10/29/rapportering-af-gennemsnit/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/10/29/rapportering-af-gennemsnit/</feedburner:origLink></item>
		<item>
		<title>Hvordan formidler vi præcist og brugbart data?</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/_CmUcFAYQKk/</link>
		<comments>http://wana.dk/2009/10/28/hvordan-formidler-vi-pr%c3%a6cist-og-brugbart-data/#comments</comments>
		<pubDate>Wed, 28 Oct 2009 19:28:51 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Diverse]]></category>

		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[anscombe]]></category>

		<category><![CDATA[formidling]]></category>

		<category><![CDATA[perception]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=345</guid>
		<description><![CDATA[Ofte hører jeg folk foretrække tabeller frem for grafer. Et hovedargument er tit at grafer kan være svære at aflæse, hvorimod en tabel altid er præcis.
Hertil kan der siges at det netop er en pointe at en graf ikke gøre et stort nummer ud af små forskelle: Hvis man har svært ved at se forskellen [...]]]></description>
			<content:encoded><![CDATA[<p>Ofte hører jeg folk foretrække tabeller frem for grafer. Et hovedargument er tit at grafer kan være svære at aflæse, hvorimod en tabel altid er præcis.</p>
<p>Hertil kan der siges at det netop er en pointe at en graf ikke gøre et stort nummer ud af små forskelle: Hvis man har svært ved at se forskellen på grafen, er det nok fordi forskellen er lille.</p>
<p>Studier i perception har desuden gentagende gange vist, at de fleste mennesker faktisk tilegner sig budskabet i en graf hurtigere end budskabet i en tabel.</p>
<p>Den absolut væsentligste grund til at bruge grafer er dog, at tal lyver. Ikke med vilje selvfølgelig - men statistiske nøgletal så som gennemsnit og varians, er kun klodsede måder at opsummere data på. Eksempelvis denne tabel:</p>
<table border="1">
<tbody>
<tr>
<td>Gennemsnit X</td>
<td>9</td>
</tr>
<tr>
<td>Varians X</td>
<td>10</td>
</tr>
<tr>
<td>Gennemsnit Y</td>
<td>7,5</td>
</tr>
<tr>
<td>Varians Y</td>
<td>3,75</td>
</tr>
<tr>
<td>Korrelation ml. X og Y</td>
<td>0,816</td>
</tr>
<tr>
<td>Liniær regressions linje</td>
<td>y = 3 + 0,5x</td>
</tr>
</tbody>
</table>
<p>Enhver der har arbejdet med tal, vil med rimelighed kunne forestille sig hvad disse tal dækker over. Du kan evt. prøve at tegne sammenhængen for dig selv først.</p>
<p><span id="more-345"></span></p>
<p>Du ved hvordan grafen vil se ud?</p>
<p>Tabellen er konstrueret af den statistikeren Frank Anscombe (*1918 +2001), netop med det formål at vise, at det altid er en god ide at kigge på en graf, før der drages forhastede konklusioner som tabellen ellers kan lokke med. Nedenstående fire grafer er således <strong>alle</strong> illustrationer af ovenstående tabel.</p>
<div class="wp-caption alignnone" style="width: 335px"><img title="Anscombes_Kvartet" src="http://upload.wikimedia.org/wikipedia/commons/thumb/b/b6/Anscombe.svg/325px-Anscombe.svg.png" alt="Anscombes Kvartet: Kilde Wikipedia" width="325" height="222" /><p class="wp-caption-text">Anscombes Kvartet: Kilde Wikipedia</p></div>
<p>Du kan læse mere om <a href="http://en.wikipedia.org/wiki/F.J._Anscombe">Anscombe</a> og hans <a href="http://en.wikipedia.org/wiki/Anscombe%27s_quartet">kvartet</a> på wikipedia. I min næste post vil jeg bede om input til hvordan Anscombe&#8217;s lektie kan bruges i almindelige rapporter, herunder medarbejdertrivsel, og ledelsesinformation. - stay tuned <img src='http://wana.dk/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /></p>
<p class="akst_link"><a href="http://wana.dk/?p=345&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_345" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/_CmUcFAYQKk" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/10/28/hvordan-formidler-vi-pr%c3%a6cist-og-brugbart-data/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/10/28/hvordan-formidler-vi-pr%c3%a6cist-og-brugbart-data/</feedburner:origLink></item>
		<item>
		<title>Den kriminelle lavalder</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/uHT-PUubEHs/</link>
		<comments>http://wana.dk/2009/10/26/den-kriminelle-lavalder/#comments</comments>
		<pubDate>Mon, 26 Oct 2009 14:22:42 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Diverse]]></category>

		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[kriminel lavaler]]></category>

		<category><![CDATA[statistik]]></category>

		<category><![CDATA[ungdomskriminalitet]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=341</guid>
		<description><![CDATA[Regeringen Lars Løkke Rasmussen foreslår i sit regeringsudspil, fremlagt ved folketingets åbning første tirsdag i oktober, at sænke den kriminelle lavalder. Uanset at dette er i modsætning til anbefalingerne fra regerings egen kommission. Ganske vidst har jeg ikke kunne finde udtalelsen fra den seneste komission (nedsat i 2007) - men Rapport om ungdomskriminalitet fra den [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.stm.dk/_p_7808.html">Regeringen Lars Løkke Rasmussen</a> foreslår i sit <a href="http://www.justitsministeriet.dk/fileadmin/downloads/Pressemeddelelser/Regeringsudspil.pdf">regeringsudspil</a>, fremlagt ved folketingets åbning første tirsdag i oktober, at sænke den kriminelle lavalder. Uanset at dette er i modsætning til anbefalingerne fra regerings egen <a href="http://www.justitsministeriet.dk/om-ministeriet/raad-naevn-udvalg-mv/andre-udvalg/kommissionen-vedroerende-ungdomskriminalitet/">kommission</a>. Ganske vidst har jeg ikke kunne finde udtalelsen fra den seneste komission (nedsat i 2007) - men <a href="www.politi.dk/NR/rdonlyres/7AA71C71-1A2D-4DD8-B099-53ADA4FE66A0/0/Rapport_jm.pdf">Rapport om ungdomskriminalitet</a> fra den foregående komission (med et vist medlemssammenfald) er frit tilgængelig på nettet. Fra resumet kan bl.a. læses:</p>
<blockquote><p>Det er ekspertgruppens vurdering, at serviceloven i langt de fleste tilfælde giver tilstrækkelige mu­ligheder for en reaktion med et socialt indhold, herunder med mulighed for at fastholde den pågæl­dende med henblik på behandling, hvis et barn eller en ung under 15 år begår alvorligere kriminali­tet.</p></blockquote>
<p>Det står også at læse i rapporten fra 2001 at det er svært at få et statistisk overblik over omfanget af ungdomskriminalitet, fordi kriminalitet begået af unge under 15 ikke registreres på samme måde som kriminalitet begået af unge over 15<sup>1</sup>.</p>
<p>Der er derfor to veje til at vurdere omfanget af ungdomskriminalitet: Den ene er at snakke med professionelle - politi, forsorg, socialrådgiverel, om deres oplevelser. De vil kunne fortælle os om unge i stigende omfang tager skylden for de ældre, om de er blevet mere forrået, om der er blevet flere episoder af den helt grove karakter, som nemt skjuler sig i statistikken.</p>
<p>Den anden metoder er at bruge statistik for den nærmeste aldersgruppe som indikator. Dvs. vi kigger på omfanget af kriminalitet begået af unge over 15. Det gør vi i figuren nedenfor. Bemærk dog at de to metoder kan være gensidigt udelukkende. Når vi ser et fald i kriminalitet for unge over 15, kan det skyldes at der er flere unge under 15 som strategisk tager skylden<sup>2</sup>. Kort sagt: Nedenstående kan ikke bruges til særligt meget uden inddragelse af fagpersonernes kendksab til kontekst.</p>
<p>Udvikling i antallet af domsfældelser, 2006-2008, unge ml. 15 og 19, fordelt på forskellige typer af overtrædelser. 2006 sættes til værdien 1. I figuren er der for hvert år angivet hvor mange domsfældelser der fandt sted i seriens sidste år, 2008. Herved kan man se hvilke overtrældelser der er flest af.</p>
<div id="attachment_339" class="wp-caption aligncenter" style="width: 160px"><a href="http://wana.dk/wp-content/uploads/2009/10/alle_idx.png"><img class="size-thumbnail wp-image-339" title="alle_idx" src="http://wana.dk/wp-content/uploads/2009/10/alle_idx-150x150.png" alt="Klik for at se fuld størrelse" width="150" height="150" /></a><p class="wp-caption-text">Klik for at se fuld størrelse</p></div>
<p>En lidt anden måe at vise de samme data på, er med et tilpasset &#8220;<a href="http://www.processtrends.com/toc_bumps_charts.htm">bumps chart</a>&#8221; , som jeg frimodigt oversætter til &#8220;hop plot&#8221;. I figuren nedenfor er alle kategorier af lovovertrædelser i 2006 sat til indeksværdi 1 (dvs. 100%). For hvert år, er der for hver kategori, ligesom i figur 1 ovenfor, angivet den relative ændring. Blot antager graflinjen forskellige farver afhængig af ændringen. Hvis der er færre lovovertrædelser end året før, er linjen grøn, hvis der er flere, er linjen rød.</p>
<div id="attachment_340" class="wp-caption aligncenter" style="width: 160px"><a href="http://wana.dk/wp-content/uploads/2009/10/hop_plot.png"><img class="size-thumbnail wp-image-340" title="hop_plot" src="http://wana.dk/wp-content/uploads/2009/10/hop_plot-150x150.png" alt="Klik for fuld størrelse" width="150" height="150" /></a><p class="wp-caption-text">Klik for fuld størrelse</p></div>
<p>Overordnet set er der i 2008 færre dømte lovovertrædelser end i 2006. Omvendt er der flere end i 2007. Kategorien &#8220;alvorligere vold&#8221; er i 2008 steget med ca 10% sammenlignet med 2006.</p>
<p>Men det ser ikke ud til at volden er eksploderet. Her skulle man bruge en længere tidsserie.</p>
<p class="akst_link"><a href="http://wana.dk/?p=341&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_341" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><ol class="footnotes"><li id="footnote_0_341" class="footnote">da kriminalitet begået af unge over 15 opgøres skal afgøres af en dommer, kan man måske spekulerere i om statistikken i fald den fandtes, ville være sammenlignelig, eftersom jeg gætter på at sanktioner overfor unge under 15 ihøjere grad beror på en helhedsbetragtning</li><li id="footnote_1_341" class="footnote">man kunne sammenligne med antallet af anmeldte forbrydelser - men der er så mange ekstra fejlkilder forbundet hermed, at den strategi næppe vil være farbar</li></ol><img src="http://feeds.feedburner.com/~r/Wana/~4/uHT-PUubEHs" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/10/26/den-kriminelle-lavalder/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/10/26/den-kriminelle-lavalder/</feedburner:origLink></item>
		<item>
		<title>Opholdstilladelser - tendenser</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/BCKGcgT5cMU/</link>
		<comments>http://wana.dk/2009/10/23/opholdstilladelser-tendenser/#comments</comments>
		<pubDate>Fri, 23 Oct 2009 12:42:15 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Diverse]]></category>

		<category><![CDATA[Grafer]]></category>

		<category><![CDATA[2001]]></category>

		<category><![CDATA[danmark]]></category>

		<category><![CDATA[dansk folkeparti]]></category>

		<category><![CDATA[fogh rasmussen]]></category>

		<category><![CDATA[immigration]]></category>

		<category><![CDATA[integration]]></category>

		<category><![CDATA[regeringen]]></category>

		<category><![CDATA[statistik]]></category>

		<category><![CDATA[udlændinge]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=329</guid>
		<description><![CDATA[Danmarks statistik er en guldgrubbe. Fx kan man hente relativt detaljeret data for tildeling af opholdstilladelser. Grafen nedenfor viser udviklingen fra 1996 til 2008, fordelt på type af opholdstilladelser, og verdensdel. Året 2001 - hvor regeringsmagten overgik til Anders Fogh Rasmussen og VK - er markeret med en lodret streg.
Bemærk at y aksen varierere meget [...]]]></description>
			<content:encoded><![CDATA[<p>Danmarks statistik er en guldgrubbe. Fx kan man hente relativt detaljeret data for tildeling af opholdstilladelser. Grafen nedenfor viser udviklingen fra 1996 til 2008, fordelt på type af opholdstilladelser, og verdensdel. Året 2001 - hvor regeringsmagten overgik til Anders Fogh Rasmussen og VK - er markeret med en lodret streg.</p>
<p>Bemærk at y aksen varierere meget fra de forskellige typer af opholdstilladelser.</p>
<div id="attachment_330" class="wp-caption alignnone" style="width: 510px"><a href="http://wana.dk/wp-content/uploads/2009/10/opholdstilladelser.png"><img class="size-full wp-image-330" title="opholdstilladelser" src="http://wana.dk/wp-content/uploads/2009/10/opholdstilladelser.png" alt="statistik opholdstilladelser 1996 2008" width="500" height="375" /></a><p class="wp-caption-text">statistik opholdstilladelser 1996 2008</p></div>
<p>Overordnet, ser det ud til at AFR1 fra starten satte fokus på at nedbringe indvandring fra  familiesammenføringer, og fra personer tildelt flygtninge status. Senere ser vi en stigning i opholdstilladelser givet til uddannelse og arbejde. Primært tildelt europæere og asiater.</p>
<p>Jeg har ikke gravet i tallene til at vide hvad der adskiller &#8220;Andet grundlag&#8221; fra &#8220;Øvrige grunde&#8221;. Fx savner jeg humanitært ophold. Skal jeg forfine grafen vil jeg nok også slå de tre forskellige familiesammenføringer sammen til en enkelt kategori.</p>
<p><em><span style="color: #ff0000;">Edit</span>: Her er en version hvor familiesammenføringer er slået sammen i en kategori, og hvor skala for y-aksen er den samme for alle subplots:</em></p>
<p><a href="http://wana.dk/wp-content/uploads/2009/10/opholdstilladelser21.png"><img class="alignnone size-full wp-image-336" title="opholdstilladelser21" src="http://wana.dk/wp-content/uploads/2009/10/opholdstilladelser21.png" alt="" width="500" height="500" /></a></p>
<p class="akst_link"><a href="http://wana.dk/?p=329&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_329" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/BCKGcgT5cMU" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/10/23/opholdstilladelser-tendenser/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/10/23/opholdstilladelser-tendenser/</feedburner:origLink></item>
		<item>
		<title>Balance mellem arbejde og familie</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/mmS4JJ1JBGQ/</link>
		<comments>http://wana.dk/2009/09/25/balance-mellem-arbejde-og-familie/#comments</comments>
		<pubDate>Fri, 25 Sep 2009 14:27:58 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Ledelse]]></category>

		<category><![CDATA[Organisation]]></category>

		<category><![CDATA[trivsel]]></category>

		<category><![CDATA[udbrændthed]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=325</guid>
		<description><![CDATA[Normalt reklamerer jeg ikke for dzidzo på denne side. Set i lyset af djøfs medlemsundersøgelse hvor 39 % angiver balance mellem arbejde og familie som en af de tre største stressfaktorer, gør jeg dog lige opmærksom på denne lille &#8216;nyhed&#8216;:
Del dette
]]></description>
			<content:encoded><![CDATA[<p>Normalt reklamerer jeg ikke for dzidzo på denne side. Set i lyset af djøfs <a href="http://www.djoef.dk/djoefbladet/Arkiv/DJOeFBladet2009/DJ-OE-F-Bladet-nr-16-2009/Dj-oe-fernes-stressfaktor-nr-1-Arbejdslivsbalancen.aspx">medlemsundersøgelse</a> hvor 39 % angiver balance mellem arbejde og familie som en af de tre største stressfaktorer, gør jeg dog lige opmærksom på denne lille &#8216;<a href="http://dzidzo.dk/dj%C3%B8f-artikel-om-arbejdslivbalance">nyhed</a>&#8216;:</p>
<div class="wp-caption alignnone" style="width: 490px"><a href="http://dzidzo.dk/dj%C3%B8f-artikel-om-arbejdslivbalance"><img title="Faktorer der påvirker udbrændthed på arbejdspladsen" src="http://dzidzo.dk/sites/default/files/effekt_udbr%C3%A6ndthed_medearbejdere_arbejdslivbalance.png" alt="Udbrændthed skyldes konflikt mellem arbejde og familieliv." width="480" height="480" /></a><p class="wp-caption-text">Udbrændthed skyldes konflikt mellem arbejde og familieliv.</p></div>
<p class="akst_link"><a href="http://wana.dk/?p=325&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_325" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/mmS4JJ1JBGQ" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/09/25/balance-mellem-arbejde-og-familie/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/09/25/balance-mellem-arbejde-og-familie/</feedburner:origLink></item>
		<item>
		<title>Gode råd til netdating</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/RvH6VhOch7Y/</link>
		<comments>http://wana.dk/2009/09/23/gode-rad-til-netdating/#comments</comments>
		<pubDate>Wed, 23 Sep 2009 13:19:36 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Diverse]]></category>

		<category><![CDATA[datamining]]></category>

		<category><![CDATA[netdating]]></category>

		<category><![CDATA[okcupid]]></category>

		<category><![CDATA[textmining]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=319</guid>
		<description><![CDATA[Jeg har længe været meget interesseret i hvorledes statistik og moderne computerkræft kan hjælpe med at opdage nyttige mønstre i meget komplekse sammenhænge. De seneste år er der kommet flere og flere eksempler på værdifulde indsigter fra textmining. Vi kan dels takke moores lov, dels internettets enorme mængde af textmining venlige data.
OKcupid har i mange [...]]]></description>
			<content:encoded><![CDATA[<p>Jeg har længe været meget interesseret i hvorledes statistik og moderne computerkræft kan hjælpe med at opdage nyttige mønstre i meget komplekse sammenhænge. De seneste år er der kommet flere og flere eksempler på værdifulde indsigter fra textmining. Vi kan dels takke moores lov, dels internettets enorme mængde af textmining venlige data.</p>
<p><a href="http://www.okcupid.com/">OKcupid</a> har i mange år været det eneste interessante netdating sted jeg har hørt om - og det er mig en gåde at ingen af de øvrige firmaer har forsøgt at efterligne deres statistikbårne koncept.</p>
<p>OKcupid&#8217;s datamining giver dels brugerne direkte fordele ift. matchsandsynlighed mellem to potentielle turtelduer, dels giver OKcupid os andre generelle indsigter i den menneskelige psyke såvel som sprogets finurligheder. Eksempelvis fungerer det tilsyneladende ikke at kontakete sin partner med ord som &#8220;hot&#8221;,  &#8220;sexy&#8221; eller beautifull. Men hvad med &#8220;pretty&#8221;? Pretty kan jo bruges på mange forskellige måder:</p>
<p><img class="alignnone" title="Svarprocent på første henvendelse på okcupid dating. Afhængig af brug af ordet pretty" src="http://cdn.okcimg.com/blog/how_to_get_replies_2/pretty-chart.png" alt="" width="439" height="460" /></p>
<p>Så når &#8220;pretty&#8221; bruges til at beskrive udseende går det galt. Men når &#8220;pretty&#8221; bruges til at beskrive andre forhold på en ikke alt for skråsikker måde - går det godt.</p>
<p>Jeg kan i øvrigt godt lide at gennemsnits svarprocenten på 32% her udgør en slags baseline. Så det er nemt at se at grønne søjler er bedre end gennemsnittet og røde søjler er dårligere end gennemsnittet.</p>
<p>Du kan læse mange flere gode råd på <a href="http://blog.okcupid.com/">okcupids blog</a>.</p>
<p>link: http://blog.okcupid.com/index.php/2009/09/14/online-dating-advice-exactly-what-to-say-in-a-first-message/</p>
<p class="akst_link"><a href="http://wana.dk/?p=319&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_319" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/RvH6VhOch7Y" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/09/23/gode-rad-til-netdating/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/09/23/gode-rad-til-netdating/</feedburner:origLink></item>
		<item>
		<title>Netflix - en lektie i samarbejde og innovation</title>
		<link>http://feedproxy.google.com/~r/Wana/~3/qshp4d-2uuk/</link>
		<comments>http://wana.dk/2009/09/23/netflix-en-lektie-i-samarbejde-og-innovation/#comments</comments>
		<pubDate>Wed, 23 Sep 2009 08:36:11 +0000</pubDate>
		<dc:creator>admin</dc:creator>
		
		<category><![CDATA[Diverse]]></category>

		<category><![CDATA[Organisation]]></category>

		<category><![CDATA[bellkor]]></category>

		<category><![CDATA[innovation]]></category>

		<category><![CDATA[long tail]]></category>

		<category><![CDATA[netflix prize]]></category>

		<category><![CDATA[predictions]]></category>

		<guid isPermaLink="false">http://wana.dk/?p=317</guid>
		<description><![CDATA[Takeaway: Innovation sker når nye folk inddrages og udfordre &#8216;de gamle&#8217; med nye metoder. Innovation er ikke betinget af at medarbejderne sidder lårerne af hinanden i et storrumskontor.
Så er Netflix konkurrencen slut. To lige gode hold var med i slutløbet og afleverede lige gode resultater. Men der er kun plads til et hold på toppen [...]]]></description>
			<content:encoded><![CDATA[<p>Takeaway: <em>Innovation sker når nye folk inddrages og udfordre &#8216;de gamle&#8217; med nye metoder. Innovation er ikke betinget af at medarbejderne sidder lårerne af hinanden i et storrumskontor.</em></p>
<p>Så er <a href="http://en.wikipedia.org/wiki/Netflix_Prize">Netflix konkurrencen</a> slut. To lige gode hold var med i slutløbet og afleverede lige gode resultater. Men der er kun plads til et hold på toppen af skamlen. Så prisen og førstepræmien gik til det hold som efter 3 år&#8217;s konkurrence var ti minutter hurtigere end konkurrencens nr. 2. 10 minutter som betød 1 mio. us$.</p>
<p>Hvad er Netflix? <a href="http://www.netflix.com/">Nefflix</a> er en online videofilm udlejler, der ligesom alle andre online sites forsøger at udnytte det store potentiale i at kende deres kunder bedre end kunderne kender sig selv. Amazon er måske bedst kendt for at gøre deres kunder opmærksom på interessante bøger - baseret på tidligere købsmønstre. Netflix gør det samme -blot for film.</p>
<p>Kort fortalt gik konkurrencen ud på at forbedre Netflix&#8217; egen metode til at forudsige brugernes vurdering af film med mindst 10%. Til syneladende en svær opgave. Imidlertid ved jeg intet om maskinlæring, så præcis hvor svær opgaven var, skal jeg ikke kunne sige.</p>
<p>Men jeg finder det interessant at de fleste deltager i konkurrencens sidste fase, alle var sammensmeltede hold, med deltagere fra forskellige discipliner og verdensdele. Og jeg finder det interessant at vinderholdet selv fusionerede og bragte nye folk på banen:</p>
<blockquote><p>“When we were approaching the first progress prize as the BellKor team, there were several other teams that joined together to make a real run at us, and that was surprising to us,” said Netflix Prize-winner Chris Volinsky, originally of team BellKor. “The success of that collaboration told us that this was a real, powerful way to improve our scores. When you’re banging heads together in an office trying to come up with new ideas, you sometimes run out of ideas, and you need to bring new people into the team, and that turned out to have a great benefit in terms of the predictive power of the models.”</p></blockquote>
<p>Som sådan forekommer Netflix konkurrencen at være en god case for frugten af tværfagligt samarbejde. Samtidig med at det måske er en pointe at vinderholdet først har mødt hinanden fysisk efter konkurrencen. De har således ikke haft mulighed for at skændes om faglige uenige på kontoret - men allene bidraget hvor de kunne hjemme fra hver deres verdensdel.<br />
Anyways: Tillykke til BellKor’s Pragmatic Chaos.</p>
<p>Kilde: <a title="http://www.wired.com/epicenter/2009/09/bellkors-pragmatic-chaos-wins-1-million-netflix-prize/" href="http://">Wired</a></p>
<p>Update: <a href="http://www.scientificblogging.com/random_walk/predicting_movie_ratings_math_won_netflix_prize">Her</a> er kortfattet beskrevet hvordan filmratings bliver forudset.</p>
<p class="akst_link"><a href="http://wana.dk/?p=317&amp;akst_action=share-this"  title="Send en mail til en ven, eller del via en webtjenese." id="akst_link_317" class="akst_share_link" rel="noindex nofollow">Del dette</a>
</p><img src="http://feeds.feedburner.com/~r/Wana/~4/qshp4d-2uuk" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://wana.dk/2009/09/23/netflix-en-lektie-i-samarbejde-og-innovation/feed/</wfw:commentRss>
		<feedburner:origLink>http://wana.dk/2009/09/23/netflix-en-lektie-i-samarbejde-og-innovation/</feedburner:origLink></item>
	</channel>
</rss>
