<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Azul Consultoria Estatística</title>
	<atom:link href="http://azul-consultoria.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://azul-consultoria.com</link>
	<description></description>
	<lastBuildDate>Thu, 13 Jun 2013 03:16:56 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>É fato: o seriado 24 Horas foi piorando com o tempo</title>
		<link>http://azul-consultoria.com/2013/e-fato-o-seriado-24-horas-foi-piorando-com-o-tempo/</link>
		<comments>http://azul-consultoria.com/2013/e-fato-o-seriado-24-horas-foi-piorando-com-o-tempo/#comments</comments>
		<pubDate>Thu, 13 Jun 2013 02:38:45 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Visualização]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=109</guid>
		<description><![CDATA[Um consenso entre os fãs do seriado 24 Horas é de que a qualidade dos episódios foi caindo com o passar das temporadas. Enquanto as quatro primeiras foram muito boas, revolucionando a TV, as seguintes ou foram repetindo a fórmula, ou foram escalando as ameaças de maneira quase inverossímil. Para testar se isto é verdade [...]]]></description>
				<content:encoded><![CDATA[<p>Um consenso entre os fãs do seriado <a href="http://www.imdb.com/title/tt0285331/">24 Horas</a> é de que a qualidade dos episódios foi caindo com o passar das temporadas. Enquanto as quatro primeiras foram muito boas, revolucionando a TV, as seguintes ou foram repetindo a fórmula, ou foram escalando as ameaças de maneira quase inverossímil.</p>
<p>Para testar se isto é verdade ou não, pensei em fazer um gráfico com as avaliações que cada episódio de cada temporada recebeu no <a href="http://imdb.com">IMBd</a> e plotar isto em relação ao tempo em que a série ficou no ar. O resultado está abaixo.</p>
<p align="center"><a href="http://azul-consultoria.com/wp-content/images/24horas.png"><img src="http://azul-consultoria.com/wp-content/images/24horas-mini.png" width="470" height="257" alt="É fato: o seriado 24 Horas foi piorando com o tempo" title="É fato: o seriado 24 Horas foi piorando com o tempo"></a><br />Clique para ampliar</p>
<p>Antes de prosseguir com a leitura, recomendo que a <a href="http://azul-consultoria.com/wp-content/images/24horas.png">versão ampliada do gráfico</a> seja aberta numa outra aba ou janela do navegador.</p>
<p>Para facilitar a visualização, decidi que cada temporada do seriado teria uma cor diferente. Paralelo a isto, a fim de facilitar a comparação entre as temporadas, decidi ajustar retas de tendência a cada uma delas.</p>
<p>Estas retas tem duas funções. A mais óbvia é determinar se o seriado está melhorando, piorando ou se mantendo a qualidade com o desenrolar da trama. A outra informação que este gráfico nos passa é referente à qualidade média da temporada. Quanto mais alta está a reta (e por mais alta eu não me refiro à sua inclinação), melhor foi sua avaliação.</p>
<p>Desta forma, podemos interpretar que a primeira temporada, mais à esquerda, foi de qualidade praticamente constante. Aliás, seus valores máximos e mínimos de avaliação permaneceram entre 8.25 e 8.75, aproximadamente. As temporadas 2, 3 e 4 foram melhorando com seu desenrolar, embora a média da quarta temporada seja inferior às três primeiras. As três temporadas seguintes (5, 6 e 7) foram piorando, de acordo com os usuários do IMDb. Por fim, a oitava temporada começou muito mal, com oa pior de todas, mas recuperou-se de maneira impressionante durante o seu desenrolar.</p>
<p>Ou seja, aquilo que todos nós fãs do seriado inferíamos é verdade: 24 Horas começou muito bem e foi piorando com o tempo (de acordo com a opinião do público), embora seu final tenha recuperado o desempenho das suas primeiras exibições.</p>
<p>Post inspirado por <a href="http://letstalkdata.com/2013/06/plotting-seinfeld-episode-scores-by-season-using-ggplot2/">este artigo</a>, que fez análise similar utilizando Seinfeld.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2013/e-fato-o-seriado-24-horas-foi-piorando-com-o-tempo/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Google Public Data Explorer</title>
		<link>http://azul-consultoria.com/2012/google-public-data-explorer/</link>
		<comments>http://azul-consultoria.com/2012/google-public-data-explorer/#comments</comments>
		<pubDate>Thu, 16 Feb 2012 12:43:04 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Análise Exploratória de Dados]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[PIB]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=82</guid>
		<description><![CDATA[Que coisa linda este Google Public Data Explorer. É a melhor ferramenta que já vi na internet para fazer análise exploratória de dados. É como se fosso um Google Trends com dados importantes. Por exemplo, abaixo fiz gráficos do produto interno bruto per capita, a partir de 1975, ajustado pelo índice Atlas. Este índice, além [...]]]></description>
				<content:encoded><![CDATA[<p>Que coisa linda este <a href="http://www.google.com/publicdata/directory">Google Public Data Explorer</a>. É a melhor ferramenta que já vi na internet para fazer análise exploratória de dados. É como se fosso um <a href="http://www.google.com/trends/">Google Trends</a> com dados importantes.</p>
<p>Por exemplo, abaixo fiz gráficos do produto interno bruto per capita, a partir de 1975, ajustado pelo índice Atlas. Este índice, além de considerar a evolução natural do PIB, indexa ele pela média do câmbio do dólar dos três últimos anos anteriores ao ano do resultado. Assim, grandes variações na taxa cambial são suavizadas, retratando melhor a tendência geral da economia.</p>
<p>No primeiro gráfico comparei Brasil, Argentina, Chile, Uruguai e mundo inteiro, para servir como parâmetro de comparação. Afinal, não adianta ter um país que cresce 5% enquanto o restante do mundo cresce 10%.</p>
<p><iframe width="550" height="400" frameborder="0" scrolling="no" marginwidth="0" marginheight="0" src="http://www.google.com/publicdata/embed?ds=d5bncppjof8f9_&amp;ctype=l&amp;strail=false&amp;bcs=d&amp;nselm=h&amp;met_y=ny_gnp_pcap_cd&amp;scale_y=lin&amp;ind_y=false&amp;rdim=region&amp;idim=country:BRA:CHL:ARG:URY&amp;ifdim=region&amp;tdim=true&amp;tstart=161672400000&amp;tend=1266210000000&amp;hl=en&amp;dl=en"></iframe></p>
<p>Vejam como nosso país ficou estagnado durante a década de 80 e parte da década de 90, esboçando uma recuperação no primeiro mandato do FHC. Entretanto, o segundo mandato foi um desastre. Ao final dele, estávamos no mesmo patamar em que estávamos em 1993/1994. Ou seja, mais dez anos de estagnação. O crescimento da economia nacional recomeça na Era Lula, mantendo-se assim durante o primeiro ano de governo da Presidenta Dilma. É interessante notar também que estes países do Mercosul possuem curvas muito parecidas para seus PIBs per capita: as ondas de expansão e recessão acompanham-se mutuamente, em maior ou menor grau.</p>
<p>Entretanto, não vejo esta comparação como sendo a ideal para avaliar como anda o Brasil. A meu ver, nosso país deveria ser a força principal da América Latina. Já somos a sexta economia do mundo e devemos rapidamente galgar mais posições neste ranking. Assim, a comparação do desempenho econômico da antiga Terra de Vera Cruz deve ser realizada com outros países de grande população e extensão territorial. Assim, ao compararmos o BRIC com o restante do mundo, temos o gráfico a seguir:</p>
<p><iframe width="550" height="400" frameborder="0" scrolling="no" marginwidth="0" marginheight="0" src="http://www.google.com/publicdata/embed?ds=d5bncppjof8f9_&amp;ctype=l&amp;strail=false&amp;bcs=d&amp;nselm=h&amp;met_y=ny_gnp_pcap_cd&amp;scale_y=lin&amp;ind_y=false&amp;rdim=region&amp;idim=country:BRA:CHN:RUS:IND&amp;ifdim=region&amp;tdim=true&amp;tstart=161672400000&amp;tend=1266210000000&amp;hl=en&amp;dl=en"></iframe></p>
<p>Claramente, a Índia é o país com menor taxa de crescimento quando comparada com Brasil, Rússia e China. O Brasil, apesar de ter taxas de crescimento da economia inferiores à da China, tem elevado seu PIB per capita em velocidade similar, indicando talvez que, perante o dólar, o real é mais forte do que o yuan. Não sou economista, então não tenho propriedade para afirmar algo assim.</p>
<p>A análise destes gráficos, por si só, não diz muita coisa. Entretanto, aposto que o cruzamento deles com resultados de investimentos em educação, infra-estrutura, taxas de impostos e desenvolvimento de novas tecnologias, é capaz de explicar muito bem como chegamos até aqui e, mais importante, para onde iremos daqui para a frente.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2012/google-public-data-explorer/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Teria sido possível evitar o desastre da Challenger?</title>
		<link>http://azul-consultoria.com/2011/teria-sido-possivel-evitar-o-desastre-da-challenger/</link>
		<comments>http://azul-consultoria.com/2011/teria-sido-possivel-evitar-o-desastre-da-challenger/#comments</comments>
		<pubDate>Mon, 05 Sep 2011 12:05:39 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Análises Estatísticas]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=55</guid>
		<description><![CDATA[Creio que as duas imagens mais marcantes em toda a história do programa espacial americano sejam a caminhada de Neil Armostrong na Lua e a explosão do ônibus espacial Challenger. Esta tragédia, exibida ao vivo pela TV em 28 de janeiro de 1986, chocou o mundo e pode ser lembrada no vídeo abaixo: Link para [...]]]></description>
				<content:encoded><![CDATA[<p>Creio que as duas imagens mais marcantes em toda a história do programa espacial americano sejam a caminhada de Neil Armostrong na Lua e a <a href="http://en.wikipedia.org/wiki/Space_Shuttle_Challenger_disaster">explosão do ônibus espacial Challenger</a>. Esta tragédia, exibida ao vivo pela TV em 28 de janeiro de 1986, chocou o mundo e pode ser lembrada no vídeo abaixo:</p>
<p align="center"><iframe width="420" height="345" src="http://www.youtube.com/embed/_10T4UYpzV8" frameborder="0" allowfullscreen></iframe><br /><sup><a href="http://www.youtube.com/watch?v=_10T4UYpzV8">Link para o vídeo</a></sup></p>
<p>Após cuidadosa investigação, a NASA conclui que a explosão ocorreu devido ao mal funcionamento de uma peça chamada <a href="http://en.wikipedia.org/wiki/O-ring">O-ring</a>, que deveria manter a junção entre as partes dos foguetes que levariam a Challenger para o espaço, além de se soltarem no momento correto. Mas será que o problema com estas peças não poderia ter sido previsto utilizando dados dos outros lançamentos de ônibus espaciais?</p>
<p>A Challenger foi a 25<sup>a</sup> missão oficial de um ônibus espacial. Para fazer este estudo, utilizei os dados de temperatura e falhas de O-rings de 23 voos de ônibus espaciais anteriores ao da Challenger, obtidos no <a href="http://archive.ics.uci.edu/ml/datasets/Challenger+USA+Space+Shuttle+O-Ring">UCI Machine Learning Repository</a>. Apenas os dados de 23 dos 24 voos anteriores estão disponíveis publicamente.</p>
<p>O gráfico abaixo mostra, no eixo horizontal, as temperaturas de lançamento, em graus Fahrenheit, dos ônibus espaciais. No eixo vertical, 0 significa que não houve problemas com nenhum O-ring durante o lançamento do ônibus espacial naquela temperatura e 1 significa que houve problemas com pelo menos um O-ring durante o lançamento do ônibus espacial naquela temperatura.</p>
<p align="center"><img src="http://azul-consultoria.com/wp-content/images/challenger01.png" width="480" height="480" alt="Teria sido possível evitar o desastre da Challenger?" title="Teria sido possível evitar o desastre da Challenger?"></p>
<p>Percebam que, aparentemente, há influência da temperatura no comportamento dos O-rings. Quanto mais frio, é mais provável que haja algum problema com o dispositivo. Mas estatística não é achismo e há uma maneira de testar se esta hipótese é verdadeira. Para isto, utilizei uma ferramenta chamada regressão logística. O <a href="http://www.r-project.org/">R</a> possui um comando específico para isto, chamado <code>glm</code>. A resposta que obtive está logo abaixo.</p>
<p><code>Call:<br />
glm(formula = ring ~ temp, family = binomial(link = "logit"),<br />
    na.action = na.pass)</p>
<p>Deviance Residuals:<br />
    Min       1Q   Median       3Q      Max<br />
-1.0611  -0.7613  -0.3783   0.4524   2.2175  </p>
<p>Coefficients:<br />
            Estimate Std. Error z value Pr(>|z|)<br />
(Intercept)  15.0429     7.3786   2.039   0.0415 *<br />
temp         -0.2322     0.1082  -2.145   0.0320 *<br />
---<br />
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 </p>
<p>(Dispersion parameter for binomial family taken to be 1)</p>
<p>    Null deviance: 28.267  on 22  degrees of freedom<br />
Residual deviance: 20.315  on 21  degrees of freedom<br />
AIC: 24.315</p>
<p>Number of Fisher Scoring iterations: 5</code></p>
<p align="center"><img src="http://azul-consultoria.com/wp-content/images/challenger02.png" width="480" height="480" alt="Teria sido possível evitar o desastre da Challenger?" title="Teria sido possível evitar o desastre da Challenger?"></p>
<p>Perceba que a análise de resíduos não viola as suposições feitas a respeito do modelo. Logo, os dados estão bem ajustados. Mas o que este monte de números e gráficos quer realmente dizer? Vejamos como a curva dada pelo output acima se ajusta à realidade:</p>
<p align="center"><img src="http://azul-consultoria.com/wp-content/images/challenger03.png" width="480" height="480" alt="Teria sido possível evitar o desastre da Challenger?" title="Teria sido possível evitar o desastre da Challenger?"></p>
<p>Nesta figura, além do eixo y indicar se houve ou não algum problema com os O-rings, ele indica a probabilidade de haver um acidente dada a temperatura do local do lançamento do ônibus espacial. No dia do lançamento da Challenger, a temperatura estava prevista para 31°F (até então, esta seria a temperatura mais baixa de lançamento de um ônibus espacial). Substituindo este valor na equação ajustada, que é dada por</p>
<p><img src="http://azul-consultoria.com/wp-content/plugins/easy-latex/cache/tex_feddf0afbfbd1c1d345f70ffff8d0d68.png" title="\displaystyle \hat{p} = \frac{\exp(15.0429-0.2322\mbox{temp})}{1+\exp(15.0429-0.2322\mbox{temp})}," style="vertical-align:-20%;" class="tex" alt="\displaystyle \hat{p} = \frac{\exp(15.0429-0.2322\mbox{temp})}{1+\exp(15.0429-0.2322\mbox{temp})}," /></p>
<p>onde temp é a temperatura no instante do lançamento, temos que a probabilidade de um O-ring falhar nestas condições é em torno de</p>
<p><img src="http://azul-consultoria.com/wp-content/plugins/easy-latex/cache/tex_f5e7dd2ad6c0355d57f12cd5c0d14776.png" title="\displaystyle \hat{p} = 0.999608783 = 99.96\%." style="vertical-align:-20%;" class="tex" alt="\displaystyle \hat{p} = 0.999608783 = 99.96\%." /></p>
<p>Ou seja, a falha do equipamento era quase uma certeza. Por si só, a falha de um ou mais O-rings não acarretaria a explosão da nave, mas não era necessário arriscar a vida de sete astronautas e um equipamento caríssimo num lançamento muito propenso a ter problemas.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2011/teria-sido-possivel-evitar-o-desastre-da-challenger/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Relação entre pobreza e religiosidade</title>
		<link>http://azul-consultoria.com/2011/relacao-entre-pobreza-e-religiosidade/</link>
		<comments>http://azul-consultoria.com/2011/relacao-entre-pobreza-e-religiosidade/#comments</comments>
		<pubDate>Thu, 11 Aug 2011 23:30:36 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Análises Estatísticas]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=50</guid>
		<description><![CDATA[Será possível que a religiosidade da população de um país influencia na riqueza de seu povo? Talvez a estatística nos ajude a responder esta pergunta. Dados Como comparar diferentes graus de religiosidade? Como medir riqueza de um país? Eu tentei deixar tudo da maneira mais simples possível, mas ainda com algum sentido. No caso deste [...]]]></description>
				<content:encoded><![CDATA[<p>Será possível que a religiosidade da população de um país influencia na riqueza de seu povo? Talvez a estatística nos ajude a responder esta pergunta.</p>
<h2 class="entry-subtitle">Dados</h2>
<p>Como comparar diferentes graus de religiosidade? Como medir riqueza de um país? Eu tentei deixar tudo da maneira mais simples possível, mas ainda com algum sentido. No caso deste post, para riqueza utilizei a renda per capita do país (o PIB dividido pelo número de habitantes). Para religiosidade, a porcentagem de pessoas que não acredita em algum deus ou força superior.</p>
<p>Obtive os dados analisados na Wikipedia. Utilizei a <a href="http://en.wikipedia.org/wiki/List_of_countries_by_GDP_(PPP)_per_capita">List of countries by GDP (PPP) per capita</a>, que possui 166 países listados. Combinei esta tabela com a <a href="http://en.wikipedia.org/wiki/Religions_by_country">Religions by country</a>, que apresenta dados de aproximadamente 200 países, mas nem todos completos. Por isso, tive que editar os dados de modo a ficar com os mesmos países em ambas listagens. No final, sobraram 116 países para analisar.</p>
<p>Minha intenção é verificar se há alguma correlação positiva entre a porcentagem da população de um país que não acredita em deus e a renda das pessoas de lá. Se a resposta para isto for positiva, tentarei ajustar uma reta a estes dados, através de uma regressão linear simples.</p>
<h2 class="entry-subtitle">O que é regressão linear simples, afinal?</h2>
<p>Eu darei pra ti, leitor leigo que não tem a obrigação de saber o que é uma regressão linear, dois exemplos bem simples do que são dados que possuem correlação entre si e que podem ser analisados através da regressão linear e um exemplo que não possui correlação.</p>
<p>Dizemos que duas variáveis aleatórias são correlacionadas positivamente se, dado que o valor de uma variável aumentou, o valor da outra variável tende a aumentar. Por exemplo, pense na altura e no tamanho do pé de uma pessoa. É de se esperar que pessoas altas tenham pés maiores que pessoas baixas. Ou seja, mais alto, maior o tamanho do teu pé.</p>
<p>Dizemos que duas variáveis aleatórias são correlacionadas negativamente se, dado que o valor de uma variável aumentou, o valor da outra variável tende a diminuir. Um corredor de maratona sempre deseja que seu tempo para completar a prova seja cada vez menor. Mas para isto ele precisa treinar, precisa passar horas correndo para adquirir velocidade e resistência. É fácil ver que quanto mais alguém treina, melhor será seu desempenho numa corrida. Ou seja, mais tempo treinando implica em menor tempo para completar uma prova.</p>
<p>Por outro lado, não parece razoável supor que o peso das pessoas influam na sua habilidade para aprender uma língua estrangeira. Assim, peso e capacidade de aprender uma língua não são correlacionados.</p>
<p>A correlação entre duas variáveis varia entre 1 (perfeitamente correlacionadas de forma positiva) e -1 (perfeitamente correlacionadas de forma negativa), passando por 0 (variáveis não correlacionadas). No caso das variáveis analisadas neste estudo, a correlação entre elas é de 0,5723. Ou seja, há forte indício de que as variáveis são correlacionadas.</p>
<h2 class="entry-subtitle">Modelo</h2>
<p>O primeiro passo para verificar se a hipótese de um modelo linear é razoável é fazer um gráfico. Por isso, plotamos as duas variáveis, uma contra a outra.</p>
<p align="center"><img src="http://grandeabobora.com/wp-content/images/data-original.jpg" alt="Relação entre pobreza e religiosidade" title="Relação entre pobreza e religiosidade" width="480" height="480"></p>
<p>Aparentemente, apesar de correlacionados, os dados não apresentam uma relação linear. Por isso, tentei diversas transformações nos dados de modo que uma relação linear aparecesse. A transformação que melhores resultados apresentou foi a logarítmica, nas duas variáveis. O resultado está abaixo.</p>
<p align="center"><img src="http://grandeabobora.com/wp-content/images/data-log.jpg" alt="Relação entre pobreza e religiosidade" title="Relação entre pobreza e religiosidade" width="480" height="480"></p>
<p>Claramente, há uma tendência nos dados. Percebam que conforme os valores presentes no eixo horizontal aumentam, os valores do eixo vertical tendem a aumentar também. Ou seja, quanto mais gente em um país não acredita em deus, maior é a renda per capita deste país, indicando uma relação positiva entre estas variáveis, relação positiva esta já atestada pela correlação de 0,5723. </p>
<p>A regressão então é dada por</p>
<p><code>Call:<br />
lm(formula = log(religion$GDP) ~ log(religion$NotReligious))</p>
<p>Residuals:<br />
    Min      1Q  Median      3Q     Max<br />
-2.9727 -0.4943  0.1652  0.7153  1.8597 </p>
<p>Coefficients:<br />
                           Estimate Std. Error t value Pr(>|t|)<br />
(Intercept)                 8.57172    0.11337  75.611  < 2e-16 ***<br />
log(religion$NotReligious)  0.38221    0.05069   7.539 1.23e-11 ***<br />
---<br />
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 </p>
<p>Residual standard error: 1.019 on 114 degrees of freedom<br />
Multiple R-squared: 0.3327,	Adjusted R-squared: 0.3269<br />
F-statistic: 56.84 on 1 and 114 DF,  p-value: 1.230e-11</code></p>
<p>Traduzindo, há uma reta que se ajusta aos pontos e ela é dada por</p>
<p><img src="http://azul-consultoria.com/wp-content/plugins/easy-latex/cache/tex_91fbc2a8550792108c7e1ea3b985cbab.png" title="\log(\mbox{Renda per capita}) = 0.38221\log(\mbox{Percentual de Nao Crentes}) + 8.57172" style="vertical-align:-20%;" class="tex" alt="\log(\mbox{Renda per capita}) = 0.38221\log(\mbox{Percentual de Nao Crentes}) + 8.57172" /></p>
<p>Claramente, tanto o intercepto quanto o coeficiente angular da reta ajustada possuem p-valores bastante baixos, indicando assim que são estatisticamente diferentes de zero. Assim, a reta ajustada fica desta forma: </p>
<p align="center"><img src="http://grandeabobora.com/wp-content/images/data-regression.jpg" alt="Relação entre pobreza e religiosidade" title="Relação entre pobreza e religiosidade" width="480" height="480"></p>
<h2 class="entry-subtitle">Conclusão</h2>
<p>Ao final, podemos concluir que a renda per capita de um país não é inteiramente explicada pela porcentagem de sua população que acredita ou não em algum deus. O valor R<sup>2</sup>=0,3327 informa que, de um máximo de 100%, apenas 33,27% da variância da renda per capita é explicada pela porcentagem de pessoas que não creem em algum deus.</p>
<p>Além disso, é possível que a religiosidade de um povo dependa do nível de sua educação, dentre outros fatores. Infelizmente, não obtive acesso a estes outros dados para realizar uma análise mais completa.</p>
<p>Ou seja, seria muito leviano da minha parte afirmar, com certeza absoluta, que povos mais que acreditam em algum deus são, em geral, mais pobres que povos menos crentes. Leitores mais atentos devem lembrar que <a href="http://grandeabobora.com/usando-estatistica-para-desmascarar-a-astrologia.html">minhas conclusões a respeito dos signos dos pilotos de Formula 1 influenciarem em suas vitórias</a> também seguem este estilo, sendo um tanto quanto comedidas.</p>
<p>O que talvez faça mais sentido do que imaginar a religiosidade de um povo influenciando na riqueza da nação seja justamente o oposto desta afirmação. Acho mais provável que países pobres tendam a ser mais religiosos que países ricos. A renda explica a religiosidade, e não o contrário.</p>
<p>Se levarmos em conta que pessoas pobres, sem instrução e, principalmente, sem perspectiva de melhora de condição de vida, necessitam de algum tipo de promessa de conforto para o além-vida, para tornar o fardo existencial um pouco mais suportável, fica fácil entender porque minha afirmação anterior parece ser um pouco mais correta.</p>
<p>E o que vocês, nobres leitores, acham disso?</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2011/relacao-entre-pobreza-e-religiosidade/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>O Andar do Bêbado &#8211; Leonard Mlowdnow</title>
		<link>http://azul-consultoria.com/2011/o-andar-do-bebado-leonard-mlowdnow/</link>
		<comments>http://azul-consultoria.com/2011/o-andar-do-bebado-leonard-mlowdnow/#comments</comments>
		<pubDate>Sun, 31 Jul 2011 03:28:05 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Livros]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=48</guid>
		<description><![CDATA[O Andar do Bêbado conta uma breve história da probabilidade e da estatística, desde os primeiros estudos a respeito de primitivos jogos de azar da Idade Média, até o início do século XX. O título do livro é uma referência ao movimento browniano, que citei en passant quando comentei a respeito do fato de um [...]]]></description>
				<content:encoded><![CDATA[<p align="center"><img src="http://grandeabobora.com/wp-content/images/o-andar-do-bebado.jpg" alt="O Andar do Bêbado - Leonard Mlodinow" title="O Andar do Bêbado - Leonard Mlodinow" width="314" height="450"   ></p>
<p>O Andar do Bêbado conta uma breve história da probabilidade e da estatística, desde os primeiros estudos a respeito de primitivos jogos de azar da Idade Média, até o início do século XX. O título do livro é uma referência ao movimento browniano, que citei <em>en passant</em> quando comentei a respeito do fato de <a href="http://grandeabobora.com/como-provar-matematicamente-que-um-bebado-sempre-consegue-voltar-para-casa.html">um bêbado sempre voltar pra casa</a>.</p>
<p>Em meio aos fatos históricos, o autor sempre descreve a motivação que levou às descobertas apresentadas. Se no início foram os jogos de azar, hoje em dia os esportes e o mercado financeiro podem, muitas vezes, ser explicados através de modelos estocásticos.</p>
<p>(Um modelo estocástico é um modelo não-determinístico. Por exemplo, se um carro viaja a 80km/h, sabemos que em 1h ele viajará 80km, em 2h viajará 160km e assim por diante. Isto é um modelo determinístico. Já em 10 lançamentos de moeda, o máximo que podemos afirmar é que a chance de saírem 10 caras em sequência é 1 em 1024. Isto é um modelo estocástico.)</p>
<p>No decorrer do livro, há diversos convites ao leitor, para que ele deduza algumas coisas por si mesmo. Nada sofisticado que necessite de derivação ou integração: todos os problemas propostos podem ser resolvidos através de simples contagens. Um problema muito interessante e contra-intuitivo apresentado no livro é o seguinte:</p>
<blockquote><p>Um casal deseja ter dois filhos. Qual a chance de que pelo menos uma das crianças seja menina?</p></blockquote>
<p>Para facilitar a notação, chamarei meninas de F e meninos de M.</p>
<p>Assim, se um casal deseja dois filhos, as possibilidades são FF, FM, MF e MM. Logo, a chance de ter pelo menos uma menina é 75% (resultados FF, FM e MF).</p>
<p>Agora, suponhamos que o casal já tenha dois filhos cujo sexo não sabemos. Nos é dito que uma das crianças é menina. Qual a chance da outra criança ser menina também?</p>
<p>Pense um pouco.</p>
<p>Eu garanto que vale a pena.</p>
<p>Pensou?</p>
<p>Pois, dado que uma das crianças é menina, a chance da outra também ser é de 1/3 ou 33%, e não 50% como a maioria de vocês pensou.</p>
<p>Explico.</p>
<p>Se um dos filhos é menina, o espaço amostral que nos resta para analisar não é mais aquele com quatro opções, e sim FF, FM e MF. Como um dos filhos é menina, a única opção que resta é FF para que o outro também seja. Logo, 33% é a resposta correta.</p>
<p>Há diversos outros exemplos no livro. Aqueles que tratam da aleatoriedade no desempenho de atletas, provando que não existe boa e má sorte, estão entre os melhores. Tudo numa linguagem bastante simples, mas que não insulta a inteligência do leitor.</p>
<p>Leitura mais do que recomendada para os fãs de obras de divulgação científica.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2011/o-andar-do-bebado-leonard-mlowdnow/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Fórmula 1 e astrologia</title>
		<link>http://azul-consultoria.com/2011/formula-1-e-astrologia/</link>
		<comments>http://azul-consultoria.com/2011/formula-1-e-astrologia/#comments</comments>
		<pubDate>Tue, 26 Jul 2011 01:19:45 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Análises Estatísticas]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=44</guid>
		<description><![CDATA[Motivação Certa vez, a blogueira Ana Freitas publicou o post Astrologia: se você não acredita, é porque ainda não sabe o suficiente. Nele, ela conta que pessoas que a desconhecem completamente fizeram seu mapa astral e acertaram diversas de suas características. Nas palavras dela, Eu li 30 páginas sobre mim, escritas por pessoas que nunca [...]]]></description>
				<content:encoded><![CDATA[<h2 class="entry-subtitle">Motivação</h2>
<p>Certa vez, a blogueira <a href="http://www.olhometro.com/">Ana Freitas</a> publicou o post <a href="http://olhometro.com/2009/04/06/astrologia-se-voce-nao-acredita-e-porque-ainda-nao-sabe-o-suficiente/">Astrologia: se você não acredita, é porque ainda não sabe o suficiente</a>. Nele, ela conta que pessoas que a desconhecem completamente fizeram seu mapa astral e acertaram diversas de suas características. Nas palavras dela,</p>
<blockquote><p>Eu li 30 páginas sobre mim, escritas por pessoas que nunca tinham me visto antes. E as páginas me descreviam com precisão medonha. Era assustador. E antes que alguém fale em leitura fria, eu adianto &#8211; que tal um mapa astral que me dá detalhes da minha relação com meus pais durante a infância e de como isso possivelmente afetou minha vida adulta nos campos A, B e C, e que falou isso como se fosse a psicóloga da minha família?</p></blockquote>
<p>Cético em relação às suas declarações, comentei:</p>
<blockquote><p>Estatístico que sou, gostaria de fazer dois testes com mapas astrais.</p>
<p>O primeiro tu já fez, que foi uma descrente receber <strong>o próprio</strong> mapa astral, analisá-lo e ver se as coisas batem ou não.</p>
<p>O segundo, que não tenho conhecimento se foi ou não realizado por alguém, seria um crente receber o mapa astral <strong>de outra pessoa</strong>, e ver se as coisas também batem.</p>
<p>Na verdade, os dois testes deveriam ser feitos com um tamanho amostral maior (pelo menos umas 30 pessoas de cada grupo), para termos propriedades estatísticas melhores.</p></blockquote>
<p>No meio da conversa apareceu <a href="http://www.deldebbio.com.br/">Marcelo Del Debbio</a>, um famoso estudioso do ocultismo, que possui uma <a href="http://www.deldebbio.com.br/index.php/about/">extensa lista de participações em sociedades de pessoas ligadas a estes temas</a> que não-iluminados como eu não compreendem. Disse ele:</p>
<blockquote><p>Marcus</p>
<p>Estamos fazendo isso. Comecei com meu sócio, que é um ateu-descrente total, mas fã de Formula-1, que eu odeio.<br />
Ele reuniu para mim a lista de datas de nascimento/local dos 100 pilotos que já venceram uma corrida (ou seja, não basta ser piloto, tem de ser Bom no que faz) e estamos fazendo o levantamento dos planetas/signos de cada um…<br />
temos gente com intervalo de nascimento de 50 anos, de tudo que é país imaginável, ou seja, uma variação enorme de pessoas cuja caracteristica unica é ter vencido uma corrida de F-1</p>
<p><strong>Em seguida, fazemos o levantamento estatistico de todos os planetas/signos… se a Astrologia não influencia nada, teremos 1/12 para cada planeta/signo (lembrando que são 1.000 planetas/signos: 10 planetas x 100 pilotos)</p>
<p>Se influenciar, teremos desvios ai… e eu já adianto que espero achar muito Áries, Escorpião e Capricórnio… e pouco Touro, câncer e Peixes.</strong></p>
<p>Vamos ver o que acontece.</p></blockquote>
<p>Grifo meu.</p>
<p>Isso foi em 14 de abril. Até hoje não havia uma resposta para o questionamento por ele levantado, talvez por sua falta de tempoa para lidar com assuntos mais exatos.</p>
<p>Bem, até hoje.</p>
<h2 class="entry-subtitle">Estatística</h2>
<p>Aqueles que não desejam saber a ciência usada para que eu chegasse à minha conclusão podem pular para a seção Análise.</p>
<p>Em Estatística há o que chamamos de testes de hipóteses. A grosso modo, estes testes servem para nos ajudar a decidir se o(s) parâmetro(s) de interesse de alguma variável aleatória são de fato o que suspeitamos.</p>
<p>Trocando em miúdos: pensem numa moeda. Se eu jogar ela para cima <strong>uma vez</strong> e cair cara, posso concluir que toda vez que a jogar o resultado será cara?</p>
<p>Claro que não. Preciso de um tamanho amostral maior para concluir algo.</p>
<p>Digamos então que eu jogue esta moeda 10 vezes. Destas 10 vezes, obtive 7 caras e 3 coroas. Posso afirmar que esta moeda é desonesta, isto é, que a probabilidade de dar cara é maior que a de dar coroa?</p>
<p>Eu não afirmaria isto, pois ao lançar uma moeda honesta, a chance de termos exatamente 5 caras em 10 lançamentos é de apenas 24,6%.</p>
<p>O ideal, tanto de acordo com nossa intuição como com a <a href="http://en.wikipedia.org/wiki/Law_of_large_numbers#The_weak_law">Lei Fraca dos Grandes Números</a>, seria lançar a moeda infinitas vezes, pois quanto mais a lançarmos, mais próximos estaremos do valor exato da probabilidade de cada face.</p>
<p>Mas isso nem sempre é possível, seja pelo custo envolvido ou pela falta de dados.</p>
<p>Mas então, como proceder?</p>
<p>É aí que entram os testes de hipótese. Eu posso afirmar que a probabilidade de dar cara é igual a probabilidade de dar coroa &#8211; em notação matemática, P(cara) = P(coroa) &#8211; e fazer um teste pra verificar a veracidade desta afirmação.</p>
<p>Assim, é possível tirar conclusões sobre as propriedades de amostras finitas de maneira bastante acurada.</p>
<p>Para este tipo de problema, verificar se as probabilidades (ou proporções) de uma amostra são todas iguais, o ideal é utilizar o <a href="http://en.wikipedia.org/wiki/Pearson%27s_chi-square_test">Teste &Chi;<sup>2</sup></a> (lê-se qui-quadrado).</p>
<h2 class="entry-subtitle">Análise</h2>
<p>Tendo a base científica, vamos à análise.</p>
<p>Como base de dados, utilizei a <a href="http://pt.wikipedia.org/wiki/Vencedores_de_corridas_da_F%C3%B3rmula_1">Lista de Vencedores de Corridas da Fórmula 1</a> disponível na Wikipedia. As datas de nascimento dos pilotos foram todas obtidas no mesmo website, versão em português, sempre que disponível. No total, são 101 pilotos, distribuídos por 12 signos diferentes. Pode parecer uma maneira simplória de separar os pilotos, sem levar em conta ascendentes, luas e afins, mas eu precisava de um critério que mantivesse, pelo menos, cinco pilotos em cada categoria, para que o Teste &Chi;<sup>2</sup> pudesse ser utilizado. Meu tamanho amostral era de apenas 101; por isso, o não tão grande número de categorias.</p>
<p>Assim, o resultado do número de pilotos por signo ficou sendo</p>
<p>Aquário: 7<br />
Áries: 12<br />
Câncer: 14<br />
Capricórnio: 10<br />
Escorpião: 7<br />
Gêmeos: 6<br />
Leão: 6<br />
Libra: 9<br />
Peixes: 8<br />
Sagitário: 6<br />
Touro: 7<br />
Virgem: 9</p>
<p>Para esta análise, a ordem dos signos não importa. Optei pela alfabética porque ficou mais fácil para eu contar os resultados de cada signo desta forma. A planilha utilizada para tal está <a href="http://grandeabobora.com/formula1.xls">aqui</a>.</p>
<p>Sabendo que 101/12 = 8.42, os resultados para Áries e Capricórnio, com 12 e 10 pilotos respectivamente, estão mais altos que o esperado, como o Marcelo previu. Já Escorpião, que, segundo ele, também deveria ser alto, decepcionou, ficando em 7 e bem distante de seus já citados pares.</p>
<p>Por outro lado, Touro, Câncer e Peixes não são tão baixos como esperado. Aliás, nenhum dos três signos possui o valor mínimo de ocorrências (6, atingido por Gêmeos, Leão e Sagitário, signos sequer citados por ele). Inclusive Câncer, que segundo o próprio Marcelo, teria <em>energias mais voltadas para o aconchego (nurturing) do que para a disputa</em>, significando que teria um dos piores resultados, foi o signo com o maior número de pilotos vencedores! 14 no total.</p>
<p>Mas estes números sozinhos não dizem nada. Precisei fazer o já citado Teste &Chi;<sup>2</sup> para tirar alguma conclusão. As hipóteses que testei foram</p>
<p>H<sub>0</sub>: os signos têm a mesma proporção de pilotos vencedores <em>(é o que eu acho)</em><br />
H<sub>A</sub>: pelo menos um signo tem proporção de pilotos vencedores diferente dos demais <em>(é mais ou menos o que o Marcelo defende)</em></p>
<p>Vejam bem: eu não estou testando que <strong>todas as proporções</strong> de pilotos vencedores em cada signo são diferentes entre si. Note que se <strong>apenas uma</strong> delas for diferente das demais, não importando qual, a minha hipótese de proporções iguais entre os signos cai por terra.</p>
<p>Como o método científico exige, eu devo relatar todos meus passos paque que meu experimento seja replicado por quem quiser. Para realizar o teste, utilizei o <a href="http://www.r-project.org/">R</a>, software estatístico gratuito disponível para Windows, Linux e Mac OS. Com ele instalado, foi só rodar os comandos</p>
<p><code>> signos=c(7,12,14,10,7,6,6,9,8,6,7,9)<br />
> chisq.test(signos)</code></p>
<p>e receber o resultado</p>
<p><code>Chi-squared test for given probabilities</p>
<p>data:  signos<br />
X-squared = 8.4257, df = 11, p-value = 0.6747</code></p>
<p>Com p-valor=0.6747, não podemos rejeitar H<sub>0</sub>. Ou seja, a 5% de significância (ou seja, com 95% de certeza), <strong>as proporções de pilotos vencedores em cada signo do zodiáco são iguais</strong>.</p>
<h2 class="entry-subtitle">Conclusão</h2>
<p>Para reforçar o que foi dito na seção anterior, <strong>não há indícios estatísticos</strong> que o signo dos pilotos de Fórmula 1 influencie na sua habilidade em dirigir.</p>
<p>Isso quer dizer que eu provei que a Astrologia não funciona? Claro que não. Eu sou um cientista e não faço este tipo de afirmação leviana. O que encontrei foi um caso no qual, através de um ferrramenta estatística bem conhecida, fiz uma experiência <strong>bem definida</strong> que concluiu o oposto daquilo que foi alegado pelo astrólogo. Ou seja, <strong>pelo menos</strong> com o exemplo proposto pelo Marcelo, não há indícios de que Astrologia funcione.</p>
<p>Como complemento, recomendo que leiam <a href="http://nebulosabar.com/comportamento/pensamentos-sobre-astrologia-fato-ou-desejo-de-acreditar/">Pensamentos sobre Astrologia: fato ou desejo de acreditar?</a>. É outro texto longo, mas o Newton esmiúça, sob um olhar cético, um mapa astral feito especialmente para ele.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2011/formula-1-e-astrologia/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Como assim um blog?</title>
		<link>http://azul-consultoria.com/2011/39/</link>
		<comments>http://azul-consultoria.com/2011/39/#comments</comments>
		<pubDate>Tue, 12 Jul 2011 03:20:09 +0000</pubDate>
		<dc:creator>Marcus</dc:creator>
				<category><![CDATA[Institucional]]></category>

		<guid isPermaLink="false">http://azul-consultoria.com/?p=39</guid>
		<description><![CDATA[Por que uma empresa de consultoria tem um blog? Boa pergunta. No caso da Azul Consultoria Estatística, a motivação é ilustrar alguns dos métodos utilizados em nossas análises em alguns conjuntos de dados não-ortodoxos, de modo a exibir a enorme gama de possibilidades que a análise estatística possui. Por enquanto, já possuímos os seguintes exemplos [...]]]></description>
				<content:encoded><![CDATA[<p>Por que uma empresa de consultoria tem um blog? Boa pergunta. No caso da Azul Consultoria Estatística, a motivação é ilustrar alguns dos métodos utilizados em nossas análises em alguns conjuntos de dados não-ortodoxos, de modo a exibir a enorme gama de possibilidades que a análise estatística possui. Por enquanto, já possuímos os seguintes exemplos de análises:</p>
<ul>
<li><a href="http://azul-consultoria.com/2011/formula-1-e-astrologia/" title="Fórmula 1 e astrologia">Fórmula 1 e astrologia</a> (teste qui-quadrado)</li>
<li><a href="http://azul-consultoria.com/2011/relacao-entre-pobreza-e-religiosidade/" title="Relação Entre Pobreza e Religiosidade">Relação Entre Pobreza e Religiosidade</a> (regressão linear)</li>
<li><a href="http://azul-consultoria.com/2011/teria-sido-possivel-evitar-o-desastre-da-challenger/" title="Teria sido possível evitar o desastre da Challenger?">Teria sido possível evitar o desastre da Challenger?</a> (regressão logística)</li>
<li><a href="http://azul-consultoria.com/2012/google-public-data-explorer/" title="Google Public Data Explorer">Google Public Data Explorer</a> (review de um serviço gratuito do Google)</li>
</ul>
<p>Caso tenha se interessado por alguma destas análises ou queira apenas tirar alguma dúvida a respeito delas, basta <a href="http://azul-consultoria.com/contato/">enviar um e-mail</a> e teremos o maior prazer em responder.</p>
]]></content:encoded>
			<wfw:commentRss>http://azul-consultoria.com/2011/39/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
