<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/atom10full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:openSearch="http://a9.com/-/spec/opensearch/1.1/" xmlns:georss="http://www.georss.org/georss" xmlns:gd="http://schemas.google.com/g/2005" xmlns:thr="http://purl.org/syndication/thread/1.0" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" gd:etag="W/&quot;CEABSH8-fyp7ImA9WhRUE0Q.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806</id><updated>2012-01-24T09:12:39.157+01:00</updated><category term="GPU" /><category term="encuesta" /><category term="superpi" /><category term="Zambezi" /><category term="memory disambiguation" /><category term="cache" /><category term="pump out" /><category term="errata 298" /><category term="silverhorne" /><category term="IT" /><category term="Phenom B3" /><category term="affinity" /><category term="L3 cache" /><category term="Phenom" /><category term="x86" /><category term="Istambul" /><category term="benchmark" /><category term="memoria" /><category term="45 nm" /><category term="HD4800" /><category term="Cburst32" /><category term="roadmap" /><category term="HotChips" /><category term="L3 caché" /><category term="pasta termica" /><category term="trucos" /><category term="core 2 quad" /><category term="K11" /><category term="netburst" /><category term="pentium 4" /><category term="conroe" /><category term="quad core" /><category term="CPU" /><category term="Sandy Bridge" /><category term="core 2" /><category term="AMD" /><category term="Opteron" /><category term="SATA bug" /><category term="Athlon64" /><category term="trace cache" /><category term="TLB bug" /><category term="experiencias" /><category term="core2" /><category term="bonnell" /><category term="Shanghai" /><category term="IBM" /><category term="SAT" /><category term="BGA CPU" /><category term="CMT" /><category term="stepping B3" /><category term="Montreal" /><category term="super pi" /><category term="processor" /><category term="core" /><category term="8086" /><category term="PhenomII" /><category term="ultraportable" /><category term="nehalem" /><category term="Power7" /><category term="ddr4" /><category term="TLB oculto" /><category term="erratum 298" /><category term="Orochi" /><category term="Procesador" /><category term="Magni Cours" /><category term="dry out" /><category term="Phenom 9850" /><category term="winrar" /><category term="asincono" /><category term="optimizacion" /><category term="core2quad" /><category term="frecuencia" /><category term="Bulldozer" /><category term="32 nm" /><category term="Magny cours" /><category term="7zip" /><category term="K8L" /><category term="intel" /><category term="penryn" /><category term="K8" /><category term="ATI" /><category term="Phenom 9750" /><category term="atom" /><category term="microarquitectura" /><category term="quadcore" /><category term="core i7" /><category term="ddr3" /><category term="QPI" /><category term="K10" /><category term="TLB errata" /><title>LowLevelHardware</title><subtitle type="html">CPU, micro arquitectura, procesador, trucos, GPU, pipeline, intel, AMD</subtitle><link rel="http://schemas.google.com/g/2005#feed" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/posts/default" /><link rel="alternate" type="text/html" href="http://lowlevelhardware.blogspot.com/" /><link rel="next" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default?start-index=26&amp;max-results=25&amp;redirect=false&amp;v=2" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><generator version="7.00" uri="http://www.blogger.com">Blogger</generator><openSearch:totalResults>84</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>25</openSearch:itemsPerPage><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/atom+xml" href="http://feeds.feedburner.com/Lowlevelhardware" /><feedburner:info uri="lowlevelhardware" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><feedburner:emailServiceId>Lowlevelhardware</feedburner:emailServiceId><feedburner:feedburnerHostname>http://feedburner.google.com</feedburner:feedburnerHostname><entry gd:etag="W/&quot;CE8GQH87fip7ImA9WhRXGE4.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6482925507252880283</id><published>2011-12-25T17:39:00.000+01:00</published><updated>2011-12-25T18:07:01.106+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-12-25T18:07:01.106+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="nehalem" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="core i7" /><category scheme="http://www.blogger.com/atom/ns#" term="experiencias" /><category scheme="http://www.blogger.com/atom/ns#" term="Sandy Bridge" /><title>¡Felices fiestas desde LowLevelHardware! – LowLevelHardware</title><content type="html">&lt;p&gt;¡Felices fiestas a todos desde LowLevelHardware!&lt;/p&gt; &lt;p align="justify"&gt;Como es obligada tradición estos días estoy con la familia celebrando las fiestas pero desde el día 27 empiezo a sustituir 12 de mis &lt;a href="http://professionalsat.blogspot.com/2008/06/equipos-de-altas-prestaciones.html" target="_blank"&gt;Sistemas de Altas Prestaciones&lt;/a&gt; basados en CPUs Sandy Bridge Core i7 2600K @ 4.4 GHz por antiguos, venerables y probados Nehalem Core i7 930 y 950 @ 4 GHz.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/-CbkOxUIPWFg/TvdXe-dX6iI/AAAAAAAAFLE/TR1mS_Dli8M/s1600-h/SB_4C_630p_cores_thumb%25255B1%25255D%25255B3%25255D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="SB_4C_630p_cores_thumb[1]" border="0" alt="SB_4C_630p_cores_thumb[1]" src="http://lh6.ggpht.com/-fc-hN75EKZs/TvdXj-UHbCI/AAAAAAAAFLM/dvuVzh--OlE/SB_4C_630p_cores_thumb%25255B1%25255D_thumb%25255B1%25255D.png?imgmax=800" width="638" height="312"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;¿Extraño? Simplemente los Sandy Bridge son un 30% más lentos que los Nehalem en los cálculos matemáticos intensivos que emplea uno de mis mejores clientes… he descubierto un “defecto” en la excelentísima nueva&amp;nbsp; arquitectura de Intel.&lt;/p&gt; &lt;p align="justify"&gt;Tras semanas de testing he descubierto la causa, recordáis la caché de micro operaciones de 1500 uOps nueva en SB, pues en estos algoritmos crea un GRAVE problema prestacional.&lt;/p&gt; &lt;p align="justify"&gt;Lo denomino “&lt;a href="http://lowlevelhardware.blogspot.com/2011/02/intel-core-i7-2600-k-analisis-caches.html" target="_blank"&gt;micro code cache&lt;/a&gt; inter thread thrashing”. Un thread expulsa de la uOp cache los datos del otro thread constantemente y hace que la velocidad de cálculo sostenida del procesador baje alarmantemente.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/-HJFvRTukz0M/TvdXlE-W6mI/AAAAAAAAFLU/K-kg8u6MdBM/s1600-h/SB_uopcache_thumb%25255B1%25255D%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="SB_uopcache_thumb[1]" border="0" alt="SB_uopcache_thumb[1]" src="http://lh3.ggpht.com/-zg73QPEnadM/TvdXmtLtKEI/AAAAAAAAFLc/6-NahcGB6HQ/SB_uopcache_thumb%25255B1%25255D_thumb%25255B1%25255D.jpg?imgmax=800" width="608" height="418"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Un Core i7 Nehalem @ 4 GHz realiza 1000 iteraciones del cálculo con ocho threads simultáneos en 3100 s, un SB @ 4.4 GHz tarda unos absurdos 4050 s.&lt;/p&gt; &lt;p align="justify"&gt;Es un resultado absolutamente repetible con una variación de máquina a máquina máxima de 50 s y lo he probado con 12 CPUs distintas SB y 24 Nehalem y con placas base SB P67 y Z68. Única opción: volver a los antiguos i7…&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/-rcrb4RPQxpA/TvdXpg0wMsI/AAAAAAAAFLk/pgNajaK2rd0/s1600-h/die_thumb%25255B1%25255D%25255B3%25255D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="die_thumb[1]" border="0" alt="die_thumb[1]" src="http://lh6.ggpht.com/-TIx4GWFWuaw/TvdXsv6ovjI/AAAAAAAAFLs/DeV2CNqybMc/die_thumb%25255B1%25255D_thumb%25255B1%25255D.png?imgmax=800" width="408" height="285"&gt;&lt;/a&gt;El venerable y efectivo Nehalem de 45 nm.&lt;/p&gt; &lt;p align="justify"&gt;Disfrutemos de estos días antes de ponernos manos a la obra… lo dicho, ¡Felices Fiestas!&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong style="text-align: left; line-height: 18px; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; font-family: ; white-space: normal; orphans: 2; color: ; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px"&gt;&lt;font style="text-align: left; background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;font face="Times New Roman"&gt;&lt;font style="font-size: 12pt" color="#000000"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 427px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:db367640-db56-4544-910b-bd40eaeea980" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sandy+Bride" rel="tag"&gt;Sandy Bride&lt;/a&gt;,&lt;a href="http://technorati.com/tags/uop+cache" rel="tag"&gt;uop cache&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Nehalem" rel="tag"&gt;Nehalem&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Navidad" rel="tag"&gt;Navidad&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6482925507252880283?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6482925507252880283/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/12/felices-fiestas-desde-lowlevelhardware.html#comment-form" title="3 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6482925507252880283?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6482925507252880283?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/jP_oYC0xyn8/felices-fiestas-desde-lowlevelhardware.html" title="¡Felices fiestas desde LowLevelHardware! – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/-fc-hN75EKZs/TvdXj-UHbCI/AAAAAAAAFLM/dvuVzh--OlE/s72-c/SB_4C_630p_cores_thumb%25255B1%25255D_thumb%25255B1%25255D.png?imgmax=800" height="72" width="72" /><thr:total>3</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/12/felices-fiestas-desde-lowlevelhardware.html</feedburner:origLink></entry><entry gd:etag="W/&quot;DUMFSH44eip7ImA9WhdWFEw.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6061477637860092189</id><published>2011-09-01T18:34:00.000+02:00</published><updated>2011-09-07T19:43:39.032+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-09-07T19:43:39.032+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="CMT" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="frecuencia" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="trucos" /><category scheme="http://www.blogger.com/atom/ns#" term="Zambezi" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD Bulldozer. Frecuencias finales. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;&lt;font color="#4bacc6"&gt;&lt;strong&gt;Actualización 07 Septiembre 2011&lt;/strong&gt;&lt;/font&gt;: Últimas noticias referentes al lanzamiento de Bulldozer y algunos datos técnicos extra al final del artículo.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/-AZQiskf1k2s/TmetRhSY0ZI/AAAAAAAAFHw/MNnPDLonDDk/s1600-h/InterlagosMCM%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="InterlagosMCM" border="0" alt="InterlagosMCM" src="http://lh6.ggpht.com/-ph0wPx89tMs/TmetSavNwaI/AAAAAAAAFH0/EP4X84PfdEY/InterlagosMCM_thumb%25255B1%25255D.jpg?imgmax=800" width="554" height="330"&gt;&lt;/a&gt;Uno de los primeros MCM Interlagos compuesto de 2 dies Bulldozer de 8 INT cores.&lt;/p&gt; &lt;p align="justify"&gt;En la web de Gigabyte hemos encontrado las especificaciones finales de los procesadores basado en núcleos Bulldozer que próximamente saldrán a la venta.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/-to6Odyw4yx8/Tl-0e_KBj_I/AAAAAAAAFHo/jueuzG7afFA/s1600-h/Bulldozer_FX%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Bulldozer_FX" border="0" alt="Bulldozer_FX" src="http://lh6.ggpht.com/-7KyKoPokVL8/Tl-0fb8h57I/AAAAAAAAFHs/XBWVbNxZCGk/Bulldozer_FX_thumb%25255B1%25255D.jpg?imgmax=800" width="630" height="209"&gt;&lt;/a&gt;AMD Bulldozer. Por fin datos reales sobre los steppings comerciales.&lt;/p&gt; &lt;p align="justify"&gt;Concretamente, la página en cuestión es &lt;a href="http://www.gigabyte.com/support-downloads/cpu-support-popup.aspx?pid=3880" target="_blank"&gt;la siguiente&lt;/a&gt;, correspondiente al soporte de CPUs de la placa base de socket AM3+ GA 990 FXA UD7.&lt;/p&gt; &lt;p align="justify"&gt;En ella obtenemos alguna información extra sobre las nuevas CPUs de 32 nm de la serie FX.&lt;/p&gt; &lt;p align="justify"&gt;Entre otros datos encontramos un TDP máximo de 125 W y la denominación B2 para el primer stepping comercial.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Bus Hyper Transport de 5.2 GHz&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Todos los modelos ajustan su reloj HT3 a&amp;nbsp; GT/s. Sinceramente no veo razón para ello dado el excesivo ancho de banda ya disponible a las frecuencias de Thuban (Phenom II X6), GHz.&lt;/p&gt; &lt;p align="justify"&gt;Obviamente la razón de esta alta frecuencia de 5.2 GT/s es comercial, marketing puro.&lt;/p&gt; &lt;p align="justify"&gt;Este bus, en los procesadores de sobremesa, se utiliza para comunicar con el chipset y con los componentes periféricos. No es necesario un ancho de banda tan alto.&lt;/p&gt; &lt;p align="justify"&gt;La especificación HT3 hace mención de frecuencias máximas hasta los 6.4 GHz (igual que el QPI de Intel), AMD ha sido prudente y ha dejado un margen para mejoras futuras.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Frecuencias base de AMD Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;La versión de 8 cores y 4 módulos (serie FX-8000) llegará hasta los 3.6 GHz nominales, desde ahí desplegará los modos Turbo.&lt;/p&gt; &lt;p align="justify"&gt;Como comenté en el artículo anterior, AMD ha dotado a Bulldozer de un Turbo de dos fases:&lt;/p&gt; &lt;p&gt;&lt;a href="http://lh3.ggpht.com/-8EmBkLIxL3U/TlKrHJ24tbI/AAAAAAAAFHg/0julSCJoCTg/s1600-h/640_5%25255B3%25255D.jpg"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="640_5" border="0" alt="640_5" src="http://lh5.ggpht.com/-JJ00GwOnHkQ/TlKrIIE2KuI/AAAAAAAAFHk/1ZcIuGJrNMI/640_5_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="486"&gt;&lt;/a&gt;  &lt;p align="justify"&gt;&lt;font color="#809ec2"&gt;&lt;strong&gt;Fase 1, All Core Boost&lt;/strong&gt;:&lt;/font&gt; Todos los módulos (conjuntos de dos cores con su SIMD FPU Unit y los 2 MB de L2) aumentan su frecuencia por encima de la nominal si el TDP y la temperatura lo permite.  &lt;p align="justify"&gt;Se da en cargas de trabajo que implique a TODOS los cores, sea con carga parcial elevada o máxima 100%.  &lt;p align="justify"&gt;&lt;font color="#809ec2"&gt;&lt;strong&gt;Fase 2, Max Turbo Boost&lt;/strong&gt;:&lt;/font&gt; Si dos de los módulos (cuatro INT cores, dos SIMD FPUs y dos L2 de 2 MB) se hallan en estado Sleep C6 (power gated) el resto (los otros dos módulos) pueden incrementar su frecuencia hasta en 1 GHz sobre la nominal.  &lt;p align="justify"&gt;Esta implementación conlleva algunas consideraciones prestacionales extrañas y fastidiosas que detallaré cuando tenga hardware funcional comercial en las manos.  &lt;p align="justify"&gt;Se rumorean modos Turbo de hasta 1 GHz extra, es decir, hasta 4.6 GHz en carga 100% de 2 módulos, con los otros dos módulos en estado gated CC6.&lt;/p&gt; &lt;p align="justify"&gt;En este caso tendríamos la siguiente capacidad de proceso:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;4 INT cores a 4.6 GHz en carga de enteros (compresión de datos por ejemplo).&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2 FPUs AVX de 256 bit en cargas de coma flotante AVX a 4.6 GHz.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2 FPUs dobles de 128 bit en cargas de coma flotante SSE o AVX de 128 bit a 4.6 GHz.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Más información en breve.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#4bacc6"&gt;&lt;strong&gt;Actualización 07 Septiembre 2011:&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En primer lugar: &lt;font color="#ffff80"&gt;&lt;strong&gt;Frecuencia máxima en modo Turbo Core&lt;/strong&gt;&lt;/font&gt;: el modelo tope de gama FX-8150 (se enpecual con un FX-8170 para Q1 2012) será de 4.2 GHz con carga parcial de cores, probablemente con un máximo de 4 cores al 100%. Lo que no está nada mal manteniendo un TDP de 125W.&lt;/p&gt; &lt;p align="justify"&gt;En segundo lugar: &lt;strong&gt;&lt;font color="#ffff80"&gt;Nuevo evento de AMD en San Francisco para el día 13 de Septiembre:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" alt="AMD Fusion Zone Cocktail Reception" src="http://amd-member.com/newsletters/devcentral/images/1109/EM-NA-EN-HDR-DEV-FusionZoneRecep-Sep2011-625x288.jpg" width="625" height="288"&gt;  &lt;p style="line-height: 18px; padding-left: 10px; padding-right: 6px; font-family: " align="justify"&gt;&lt;font face="Verdana"&gt;&lt;strong&gt;&lt;font style="font-size: 9pt"&gt;Hanging out in San Francisco the week of September 12th? Not finding anything interesting?&lt;/font&gt;&lt;/strong&gt;&lt;font style="font-size: 9pt"&gt;&lt;br&gt;AMD to the rescue. We'll be making an historic announcement, and want you to be a part of it.&lt;br&gt;&lt;br&gt;AMD invites you to join us for an entertaining evening on the beautiful &lt;strong&gt;&lt;em&gt;Yerba Buena Terrace at the St. Regis San Francisco&lt;/em&gt;&lt;/strong&gt;. Spend the evening exploring the latest AMD technology, mingling with AMD executives and technology partners, all while enjoying cocktails and hors d'oeuvres. Be sure to arrive before 7:00pm to hear our big news first hand.&lt;/font&gt;&lt;/font&gt;&lt;/p&gt; &lt;table style="line-height: 18px" border="0" cellspacing="0" cellpadding="0" width="625" align="center"&gt; &lt;tbody&gt; &lt;tr style="line-height: 18px; font-family: ; color: "&gt; &lt;td width="20"&gt;&amp;nbsp;&lt;/td&gt; &lt;td width="80" align="right"&gt;&lt;font face="Verdana"&gt;&lt;em&gt;&lt;font style="font-size: 9pt"&gt;When:&lt;/font&gt;&lt;/em&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td width="356"&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt;Tuesday, September 13, 2011&lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td valign="top" rowspan="4" width="169" align="right"&gt;&lt;a href="http://fusionzone.eventbrite.com"&gt;&lt;img border="0" alt="RSVP" src="http://amd-member.com/images/btn-rsvp2.gif"&gt;&lt;/a&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt; &lt;tr style="line-height: 18px; font-family: ; color: "&gt; &lt;td&gt;&amp;nbsp;&lt;/td&gt; &lt;td style="line-height: 18px" align="right"&gt;&lt;font face="Verdana"&gt;&lt;em&gt;&lt;font style="font-size: 9pt"&gt;Where:&lt;/font&gt;&lt;/em&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td&gt;&lt;a style="color: " href="http://www.starwoodhotels.com/stregis/property/area/map.html?propertyID=1511"&gt;&lt;font color="#009966" face="Verdana"&gt;&lt;u&gt;&lt;font style="font-size: 9pt"&gt;St. Regis Hotel, Yerba Buena Terrace&lt;/font&gt;&lt;/u&gt;&lt;/font&gt;&lt;/a&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt;, San Francisco&lt;/font&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt; &lt;tr style="line-height: 18px; font-family: ; color: "&gt; &lt;td&gt;&amp;nbsp;&lt;/td&gt; &lt;td style="line-height: 18px" valign="top" align="right"&gt;&lt;font face="Verdana"&gt;&lt;em&gt;&lt;font style="font-size: 9pt"&gt;Time:&lt;/font&gt;&lt;/em&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td valign="top"&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt;6pm - 9 pm PDT&lt;/font&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt; &lt;tr style="line-height: 18px; font-family: ; color: "&gt; &lt;td&gt;&amp;nbsp;&lt;/td&gt; &lt;td style="line-height: 18px" valign="top" align="right"&gt;&lt;font face="Verdana"&gt;&lt;em&gt;&lt;font style="font-size: 9pt"&gt;RVSP:&lt;/font&gt;&lt;/em&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td valign="top"&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt;by September 9, 2011 at &lt;/font&gt;&lt;/font&gt;&lt;font style="font-size: 9pt"&gt;&lt;a style="color: " href="http://fusionzone.eventbrite.com"&gt;&lt;font color="#ffffff" face="Verdana"&gt;&lt;u&gt;fusionzone.eventbrite.com&lt;/u&gt;&lt;/font&gt;&lt;/a&gt;&lt;/font&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt; (password: &lt;strong&gt;AMD&lt;/strong&gt;)&lt;/font&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt; &lt;table style="line-height: 18px" border="0" cellspacing="0" cellpadding="10" width="625"&gt; &lt;tbody&gt; &lt;tr style="line-height: 16px; font-family: ; color: "&gt; &lt;td style="font-family: ; color: " valign="top"&gt;&lt;font face="Verdana"&gt;&lt;strong&gt;&lt;font style="font-size: 9pt"&gt;Contact Information:&lt;/font&gt;&lt;/strong&gt;&lt;font style="font-size: 9pt"&gt;&lt;br&gt;Heather J Lennon&lt;br&gt;Sr. Manager Public Relations, AMD&lt;br&gt;&lt;/font&gt;&lt;/font&gt;&lt;font style="font-size: 9pt"&gt;&lt;a href="mailto:Heather.Lennon@amd.com?subject=Re:%20AMD%20Fusion%20Zone%20Event,%20San%20Fransico%202011"&gt;&lt;font color="#009966" face="Verdana"&gt;&lt;span&gt;&lt;u&gt;Heather.Lennon@amd.com&lt;/u&gt;&lt;/span&gt;&lt;/font&gt;&lt;/a&gt;&lt;/font&gt;&lt;font face="Verdana"&gt;&lt;font style="font-size: 9pt"&gt; &lt;/font&gt;&lt;/font&gt;&lt;/td&gt; &lt;td style="font-family: ; color: " valign="top"&gt;&amp;nbsp;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;a style="line-height: 18px" href="http://fusionzone.eventbrite.com"&gt;&lt;img border="0" alt="RSVP now" src="http://amd-member.com/images/rsvpnowbtn2.gif" width="96" height="21"&gt;&lt;/a&gt; &lt;p align="center"&gt;13 de Septiembre ¿Será el día de lanzamiento de Bulldozer?&lt;/p&gt; &lt;p align="justify"&gt;Por último: Hoy &lt;font color="#ffff80"&gt;&lt;strong&gt;AMD ha confirmado el comienzo de la venta de CPUs Interlagos&lt;/strong&gt;&lt;/font&gt; de 16 cores para servidores a los integradores de sistemas. El primer chip con micro arquitectura Bulldozer.&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;"This is a monumental moment for the industry as this first 'Bulldozer' core represents the beginning of unprecedented performance scaling for x86 CPUs," said Rick Bergman, senior vice president and general manager, AMD Products Group. "The flexible new 'Bulldozer' architecture will give Web and datacenter customers the scalability they need to handle emerging cloud and virtualization workloads." &lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;Para más información acerca de Bulldozer:&lt;/p&gt; &lt;p&gt;&lt;font style="background-color: #141414"&gt;En múltiples artículos he analizado en detalle el diseño interno de BD 32 nm. Cito los más destacables:&lt;/font&gt;  &lt;blockquote&gt; &lt;p&gt;&lt;a title="AMD Bulldozer- HotChips23 &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/08/amd-bulldozer-hotchips23.html"&gt;&lt;strong&gt;AMD Bulldozer- HotChips23 – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a title="AMD Bulldozer. Perspectivas &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/07/amd-bulldozer-perspectivas.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;AMD Bulldozer. Perspectivas – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/l3-cache-amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;La L3 cache multibanco en AMD Bulldozer. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-int-cores.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://professionalsat.blogspot.com/2010/08/amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;AMD Bulldozer – ProfessionalSAT&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;La micro arquitectura de AMD Bulldozer. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;Novedades y expectativas 2010. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;AMD Bulldozer. Prestaciones estimadas – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;Micro arquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;font style="background-color: #141414"&gt; &lt;/font&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html"&gt;&lt;strong&gt;&lt;font style="background-color: #141414"&gt;Previo AMD Bulldozer. Actualizado – LowLevelHardware&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:4c207c70-2953-4fef-ab90-a36ff331055c" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD+6990" rel="tag"&gt;AMD 6990&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Zambezi" rel="tag"&gt;Zambezi&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Turbo+Core" rel="tag"&gt;Turbo Core&lt;/a&gt;,&lt;a href="http://technorati.com/tags/HotChips" rel="tag"&gt;HotChips&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Micro+arquitectura" rel="tag"&gt;Micro arquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/module" rel="tag"&gt;module&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6061477637860092189?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6061477637860092189/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/09/modelos-y-frecuencias-de-amd-bulldozer.html#comment-form" title="17 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6061477637860092189?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6061477637860092189?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/ncV8AOs-PC8/modelos-y-frecuencias-de-amd-bulldozer.html" title="AMD Bulldozer. Frecuencias finales. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/-ph0wPx89tMs/TmetSavNwaI/AAAAAAAAFH0/EP4X84PfdEY/s72-c/InterlagosMCM_thumb%25255B1%25255D.jpg?imgmax=800" height="72" width="72" /><thr:total>17</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/09/modelos-y-frecuencias-de-amd-bulldozer.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0UEQngzeSp7ImA9WhdXEEk.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-3268831044514079427</id><published>2011-08-22T19:43:00.000+02:00</published><updated>2011-08-22T21:26:43.681+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-08-22T21:26:43.681+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Zambezi" /><category scheme="http://www.blogger.com/atom/ns#" term="experiencias" /><category scheme="http://www.blogger.com/atom/ns#" term="HotChips" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD Bulldozer: HotChips23 – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Estos días se está celebrando el &lt;a href="http://www.hotchips.org/" target="_blank"&gt;HotChips 23&lt;/a&gt;, una de las convenciones anuales donde se discuten los nuevos diseños de procesadores de sobremesa, servidores, memorias, procesadores de bajo consumo para dispositivos móviles… todo lo relacionado con el mundo del silicio en 2011.&lt;/p&gt; &lt;p align="justify"&gt;Y claro está, también ha habido alguna nueva información sobre Bulldozer y mucha viejas ideas “refritas” sobre este nuevo core. Lamentablemente, ninguna estimación prestacional, puro &lt;strong&gt;&lt;em&gt;silicon &lt;/em&gt;&lt;/strong&gt;para entendidos en la materia.&lt;/p&gt; &lt;p align="justify"&gt;AMD ha entrado en detalle en algunos aspectos del diseño del chip Zambezi (4 módulos y 8 INT cores) fabricado por Global Foundries en 32 nm SOI HKMG.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Nuevas fotografías del die de Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En este slide de la presentación en HotChips vemos una nueva toma del die de Bulldozer.&lt;/p&gt; &lt;p&gt;&lt;a href="http://lh6.ggpht.com/-Z1CUA7Jbmr0/TlKq4ziYkjI/AAAAAAAAFGo/K5g7K7RilfE/s1600-h/640_1%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_1" border="0" alt="640_1" src="http://lh5.ggpht.com/-Pp-UN6K7ZXM/TlKq5v5U8eI/AAAAAAAAFGs/1ok-8Z_8D7A/640_1_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="484"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Aparece con mayor altura que en anteriores vistas, si comparáis con anteriores artículos míos veréis claramente la diferencia. No hay modo de saber cual es la correcta, si esta o las antiguas (más alargadas), hasta que haya &lt;em&gt;samples&lt;/em&gt; comerciales.&lt;/p&gt; &lt;p align="justify"&gt;Ampliación del die:&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/-wsGMu-G-VcM/TlKq6ufVisI/AAAAAAAAFGw/bhsHLXsgTRk/s1600-h/640_2%25255B7%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_2" border="0" alt="640_2" src="http://lh6.ggpht.com/-4tbdxxp8_dw/TlKq7bP-f6I/AAAAAAAAFG0/rNISfuGsaXA/640_2_thumb%25255B3%25255D.jpg?imgmax=800" width="644" height="695"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Lo que me llama poderosamente la atención es la grandísima cantidad de espacio desaprovechado: No utilizado ni por cores (lógica) ni cachés ni por las controladoras de memoria y buses Hyper Transport 3.&lt;/p&gt; &lt;p align="justify"&gt;En varios de mis numerosos artículos sobre &lt;a href="http://lowlevelhardware.blogspot.com/2010/09/microarquitectura-intel-sandy-bridge.htmle, me explico:" target="_blank"&gt;Intel Sandy Bridge&lt;/a&gt;, mencioné el enrutado de todo el cableado del Ring Bus bajo la caché L3. Todo este esfuerzo de ingeniería se realizó para ahorrar espacio de die y reducir el tamaño de Sandy Bridge. Cito textualmente (&lt;font size="2"&gt;&lt;em&gt;Extraído de &lt;strong&gt;Microarquitectura Intel Sandy Bridge&lt;/strong&gt;. Parte 1. Actualizado – LowLevelHardware. Martes 14 de septiembre de 2010&lt;/em&gt;):&lt;/font&gt;&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;&lt;font size="2" face="Arial Narrow"&gt;&lt;em&gt;&lt;font size="4"&gt;“&lt;/font&gt; Lo más llamativo del bus en anillo de Sandy Bridge (y Nehalem EX) es su implementación respetuosa con el consumo y el área de die, me explico:&lt;/em&gt;&lt;/font&gt; &lt;p align="justify"&gt;&lt;font size="2" face="Arial Narrow"&gt;&lt;em&gt;Todos recordamos el famoso procesador Radeon HD 2900 de ATI con un ring bus de 512 bits, que debido a su desmesurada disipación térmica y consumo no pudo competir con sus análogos de nVidia hasta que ATI lo eliminó sustituyéndolo por una arquitectura convencional en su serie Radeon HD 3800.&lt;/em&gt;&lt;/font&gt; &lt;p align="justify"&gt;&lt;font size="2" face="Arial Narrow"&gt;&lt;em&gt;En Sandy Bridge Intel ha utilizado power gating y clock gating extensivamente, además de aplicar un voltaje bajísimo al ring bus para conseguir una disipación térmica muy baja.&lt;/em&gt;&lt;/font&gt; &lt;p align="justify"&gt;&lt;font size="2" face="Arial Narrow"&gt;&lt;em&gt;Por otro lado, es un dato muy importante, según los ingenieros de Intel, no ha representado un incremento de área ya que la infinidad de conductores necesarios para el Ring Bus se enrutan por otras capas del diseño bajo la caché L3&lt;font size="4"&gt;. “&lt;/font&gt;&lt;/em&gt;&lt;/font&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;AMD simplemente no dispone de los extensos recursos económicos y humanos de Intel y no puede permitirse el lujo de este tipo de optimizaciones, bastante tiene con llevar a cabo el diseño de un semiconductor de tal complejidad como Bulldozer. &lt;p align="justify"&gt;El espacio “muerto” lo he coloreado en &lt;strong&gt;&lt;font color="#a5a5a5"&gt;GRIS&lt;/font&gt;&lt;/strong&gt;, son muchos, muchos mm2:&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh5.ggpht.com/-j2bFEShtLDg/TlKq8fdNMTI/AAAAAAAAFG4/Q-yDXz7LP_Q/s1600-h/640_2B%25255B7%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_2B" border="0" alt="640_2B" src="http://lh6.ggpht.com/-vPHV6WrLwjQ/TlKq9-hQkfI/AAAAAAAAFG8/V3tFkhUb14Q/640_2B_thumb%25255B3%25255D.jpg?imgmax=800" width="644" height="695"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Superficie del die de AMD Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Por fin conocemos el verdadero tamaño de Bulldozer y debo decir que estoy algo decepcionado: nada menos que 315 mm2… muy caro de producir.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/-rnDQ-2ED948/TlKq-66GeNI/AAAAAAAAFHA/TnudJATWOcU/s1600-h/Bulldozer_Die_size%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="Bulldozer_Die_size" border="0" alt="Bulldozer_Die_size" src="http://lh4.ggpht.com/-_C5vVHGcPGo/TlKrAJIlYlI/AAAAAAAAFHE/DEvmr8fsOmM/Bulldozer_Die_size_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="544"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Estoy convencido de que AMD sin duda optimizará este diseño en sucesivas iteraciones (con el paso a 22 nm en un par de años) e incluso antes con el lanzamiento de la versión de 5 módulos y 20 cores producida también en 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Infraestructura de AMD Zambezi. AM3+&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh5.ggpht.com/-W0XcLGra_tI/TlKrBL_myGI/AAAAAAAAFHI/8N0cteXf2PQ/s1600-h/640_3%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_3" border="0" alt="640_3" src="http://lh4.ggpht.com/-8s0IeszPGIY/TlKrB7V-aNI/AAAAAAAAFHM/b52Z_Bev-MU/640_3_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="482"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Como vemos la versión de sobremesa de Bulldozer solo activa uno de los 4 enlaces HT3 para comunicación con el chipset (los demás permanecen deshabilitados, en su versión Opteron se utilizan como conexión directa con hasta tres chips más).&lt;/p&gt; &lt;p align="justify"&gt;La latencia L3 se me antoja como he comentado en numerosas ocasiones muy alta, creo firmemente que rondará los 50+ ciclos.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/-d5onO9-5yU8/TlKrFecSdhI/AAAAAAAAFHY/dv2zijSiimI/s1600-h/640_4%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_4" border="0" alt="640_4" src="http://lh4.ggpht.com/-H8Ti1sqACJw/TlKrGeAo5ZI/AAAAAAAAFHc/atCTM6yWXH4/640_4_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="486"&gt;&lt;/a&gt;&lt;/p&gt;     &lt;p align="justify"&gt;Ni rastro de las extrañas AGLU, ahora las llaman AGen, es decir una normal y corriente AGU. Además solamente hay dos pipes de enteros (INT pipes) una con circuitería MUL y la otra según AMD con un divisor por hardware (DIV). Viendo las latencias de división entera de Bulldozer me da la impresión de que tal divisor no existe y la división se ejecuta por micro código o tiene un diseño extremadamente simplificado y poco efectivo.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;AMD Turbo Core en Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En Bulldozer, AMD presenta un Turbo Core de dos niveles.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh3.ggpht.com/-8EmBkLIxL3U/TlKrHJ24tbI/AAAAAAAAFHg/0julSCJoCTg/s1600-h/640_5%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="640_5" border="0" alt="640_5" src="http://lh5.ggpht.com/-JJ00GwOnHkQ/TlKrIIE2KuI/AAAAAAAAFHk/1ZcIuGJrNMI/640_5_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="486"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;All Core Boost&lt;/strong&gt;: Todos los módulos (conjuntos de dos cores con su SIMD FPU Unit y los 2 MB de L2) aumentan su frecuencia por encima de la nominal si el TDP y la temperatura lo permite.&lt;/p&gt; &lt;p align="justify"&gt;Se da en cargas de trabajo que implique a TODOS los cores, sea con carga parcial elevada o máxima 100%.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;Max Turbo Boost&lt;/strong&gt;: Si dos de los módulos (cuatro INT cores, dos SIMD FPUs y dos L2 de 2 MB) se hallan en estado Sleep C6 (power gated) el resto (los otros dos módulos) pueden incrementar su frecuencia hasta en 1 GHz sobre la nominal.&lt;/p&gt; &lt;p align="justify"&gt;Esto conlleva algunas consideraciones prestacionales extrañas y fastidiosas que detallaré cuando tenga hardware funcional comercial en las manos. A ver si en un mes y algo…&lt;/p&gt; &lt;p&gt;En múltiples artículos he analizado en detalle el diseño interno de BD 32 nm. Cito los más destacables:  &lt;blockquote&gt; &lt;p&gt;&lt;a title="AMD Bulldozer. Perspectivas &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/07/amd-bulldozer-perspectivas.html"&gt;&lt;strong&gt;AMD Bulldozer. Perspectivas – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/l3-cache-amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;La L3 cache multibanco en AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-int-cores.html"&gt;&lt;strong&gt;AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html"&gt;&lt;strong&gt;AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://professionalsat.blogspot.com/2010/08/amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;AMD Bulldozer – ProfessionalSAT&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html"&gt;&lt;strong&gt;La micro arquitectura de AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html"&gt;&lt;strong&gt;Novedades y expectativas 2010. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html"&gt;&lt;strong&gt;AMD Bulldozer. Prestaciones estimadas – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html"&gt;&lt;strong&gt;Micro arquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;  &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html"&gt;&lt;strong&gt;Previo AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Poco se puede concluir hasta que no haya datos objetivos de steppings finales. Los actuales samples de Bulldozer son realmente lentos debido a numerosos bugs en los primeros steppings A y B1 que han hecho necesario deshabilitar características clave de las controladoras de memoria, cachés, &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/el-tlb-secreto-de-amd-parte-i.html" target="_blank"&gt;TLBs&lt;/a&gt;, etc.&lt;/p&gt; &lt;p align="justify"&gt;Queda ver como será Bulldozer con todos sus subsistemas a punto y cuales son las frecuencias finales comerciales. Sin duda estas no serán indicativas del verdadero potencial final en frecuencia de Bulldozer en 32 nm; AMD mejora sus procesos paso a paso a lo largo del tiempo en que este está en el mercado.&lt;/p&gt; &lt;p align="justify"&gt;La historia fue realmente brillante en 90 nm cuando culminó en unos excelentes 3.2 GHz con el Athlon 64 X2 6400+ partiendo de los iniciales 1.8 GHz.&lt;/p&gt; &lt;p align="justify"&gt;En el proceso de 65 nm SOI la historia fue diferente y empezó realmente mal. Los primeros Athlon 64 X2 eran claramente más lentos por ciclo (IPC) que los anteriores de 90 nm y les era imposible llegar a los 3 GHz. Con el tiempo llegaron a 3.1 GHz, un mal resultado e inferior al anterior de 90 nm SOI.&lt;/p&gt; &lt;p align="justify"&gt;En aquel tiempo AMD lanzó &lt;a href="http://lowlevelhardware.blogspot.com/2008/03/el-resurgir-de-phenom-el-stepping-b3-y.html" target="_blank"&gt;Barcelona (Phenom) quad core&lt;/a&gt; también en 65 nm con unas frecuencias decepcionantes de 2.3 GHz en pico y una ridículamente pequeña caché L3 de 2 MB y elevada latencia. Con los meses llegó a 2.6 GHz y por fin llegaron los 45 nm.&lt;/p&gt; &lt;p align="justify"&gt;Los 45 nm para AMD han sido un éxito rotundo, los &lt;a href="http://lowlevelhardware.blogspot.com/2008/03/el-resurgir-de-phenom-el-stepping-b3-y.html" target="_blank"&gt;Phenom II Shanghai&lt;/a&gt; subieron rápidamente de frecuencia y el incremento a 6M de la caché L3 le permitió ganar prestaciones por ciclo (IPC) respecto a Barcelona. A esto se añadió la excelente versión de 6 cores con Turbo Core, el Phenom II X6, también con 6 MB de L3.&lt;/p&gt; &lt;p align="justify"&gt;Gracias al exitoso proceso de 45 nm AMD ha podido sobrevivir con un anticuado diseño de CPU que data de 2003, (remozado en 2007 con Barcelona, aunque igual en la parte de enteros) y esto lo escribo en Agosto de 2011…&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;   &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:c0a5bcbb-2bb9-40d9-9fd1-18c1646de681" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Zambezi" rel="tag"&gt;Zambezi&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;,&lt;a href="http://technorati.com/tags/module" rel="tag"&gt;module&lt;/a&gt;,&lt;a href="http://technorati.com/tags/m%c3%b3dulo" rel="tag"&gt;m&amp;#243;dulo&lt;/a&gt;,&lt;a href="http://technorati.com/tags/core" rel="tag"&gt;core&lt;/a&gt;,&lt;a href="http://technorati.com/tags/mcro+arquitectura" rel="tag"&gt;mcro arquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/HotChips" rel="tag"&gt;HotChips&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-3268831044514079427?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/3268831044514079427/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/08/amd-bulldozer-hotchips23.html#comment-form" title="6 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3268831044514079427?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3268831044514079427?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/NK7j2McHOpM/amd-bulldozer-hotchips23.html" title="AMD Bulldozer: HotChips23 – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/-Pp-UN6K7ZXM/TlKq5v5U8eI/AAAAAAAAFGs/1ok-8Z_8D7A/s72-c/640_1_thumb%25255B1%25255D.jpg?imgmax=800" height="72" width="72" /><thr:total>6</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/08/amd-bulldozer-hotchips23.html</feedburner:origLink></entry><entry gd:etag="W/&quot;DUQCR3o9eSp7ImA9WhdSGUg.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-4322794789903502081</id><published>2011-07-29T18:32:00.000+02:00</published><updated>2011-07-29T18:36:06.461+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-07-29T18:36:06.461+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="CMT" /><category scheme="http://www.blogger.com/atom/ns#" term="Orochi" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="Opteron" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD Bulldozer. Perspectivas – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Mucho se está hablando en los círculos informáticos acerca de la nueva micro arquitectura Bulldozer de AMD. Un diseño pensado para cargas de trabajo multithread y con pipelines de ejecución con mayor número de etapas para un alto potencial en frecuencia.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/-S3mNChlTixI/TjLhUGIIbCI/AAAAAAAAFGI/Yq_1VEhlJvY/s1600-h/Orochi32nm_6403.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Orochi32nm_640" border="0" alt="Orochi32nm_640" src="http://lh4.ggpht.com/-01_mngj-BtE/TjLhVMoRy-I/AAAAAAAAFGM/WyNrzvQj8Q4/Orochi32nm_640_thumb1.jpg?imgmax=800" width="644" height="524"&gt;&lt;/a&gt;AMD Orochi 32 nm 8 MB L2 y 8 MB L3.&lt;/p&gt; &lt;p align="justify"&gt;En este artículo expondré algunas de mis opiniones sobre la micro arquitectura que va a marcar el futuro inmediato AMD de aquí a 2014.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;AMD Bulldozer y el proceso de 32 nm HKMG SOI&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En múltiples artículos he analizado en detalle el diseño interno de BD 32 nm. Cito los más destacables:&lt;/p&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a title="La L3 cache multibanco en AMD Bulldozer. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/04/l3-cache-amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;La L3 cache multibanco en AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="AMD AGLUs, Bulldozer INT cores. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-int-cores.html"&gt;&lt;strong&gt;AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a title="AMD Bulldozer. Primeros benchmarks. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html"&gt;&lt;strong&gt;AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="AMD Bulldozer &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/08/amd-bulldozer-professionalsat.html"&gt;&lt;strong&gt;AMD Bulldozer – ProfessionalSAT&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="La micro arquitectura de AMD Bulldozer. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html"&gt;&lt;strong&gt;La micro arquitectura de AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="Novedades y expectativas 2010. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html"&gt;&lt;strong&gt;Novedades y expectativas 2010. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="AMD Bulldozer. Prestaciones estimadas &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html"&gt;&lt;strong&gt;AMD Bulldozer. Prestaciones estimadas – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="Micro arquitectura AMD Bulldozer 2011. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html"&gt;&lt;strong&gt;Micro arquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a title="Previo AMD Bulldozer. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html"&gt;&lt;strong&gt;Previo AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;Bulldozer está fabricado por Global Foundries en el nodo de proceso de 32 nm HKMG (High K Metal Gate) SOI (Silicon On Insulator) lo que le dará unas buenas perspectivas de mejora de frecuencia y reducción de consumo con el paso del tiempo.&lt;/p&gt; &lt;p align="justify"&gt;AMD a lo largo de su historia se ha caracterizado por ofrecer una continua mejora de su proceso de fabricación de semiconductores a los largo de la vida de cada nodo (para AMD unos 2 o 3 años).&lt;/p&gt; &lt;p align="justify"&gt;Podemos decir que AMD saca al mercado los primeros chips en un nodo concreto (45 nm, 32 nm,…) cuando tiene unos yields (rendimientos de fabricación) mínimos (debido a la brutal presión competitiva de Intel) pero suficientes aún a costa de unas frecuencias de funcionamiento iniciales reducidas.&lt;/p&gt; &lt;p align="justify"&gt;Con el paso de los meses AMD va mejorando paso a paso el proceso y se va reduciendo la disipación térmica, el voltaje y aumenta la frecuencia máxima de sus diseños.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/-HobWQjMo_zw/TjLhV-Bu4eI/AAAAAAAAFGQ/R02_C3ZZT6M/s1600-h/GloFo32nm_6403.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="GloFo32nm_640" border="0" alt="GloFo32nm_640" src="http://lh6.ggpht.com/-6uYSGnwnkJ0/TjLhWgkpC1I/AAAAAAAAFGU/0rIg8Is-MX8/GloFo32nm_640_thumb1.jpg?imgmax=800" width="644" height="485"&gt;&lt;/a&gt;No es descabellado pensar en un 50% de mejora vs 45 nm para los 32 nm en AMD.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;AMD Orochi Bulldozer. 4 módulos, 8 INT cores, 4 dual 128 FMACs y 2 MB L2&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;AMD Orochi va a rondar los casi 300 mm2 y está constituido por:&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;4 módulos completos.&lt;/p&gt; &lt;p align="justify"&gt;4 bancos L3 de 2 MB y 16 vías (para un total de 8 MB L3 con 64 vías)&lt;/p&gt; &lt;p align="justify"&gt;4 buses HT 3.0&lt;/p&gt; &lt;p align="justify"&gt;2 controladoras DDR3 1866 MHz.&lt;/p&gt; &lt;p align="justify"&gt;Un North Bridge.&lt;/p&gt;&lt;/blockquote&gt; &lt;p&gt;&lt;font color="#ffff80" size="3"&gt;El módulo en AMD Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lh3.ggpht.com/-z_0mpbwPm0k/TjLhZRpLOKI/AAAAAAAAFGY/_ZA2eeIq5tA/s1600-h/Frontend3.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Frontend" border="0" alt="Frontend" src="http://lh4.ggpht.com/-J5ePC5zK9YM/TjLhcVfktJI/AAAAAAAAFGc/wbGUtX1C22U/Frontend_thumb1.png?imgmax=800" width="644" height="338"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Un módulo está integrado por:&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;2 INT cores con 2 ALUs y 2 AGUs, cada uno con su L1d de 16KB y 4 vías.&lt;/p&gt; &lt;p align="justify"&gt;El Instruction Fetching desde la L1i compartida de 64KB y 2 vías.&lt;/p&gt; &lt;p align="justify"&gt;La lógica de decoding de 4 vías con la Microcode ROM.&lt;/p&gt; &lt;p align="justify"&gt;El circuitería de Branch Prediction.&lt;/p&gt; &lt;p align="justify"&gt;La FPU doble de 128 bit FMAC (Fused Multiply Accumulate).&lt;/p&gt; &lt;p align="justify"&gt;La unidad de control de caché que comprende las dos WCC (Write Combining Caches de 4 KB, una por INT core) que da acceso a la masiva cache L2 de 2 MB y 16 vías.&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;¿Qué podemos esperar de AMD Bulldozer?&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Bulldozer al igual que Llano (la APU de 32 nm) se fabrican en el nuevo proceso y por ello sufrirán inicialmente de unas frecuencia máximas no muy elevadas.&lt;/p&gt; &lt;p align="justify"&gt;Llano se ha estrenado a frecuencias máximas de 2.9 GHz, ahora está previsto que llegue al mercado una versión desbloqueada a 3.1 GHz con overclocks “sencillos” a 3.6 GHz.&lt;/p&gt; &lt;p align="justify"&gt;Los cores de un Phenom II (al menos en los últimos steppings de 45 nm) llegan con relativa facilidad a los 4 GHz. A Llano esta frecuencia le queda lejos y eso que está fabricado en el siguiente nodo que debería proporcionar una mejora teórica de un 20% en frecuencia.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/-DKqF26Rk1x0/TjLhczjBJnI/AAAAAAAAFGg/BSWC_PaYhrQ/s1600-h/AMD-32-nm-vs-45-nm3.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="AMD 32 nm vs 45 nm" border="0" alt="AMD 32 nm vs 45 nm" src="http://lh4.ggpht.com/-GuvkT---Akg/TjLhdQU0I2I/AAAAAAAAFGk/R-tDqiXjbmU/AMD-32-nm-vs-45-nm_thumb1.png?imgmax=800" width="461" height="475"&gt;&lt;/a&gt;Disipación térmica: AMD 45 nm vs 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Recordemos que cuando AMD empezó a fabricar CPUs de 65 nm también padeció problemas claros de escalado de frecuencia, en concreto los primeros AMD K8 Brisbane funcionaban a 2.6 GHz cuando los “antiguos” K8 90 nm funcionaban sin problema a 3 GHz.&lt;/p&gt; &lt;p align="justify"&gt;O pensemos en AMD Phenom Barcelona, fabricado en 65 nm en 2007 y que salió al mercado a unos meros 2.3 GHz cuando los K8 de la época (todavía de 90 nm) funcionaban a 3.2 GHz (Athlon 64 X2 6400+).&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="4"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Con esta coyuntura en mente podemos pensar lo siguiente según los diversos rumores y leaks que circulan:&lt;/p&gt; &lt;p align="justify"&gt;Bulldozer, inicialmente en su configuración completa (Orochi) para socket AM3+ es deseable que ronde los 3.5 GHz nominales con carga 100% en los 8 cores y que gracias al Turbo logre frecuencias con carga de cores parcial (mitad de cores al 100%) rondando los 4 GHz.&lt;/p&gt; &lt;p align="justify"&gt;AMD postula precios de unos 300 dólares para el top bin de Orochi, eso le sitúa en la banda de precios del Intel Core i7 2600K Sandy bridge: En mi opinión sería un éxito rotundo de AMD el posicionarse competitivamente en este nivel de precios.&lt;/p&gt; &lt;p align="justify"&gt;A mí personalmente me cuesta creerlo pero sería una excelente noticia para la sana competencia en el sector.&lt;/p&gt; &lt;p align="justify"&gt;En cualquier caso estamos a la vuelta de la esquina del lanzamiento previsto para Bulldozer, será en Septiembre si no hay cambio de planes. Para AMD sería una excelente noticia, y de paso dispararía su cotización bursátil, bastante deprimida tras los momentos gloriosos de los K7 y K8.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 340px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:89ec9098-3d5d-4902-91ee-e558285ae97a" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD+6990" rel="tag"&gt;AMD 6990&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CMT" rel="tag"&gt;CMT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/modulo" rel="tag"&gt;modulo&lt;/a&gt;,&lt;a href="http://technorati.com/tags/module" rel="tag"&gt;module&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesador" rel="tag"&gt;procesador&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;,&lt;a href="http://technorati.com/tags/processor" rel="tag"&gt;processor&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AGLU" rel="tag"&gt;AGLU&lt;/a&gt;&lt;/div&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-4322794789903502081?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/4322794789903502081/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/07/amd-bulldozer-perspectivas.html#comment-form" title="2 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4322794789903502081?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4322794789903502081?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/SIOnTQeXY3E/amd-bulldozer-perspectivas.html" title="AMD Bulldozer. Perspectivas – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh4.ggpht.com/-01_mngj-BtE/TjLhVMoRy-I/AAAAAAAAFGM/WyNrzvQj8Q4/s72-c/Orochi32nm_640_thumb1.jpg?imgmax=800" height="72" width="72" /><thr:total>2</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/07/amd-bulldozer-perspectivas.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CEQBQ3w_fip7ImA9WhZbEU8.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-1714112747294142218</id><published>2011-04-28T18:53:00.000+02:00</published><updated>2011-06-15T09:19:12.246+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-06-15T09:19:12.246+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="cache" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="L3 cache" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>La L3 cache multibanco en AMD Bulldozer. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Poco a poco se acerca la comercialización de los procesadores basados en la nueva micro arquitectura de AMD prevista para el 7 de junio. &lt;font color="#809ec2"&gt;Actualización:&lt;/font&gt; finalmente llegará al mercado en Septiembre según los últimos roadmaps.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/-kq0sFHhmn7A/Tfhc1maP7-I/AAAAAAAAFFw/veAJoMx8LJI/s1600-h/Bulldozer_32nm_640%25255B6%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="Bulldozer_32nm_640" border="0" alt="Bulldozer_32nm_640" src="http://lh4.ggpht.com/-gOeM8gIECpw/Tfhc2q_RpSI/AAAAAAAAFF0/EPy8RQQp3hk/Bulldozer_32nm_640_thumb%25255B2%25255D.jpg?imgmax=800" width="644" height="523"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Conforme pasan los días se va filtrando nueva información sobre su estructura interna y también algunos datos acerca de su rendimiento, o por lo menos del rendimiento de algunos Engineering Samples.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TbmesdZljHI/AAAAAAAAE8g/7kuuIzeYzgs/s1600-h/Bullzorer_Module6.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Bullzorer_Module" border="0" alt="Bullzorer_Module" src="http://lh5.ggpht.com/__p96Ony2voA/TbmetM8D_aI/AAAAAAAAE8k/B8e5IeFUiIk/Bullzorer_Module_thumb2.jpg?imgmax=800" width="455" height="332"&gt;&lt;/a&gt;Bajo el módulo con su L2 de 2 MB se observa el banco de L3 de 2 MB y 16 vías.&lt;/p&gt; &lt;p align="justify"&gt;En este artículo hablaré sobre la estructura de la caché L3 en Bulldozer y sobre su funcionamiento.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;La caché L3 multibanco: 4 x 2 MB&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;AMD ha diseñado una caché L3 particionada en 4 sub arrays de 2 MB y 16 vías cada uno. la capacidad total en el chip de 4 módulos y 8 INT cores es de 8 MB y 64 vías de asociatividad.&lt;/p&gt; &lt;p align="justify"&gt;El diseño es &lt;a href="http://en.wikipedia.org/wiki/CPU_cache#Exclusive_versus_inclusive" target="_blank"&gt;exclusivo&lt;/a&gt;, la L3 no incluye los datos presentes en la L2 de 2 MB de cada módulo y en cambio es una &lt;a href="http://en.wikipedia.org/wiki/CPU_cache#Victim_cache" target="_blank"&gt;Victim Cache&lt;/a&gt;, donde se alojan las páginas desalojadas desde L2.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Tbmetzraw-I/AAAAAAAAE8o/Sy-97vDNe1s/s1600-h/L3_13.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="L3_1" border="0" alt="L3_1" src="http://lh5.ggpht.com/__p96Ony2voA/Tbmeuk0J5TI/AAAAAAAAE8s/0xLxul2rgVk/L3_1_thumb1.jpg?imgmax=800" width="644" height="365"&gt;&lt;/a&gt;La frecuencia estimada para la L3 es de 2.4 GHz.&lt;/p&gt; &lt;p align="justify"&gt;Con una frecuencia estimada en 2.4 GHz los anchos de banda son los siguientes:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;307.2 GB/s&lt;/strong&gt; en lectura gracias a sus dos accesos por ciclo de 128 bit y por módulo.&lt;/div&gt;2 400 000 ciclos/s x 4 módulos x (2 accesos/ciclo x 128 bit) = 2 457 600 000 bit / 8bits/1 byte = 307 200 000 bytes/s = 307.2 GB/s  &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;153.6 GB/s&lt;/strong&gt; en escritura gracias al acceso de 128 bit por ciclo.&lt;/div&gt;2 400 000 ciclos/s x 4 módulos x 128 bit = 1 228 800 000 bit / 8bits/1 byte =152 600 000 bytes/s = 153.6 GB/s&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Por lo que se desprende de este documento, la caché L3 está conectada con cada módulo Bulldozer mediante dos buses de lectura de 128 bit y un bus de escritura de 128 bit. Se me antoja una mejora absolutamente espectacular respecto a anteriores diseños de AMD (un Phenom II X6, por ejemplo, solamente cuenta con un bus de 64 bit por core hacia y desde la L3 de 6 MB y 24 vías). De ahí sus mediocres resultados en este apartado.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#4bacc6"&gt;&lt;strong&gt;Especulación 1. &lt;/strong&gt;&lt;/font&gt;Espero latencias L3 elevadas en Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;Teniendo en cuanta que la latencia efectiva L3 (load to use) es aditiva con la de los demás niveles y que la latencia L2 ya es conocida y va de los 18 a los 20 ciclos no será nada extraño que la latencia L3 efectiva en Bulldozer ronde los 50 ciclos.&lt;/p&gt; &lt;p align="justify"&gt;Otro dato que apunta en la misma dirección es que se mantiene el diseño asíncrono con buffers de sincronización de Shanghai (Phenom II 45 nm), con una frecuencia de cores variable por los modos Turbo desde los 2.8 hasta los 3.5 GHz, será difícil conseguir bajas latencias L3.&lt;/p&gt; &lt;p align="justify"&gt;Por último, una asociatividad tan elevada, 64 vías, aunque aumenta la tasa de aciertos L3, tampoco ayuda en cuanto a la latencia ya que hay que examinar 64 localizaciones cada vez en busca del dato o instrucción.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;8 MB = 4 bancos de 2 MB y 16 vías&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Una solución elegante que podría haber adoptado AMD consiste en que cada core tenga una latencia reducida de acceso hacia su banco local L3, es decir, que tenga “privilegio” de acceso a este banco y por ello mayor ancho de banda en GB/s y menor latencia en ciclos.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh5.ggpht.com/-6lxFZhAhK1U/Tfhc3YUPALI/AAAAAAAAFF4/BtQr4PrpOsk/s1600-h/Bulldozer_32nm_L3_640%25255B3%25255D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="Bulldozer_32nm_L3_640" border="0" alt="Bulldozer_32nm_L3_640" src="http://lh5.ggpht.com/-_qsDBg5cv9A/Tfhc4A-0hFI/AAAAAAAAFF8/1SHebxo8Pv0/Bulldozer_32nm_L3_640_thumb%25255B1%25255D.jpg?imgmax=800" width="644" height="199"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Esto sólo lo descubriremos en la práctica en cuanto le “echemos el guante” a un stepping final (comercial) de Bulldozer, lo tendremos el día 7 de Junio. &lt;font color="#809ec2"&gt;Actualización:&lt;/font&gt; Bulldozer estará finalmente disponible en Septiembre si se cumplen las previsiones.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;AMD ha diseñado una caché L3 que marca un punto de partida desde sus actuales diseños de 45 nm y 6MB con 24 vías (Shanghai o Istambul). En Bulldozer son 4 bancos de 2 MB y 16 vías para un total de 64 vías.&lt;/p&gt; &lt;p align="justify"&gt;Tengo ganas de probar un stepping final para ver si la latencia a cada uno de los bancos es diferente o por el contrario idéntica. Si existe una controladora de L3 para los 4 bancos será una latencia constante y elevada… en cambio, si cuenta (como Sandy Bridge) con una controladora L3 por cada banco de 2 MB pueden haber sorpresas.&lt;/p&gt; &lt;p align="justify"&gt;En todo caso y con una L2 con 18 – 20 ciclos es difícil lograr latencias l3 muy recortadas. E s lógico esperar 10 ciclos más de latencia que en Sandy Bridge como mínimo (la L2 de SB tiene pipelines de 10 etapas Load to Use).&lt;/p&gt; &lt;p align="justify"&gt;Destaca su optimización pensando en una baja disipación térmica y sobretodo en un consumo reducido, por ello su frecuencia rondará los 2.4 GHz y su voltaje estará sobre los 1.15 a 1.20 V efectivos. Es un diseño convencional, de bus con conectividad total entre todos los agentes, cada módulo Bulldozer y cada slice L3.&lt;/p&gt; &lt;p align="justify"&gt;Hay que ser consciente del camino absolutamente divergente que ha adoptado Intel con Sandy Bridge 32 nm. La L3 es síncrona a los cores y funciona a la misma frecuencia que estos. Con ello consigue una bajísima latencia y un ancho de banda astronómico. Los diferentes bancos L3 se comunican entre sí mediante un ring bus bidireccional que aporta un gran ancho de banda y un funcionamiento “sencillo” a estos niveles.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:2ac1a0ea-025b-44ca-adc3-c980ae5ee434" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Cache+L3" rel="tag"&gt;Cache L3&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-1714112747294142218?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/1714112747294142218/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/04/l3-cache-amd-bulldozer-professionalsat.html#comment-form" title="5 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1714112747294142218?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1714112747294142218?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/TMUbTED942M/l3-cache-amd-bulldozer-professionalsat.html" title="La L3 cache multibanco en AMD Bulldozer. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh4.ggpht.com/-gOeM8gIECpw/Tfhc2q_RpSI/AAAAAAAAFF0/EPy8RQQp3hk/s72-c/Bulldozer_32nm_640_thumb%25255B2%25255D.jpg?imgmax=800" height="72" width="72" /><thr:total>5</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/04/l3-cache-amd-bulldozer-professionalsat.html</feedburner:origLink></entry><entry gd:etag="W/&quot;AkEHQH8_fSp7ImA9WhZXEE0.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-660489467302850088</id><published>2011-04-17T20:36:00.000+02:00</published><updated>2011-04-28T18:37:11.145+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-04-28T18:37:11.145+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="Orochi" /><category scheme="http://www.blogger.com/atom/ns#" term="CMT" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;En este técnico artículo voy a detallar la estructura de los pipelines de ejecución de los INT cores duales de un módulo del nuevo procesador AMD Bulldozer.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TbmXqbRZKDI/AAAAAAAAE8I/KywwRWXqinE/s1600-h/int_cluster%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="int_cluster" border="0" alt="int_cluster" src="http://lh5.ggpht.com/__p96Ony2voA/TbmXrCmXMxI/AAAAAAAAE8M/LUWoT34nB0Q/int_cluster_thumb%5B1%5D.jpg?imgmax=800" width="644" height="256"&gt;&lt;/a&gt;Uno de los núcleos de enteros de Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;AMD Bulldozer. Filosofía de diseño.&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Con Bulldozer AMD ha roto con el diseño “convencional” para el núcleo de procesamiento. Hasta ahora, un procesador era un bloque que trabajaba conjunta y síncronamente compuesto de varias subunidades.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Tas8XSjm-AI/AAAAAAAAE7o/xGrwnbbvrz4/s1600-h/Bulldozer%5B4%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Bulldozer" border="0" alt="Bulldozer" src="http://lh5.ggpht.com/__p96Ony2voA/Tas8XwiqrKI/AAAAAAAAE7s/yO6ei1hGtks/Bulldozer_thumb%5B1%5D.png?imgmax=800" width="541" height="273"&gt;&lt;/a&gt;AMD Bulldozer: Cada INT core y la unidad SIMD son funcionalmente independientes.&lt;/p&gt; &lt;p align="justify"&gt;En cambio en Bulldozer, AMD ha seguido un diseño&amp;nbsp; &lt;a href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html" target="_blank"&gt;&lt;strong&gt;CMT (Cluster Multi Processing)&lt;/strong&gt;&lt;/a&gt; de coprocesamiento con subunidades independientes y con pipelines desacoplados mediante buffers y queues.&lt;/p&gt; &lt;p align="justify"&gt;Las ventaja principal de esta disposición reside en la compartición de algunas estructuras entre los dos cores de enteros. Cada core ejecuta un thread, cada thread debería afinitizarse a un core para dar un óptimo rendimiento.&lt;/p&gt; &lt;p align="justify"&gt;Aunque alguna de las unidades esté bloqueada procesando datos el Front End sigue ejecutando Fetching y computando los Branches llenando sus queues (colas) y buffers con resultados.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TZn7Zm2FciI/AAAAAAAAE6c/ulV9vNgvXnI/s1600-h/Orochi%5B3%5D.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="Orochi" border="0" alt="Orochi" src="http://lh3.ggpht.com/__p96Ony2voA/TZn7csv_d9I/AAAAAAAAE6g/YEFRSX-wKsw/Orochi_thumb%5B1%5D.png?imgmax=800" width="644" height="527"&gt;&lt;/a&gt;Die de Bulldozer con 4 módulos y 8 INT cores.&lt;/p&gt; &lt;p align="justify"&gt;Resumiendo, con Bulldozer AMD construye un procesador multicore de 8 núcleos partiendo de una unidad que llaman el módulo que incluye 2 INT cores, la unidad SIMD y la L2 de 2 MB y 16 vías.&lt;/p&gt; &lt;p align="justify"&gt;A lo largo de los dos últimos años he escrito varios artículos sobre AMD Bulldozer:&lt;/p&gt; &lt;blockquote&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html" target="_blank"&gt;&lt;strong&gt;AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://professionalsat.blogspot.com/2010/08/amd-bulldozer-professionalsat.html" target="_blank"&gt;&lt;strong&gt;AMD Bulldozer – ProfessionalSAT&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html" target="_blank"&gt;&lt;strong&gt;La micro arquitectura de AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html" target="_blank"&gt;&lt;strong&gt;Novedades y expectativas 2010. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html" target="_blank"&gt;&lt;strong&gt;AMD Bulldozer. Prestaciones estimadas – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html" target="_blank"&gt;&lt;strong&gt;Micro arquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html" target="_blank"&gt;&lt;strong&gt;Previo AMD Bulldozer. Actualizado – LowLevelHardware&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p&gt;&lt;font color="#ffff80" size="3"&gt;AMD Bulldozer Front End.&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El frontend de Bulldozer es compartido por todas las subunidades y está dimensionado y lógicamente desacoplado de las unidades de ejecución.&lt;/p&gt; &lt;p align="justify"&gt;Cada módulo contiene un sólo Front End que da servicio a tres unidades de ejecución:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Los dos INT cores con 4 pipelines de ejecución cada uno y con su Scheduler y Register File privados.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La unidad SIMD compartida (llamada desacertadamente por AMD y la prensa especializada FPU compartida) con su Schedule y Register File.&lt;/div&gt; &lt;div align="justify"&gt;Yo la llamo unidad SIMD porque no sólo incluye (como detallaré en otro artículo) dos pipelines SIMD SSE, AVX y X87 sino también 2 unidades de 128 bit SIMD de enteros SSE y MMX (INT SIMD SSE y MMX).&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/Tas8aTIUJgI/AAAAAAAAE7w/qQxMMMVF0zU/s1600-h/Frontend%5B4%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Frontend" border="0" alt="Frontend" src="http://lh4.ggpht.com/__p96Ony2voA/Tas8dHuU4KI/AAAAAAAAE70/3QvR-kF5Gv0/Frontend_thumb%5B1%5D.png?imgmax=800" width="644" height="338"&gt;&lt;/a&gt;En rojo resaltado el Front End de AMD Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;El Front End contiene entre otros:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;La lógica de &lt;font color="#ffff80"&gt;Branch Prediction&lt;/font&gt;&lt;/strong&gt; que ha sido considerablemente rediseñada y ampliada de cara a aumentar su tasa de aciertos. Cuenta con un BTB de 2 niveles con miss penalties (penalización de fallo) de 15 a 20 ciclos en función del tipo de Branch.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;Las etapas de&lt;/strong&gt; &lt;strong&gt;&lt;font color="#ffff80"&gt;fetching y decoding&lt;/font&gt;&lt;/strong&gt; cargan datos (32 bytes/ciclo) desde las cachés L1i (64 KB, 2 vías) y alimentan dos ventanas de 16 bytes (una por thread). Hay un IBB (Instruction Byte Buffers) de 16 niveles en la cola de fetching por thread (2 IBBs, con cada 16 bytes por nivel).&lt;/div&gt; &lt;div align="justify"&gt;Los Decoders pueden decodificar hasta 4 instrucciones / ciclo desde los IBB, cada ciclo se escanean dos de las ventanas de 16 bytes en busca de hasta cuatro instrucciones. En caso de instrucciones X86 complejas que hagan recurrir al Microcode Engine solamente se decodifica una instrucción por ciclo.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Bulldozer INT cores. Unidades de enteros.&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Cada unidad de enteros es como un pequeño core de ejecución de 64 bit con 4 pipelines discretos alimentados por un Scheduler independiente.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/Tas8fX8rQTI/AAAAAAAAE74/0nSBru_JJfo/s1600-h/INTcores%5B4%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="INTcores" border="0" alt="INTcores" src="http://lh5.ggpht.com/__p96Ony2voA/Tas8hw4-VtI/AAAAAAAAE78/sV3t4JmM2wk/INTcores_thumb%5B1%5D.png?imgmax=800" width="644" height="338"&gt;&lt;/a&gt;En verde y azul los dos INT cores de un módulo Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;El núcleo de ejecución consta de 4 pipelines de 64 bit con un diseño peculiar y novedoso que incluye las unidades combinadas AGLU:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/Tas8iU58hCI/AAAAAAAAE8A/XoHbFhov5g4/s1600-h/Bulldozer_INT_PIPES%5B4%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="Bulldozer_INT_PIPES" border="0" alt="Bulldozer_INT_PIPES" src="http://lh6.ggpht.com/__p96Ony2voA/Tas8i38HKEI/AAAAAAAAE8E/egRNxi2NNFs/Bulldozer_INT_PIPES_thumb%5B1%5D.png?imgmax=800" width="541" height="273"&gt;&lt;/a&gt;Cuatro unidades de ejecución de enteros con Scheduler común.&lt;/p&gt; &lt;p align="justify"&gt;La longitud de los pipelines de enteros ha crecido en Bulldozer de un modo espectacular hasta las 18 o 20 etapas. Comparado con las 12 etapas de AMD Phenom destaca como un diseño claramente dirigido a altas frecuencias que en mi modesta opinión sólo tiene sentido si supera con claridad los 4 GHz en modos Turbo para compensar su gran penalización en caso de fallo de predicción Branch.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TbmXrnLgA7I/AAAAAAAAE8Q/pKTpilmICKw/s1600-h/INT_cores%5B7%5D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="INT_cores" border="0" alt="INT_cores" src="http://lh5.ggpht.com/__p96Ony2voA/TbmXsIUbMhI/AAAAAAAAE8U/SP5lHubjPss/INT_cores_thumb%5B3%5D.jpg?imgmax=800" width="322" height="140"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="center"&gt;Los dos INT cores que forman parte de un módulo en AMD Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;Lo novedoso de los INT cores son sus unidades híbridas &lt;font color="#ffff80"&gt;AGLU&lt;/font&gt;:&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;Son unidades AGU (de generación de direcciones de memoria, address generators) pero con funciones básicas ALU, es decir, pueden procesar instrucciones simples ALU (LEA 64, INC) echando una mano para compensar el escaso ancho de proceso del core.&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TbmXs0UaJbI/AAAAAAAAE8Y/bE2V1NG_qpU/s1600-h/int_cluster_AGLUS%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px; padding-top: 0px" title="int_cluster_AGLUS" border="0" alt="int_cluster_AGLUS" src="http://lh5.ggpht.com/__p96Ony2voA/TbmXtuXFPhI/AAAAAAAAE8c/M3rUCopIOrk/int_cluster_AGLUS_thumb%5B1%5D.jpg?imgmax=800" width="644" height="256"&gt;&lt;/a&gt;Resaltadas las dos AGLUs pertenecientes a uno de los INT cores.&lt;/p&gt; &lt;p align="justify"&gt;Las unidades de ejecución completas (Full ALU) EX0 y EX1 incluyen hardware específico para IMUL e IDIV:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;EX0&lt;/strong&gt; contiene una unidad de &lt;font color="#ffff80"&gt;división de enteros&lt;/font&gt; parcialmente pipelinizada y con latencia y capacidad de proceso variable en función de la precisión. Aunque examinando detenidamente la documentación parece que &lt;u&gt;&lt;em&gt;más bien se trata de una unidad “virtual”&lt;/em&gt;&lt;/u&gt; ya que la instrucción IDIV se decodifica en el Microcode Engine y se secuencia en instrucciones sencillas ALU que se ejecutan en EX0. Además incluye una unidad para LZCNT y POPCNT.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;strong&gt;EX1&lt;/strong&gt; por su parte contiene un rapidísimo &lt;font color="#ffff80"&gt;multiplicador de enteros&lt;/font&gt; pipelinizado y de bajísima latencia.&lt;/div&gt; &lt;li&gt;Ambas unidades procesan Branches e instrucciones de enteros complejas.&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Cada INT core cuenta con su Scheduler discreto e independiente y ejecuta un thread, además supervisa el procesamiento en las unidad SIMD compartida de las instrucciones FPU X87, FPU SIMD SSE / AVX&amp;nbsp; o INT SIMD MMX / SSE.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El diseño de Bulldozer me deja un sabor agridulce, AMD sin duda ha dado un paso adelante y si consigue ponerlo en el mercado a frecuencias adecuadas (4 GHz o más en Turbo Mode) tendrá un procesador globalmente competitivo con Sandy Bridge.&lt;/p&gt; &lt;p align="justify"&gt;Hay detalles que sinceramente no me acaban de convencer como algunas latencias muy elevadas en algunas instrucciones y sin duda será inferior a Sandy Bridge en proceso FPU AVX 256 bit.&lt;/p&gt; &lt;p align="justify"&gt;Bulldozer puede ser un excelente procesador en cargas de enteros de 8 threads, queda la incógnita acerca del rendimiento de su caché L3 y el subsistema de memoria.&lt;/p&gt; &lt;p align="justify"&gt;Las latencias L3 serán altas, creo que superiores a los 50 ciclos load to use, razonable me parecen 60 incluso. Hay que ver como compensa efectivamente el Hardware Prefetch este hecho. La elevada latencia L2 (de 18 a 20 ciclos) la compensa parcialmente su gran tamaño (Sandy Bridge se conforma con 256 KB, 8 veces menos, pero con latencias de 9-10 ciclos).&lt;/p&gt; &lt;p align="justify"&gt;Tengamos en cuenta que la frecuencia del Uncore que incluye la caché L3 multibanco (4 bancos de 2 MB) de 8 MB será muy inferior a la de los cores, probablemente se mueva sobre los 2.4 – 2.66 GHz lo que afectará a la latencia L3 y de memoria.&lt;/p&gt; &lt;p align="justify"&gt;El panorama en 2011 será divertido… nos vemos en la próxima entrega con un análisis de la unidad SIMD de 4 vías compartida de proceso FPU SSE / AVX / X87 y INT SIMD SSE / MMX.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: justify; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: justify; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: justify"&gt;&lt;font style="text-align: justify; background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 478px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:8e780b08-3203-4840-a2f4-c09afcb71a05" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CMT" rel="tag"&gt;CMT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Orochi" rel="tag"&gt;Orochi&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Opteron" rel="tag"&gt;Opteron&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Micro+arquitectura" rel="tag"&gt;Micro arquitectura&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-660489467302850088?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/660489467302850088/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-int-cores.html#comment-form" title="4 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/660489467302850088?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/660489467302850088?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/VThZX-JyRtI/amd-bulldozer-int-cores.html" title="AMD AGLUs, Bulldozer INT cores. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/__p96Ony2voA/TbmXrCmXMxI/AAAAAAAAE8M/LUWoT34nB0Q/s72-c/int_cluster_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>4</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-int-cores.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CEMAR384cSp7ImA9WhZREE8.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-1608508176218380097</id><published>2011-04-04T18:14:00.000+02:00</published><updated>2011-04-05T18:54:06.139+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-04-05T18:54:06.139+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="CMT" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Mucho se ha hablado en los últimos días de los resultados prestacionales aparecidos en internet de dos Engineering Samples del nuevo procesador AMD Bulldozer.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TZn7Zm2FciI/AAAAAAAAE6c/ulV9vNgvXnI/s1600-h/Orochi%5B3%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Orochi" border="0" alt="Orochi" src="http://lh3.ggpht.com/__p96Ony2voA/TZn7csv_d9I/AAAAAAAAE6g/YEFRSX-wKsw/Orochi_thumb%5B1%5D.png?imgmax=800" width="644" height="527"&gt;&lt;/a&gt;Die de Bulldozer con 4 módulos y 8 INT cores.&lt;/p&gt; &lt;p align="justify"&gt;Los resultados han aparecido en OpenBenchmarking.org. Se trata de la versión para servidores (Opteron) de Bulldozer, en unas máquinas configuradas con 2 chips Magny Cours (MCM de dos dies de 8 INT cores cada una, total por chip: 16 INT cores) para un total de 32 INT cores:&lt;/p&gt; &lt;p align="justify"&gt;&lt;a title="http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_2" href="http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_2"&gt;&lt;strong&gt;http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_2&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;a title="http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_28" href="http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_28"&gt;&lt;strong&gt;http://openbenchmarking.org/s/AMD%20Eng%20Sample%20ZS182045TGG43_28&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://openbenchmarking.org/" target="_blank"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="obo-logo-header[1]" border="0" alt="obo-logo-header[1]" src="http://lh4.ggpht.com/__p96Ony2voA/TZn7dTXhbKI/AAAAAAAAE6k/13w3W4sm_pU/obo-logo-header14.png?imgmax=800" width="320" height="79"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Debo expresar mis reservas sobre, no tanto la veracidad de los resultados, si no sobre la representatividad de estos datos. Por lo que se deriva del análisis de las puntuaciones en estos benchmarks, está claro que es un stepping muy temprano de Bulldozer, funcionando sobre placas base pre-release y con BIOS sin optimización alguna.&lt;/p&gt; &lt;p align="justify"&gt;Los hechos que apuntan a estas conclusiones son,principalmente, el ínfimo rendimiento en algunos de los tests que afectan al subsistema de memoria.&lt;/p&gt; &lt;p align="justify"&gt;Es muy posible que en estos procesadores haya algunas características clave desactivadas o deshabilitadas que degradan terriblemente el rendimiento. Algunos de las unidades previsiblemente desactivadas son los siguientes:&lt;/p&gt; &lt;ol&gt; &lt;li&gt; &lt;div align="justify"&gt;El Probe Filter, encargado de reducir el tráfico de coherencia entre las cachés de cada die. Recordemos que en los sistemas de pruebas hay dos CPUs MCM (Multi Chip Module) para 4 dies en total (32 INT cores y 16 nódulos).&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;El último nivel de los TLB.&lt;/div&gt;&lt;/li&gt;&lt;/ol&gt; &lt;p align="justify"&gt;Los resultados de &lt;a href="http://www.cs.virginia.edu/stream/ref.html" target="_blank"&gt;Stream&lt;/a&gt; son tan bajos que claramente apuntan en esta dirección: unos meros 6 GB/s.&lt;/p&gt; &lt;p align="justify"&gt;Un sistema equivalente actual de AMD con dos chips Magny Cours (MCM de dos dies de 6 cores. 12 cores en total por chip. 24 cores por sistema) supera los 27 GB/s en el mismo test.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TZn7exIE7FI/AAAAAAAAE6o/1rX3ANL-eok/s1600-h/Bullzorer_Module%5B3%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Bullzorer_Module" border="0" alt="Bullzorer_Module" src="http://lh4.ggpht.com/__p96Ony2voA/TZn7gVg99DI/AAAAAAAAE6s/rgBkkt6-x04/Bullzorer_Module_thumb%5B1%5D.png?imgmax=800" width="475" height="350"&gt;&lt;/a&gt;Uno de los módulos de Bulldozer con 2 INT cores y sus cachés L2 2 MB y L3 2 MB.&lt;/p&gt; &lt;p align="justify"&gt;Otras dudas que me asaltan sobre estos chips ES son las siguientes:&lt;/p&gt; &lt;ol&gt; &lt;li&gt; &lt;div align="justify"&gt;¿Estará activado o no el Turbo Mode? Yo personalmente abogo por que no. El variar la frecuencia de una CPU en funcionamiento no es precisamente un proceso sencillo. Exige mucha validación y tunning de BIOS así como de la parte eléctrica de la placa base y no suele estar disponible hasta los steppings finales.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La frecuencia del uncore o North Bridge que comprende los cuatro bancos de 2 MB de caché L3 es desconocida y con seguridad muy inferior a la final.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;¿Se hace uso de AVX en el código del conjunto de pruebas? Y si es es así, en qué modo.&lt;/div&gt;&lt;/li&gt;&lt;/ol&gt; &lt;p align="justify"&gt;Seguramente la frecuencia de 1.8 / 1.9 GHz apuntada en los resultados sea fija y no aumente los 500 MHz que AMD ha estipulado para el Turbo Mode en Bulldozer con carga full threaded.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TZn7i6v-SlI/AAAAAAAAE6w/X9ivZtvQA8k/s1600-h/Bullzorer_Module_Croquis%5B3%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Bullzorer_Module_Croquis" border="0" alt="Bullzorer_Module_Croquis" src="http://lh3.ggpht.com/__p96Ony2voA/TZn7loBX0WI/AAAAAAAAE60/Fj2QZ4cex7s/Bullzorer_Module_Croquis_thumb%5B1%5D.png?imgmax=800" width="644" height="338"&gt;&lt;/a&gt;Distribución de unidades en un módulo de Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Frecuencias probables de las versiones comerciales&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Las frecuencias finales de los Opteron Interlagos (MCM de 2 dies de 8 INT cores en un chip) de 16 INT cores (8 nódulos) probablemente rondarán inicialmente los 2.4 – 2.8 GHz más los 500 MHz en carga gracias al Turbo.&lt;/p&gt; &lt;p align="justify"&gt;En los diseños de sobremesa, el octal core (8 INT cores, 4 módulos) es razonable y deseable que al menos esté sobre los 3.0 – 3.4 GHz inicialmente. Me queda la duda sobre la frecuencia del North Bridge y los 4 bancos de L3 de 2 MB, lo lógico sería que no bajase de los 2.4 GHz.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Pequeño apunte, prestaciones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En proceso de enteros, Bulldozer parece ser un buen diseño multithread pero con graves limitaciones en código single threaded comparado con Sandy Bridge.&lt;/p&gt; &lt;p align="justify"&gt;En coma flotante X87 o SSE no romperá records de velocidad en cálculo paralelo, aunque tendrá un excelente rendimiento single threaded.&lt;/p&gt; &lt;p align="justify"&gt;La posición de Bulldozer en el mercado de CPUs dependerá principalmente de la frecuencia final del diseño. Si el octal core de sobremesa se queda en los 3.2 GHz (más los 500 MHz del Turbo) pasará serias dificultades frente a &lt;a href="http://professionalsat.blogspot.com/2011/04/intel-z68-y-el-futuro-x79.html" target="_blank"&gt;Sandy Bridge E&lt;/a&gt; (la versión para expertos de SB, prevista para Q4 de 2011).&lt;/p&gt; &lt;p align="justify"&gt;Si se acerca a los 4 GHz podrá plantarle cara en igualdad de condiciones.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Poco puedo sacar en claro de estos escasos datos inconexos y con un extrema falta de contexto. Es prácticamente desconocida la información sobre la configuración hardware y software y sobre las condiciones de las pruebas.&lt;/p&gt; &lt;p align="justify"&gt;En mi opinión estos primeros resultados constituyen una guía y más bien un umbral mínimo en las prestaciones de los steppings comerciales de Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;Una observación que me impresiona y sorprende al analizar los datos es que en algunos tests Interlagos mejora los resultados de Magny Cours hasta en un 28 % pero en otros obtiene una velocidad de solamente un 60% (normalizando Magny Cours al 100%).&lt;/p&gt; &lt;p align="justify"&gt;Me recuerda a los benchmarks de los sistemas Pentium 4 comparados con los AMD Athlon o Pentium III… Esperemos que solo sea una desafortunada primera impresión… Aunque mis análisis micro arquitecturales de Bulldozer hasta la fecha apuntan en esta dirección.&lt;/p&gt; &lt;p align="justify"&gt;&amp;nbsp;&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="line-height: normal; widows: 2; text-transform: none; text-indent: 0px; letter-spacing: normal; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font style="background-color: #141414" color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 427px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:e97c620a-1058-41c6-a9f0-1de3b7ac276d" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Benchmark" rel="tag"&gt;Benchmark&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Orochi" rel="tag"&gt;Orochi&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-1608508176218380097?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/1608508176218380097/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html#comment-form" title="1 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1608508176218380097?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1608508176218380097?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/sP-3OLJl3VE/amd-bulldozer-primeros-benchmarks.html" title="AMD Bulldozer. Primeros benchmarks. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/TZn7csv_d9I/AAAAAAAAE6g/YEFRSX-wKsw/s72-c/Orochi_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>1</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/04/amd-bulldozer-primeros-benchmarks.html</feedburner:origLink></entry><entry gd:etag="W/&quot;DkAEQXo8fSp7ImA9Wx9aFEw.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6482254679036551521</id><published>2011-02-15T17:30:00.000+01:00</published><updated>2011-03-06T13:31:40.475+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-06T13:31:40.475+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="cache" /><category scheme="http://www.blogger.com/atom/ns#" term="Sandy Bridge" /><category scheme="http://www.blogger.com/atom/ns#" term="memoria" /><title>Intel Core i7 2600 K. Análisis cachés L0i 6 KB y L3 unificada 8 MB – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Con Sandy Bridge, Intel ha innovado en el diseño de cachés y como primicia nos ofrece una caché L0i (caché de instrucciones) que contiene instrucciones ya decodificadas procedentes de la caché L1 de 32 KB y 8 vías a través de los decoders x86.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;La micro op cache o L0i de 1500 micro ops&lt;/font&gt;&lt;/p&gt;  &lt;p align="center"&gt;&lt;font color="#ffff80" size="3"&gt;&lt;/font&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TVa3M5jBhzI/AAAAAAAAE1c/hshAM2EqEd4/s1600-h/DCache_RAM_Lat_rmma_20110209_055954_0734%5B1%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="DCache_RAM_Lat_rmma_20110209_055954_0734" border="0" alt="DCache_RAM_Lat_rmma_20110209_055954_0734" src="http://lh3.ggpht.com/__p96Ony2voA/TVa3NfnflsI/AAAAAAAAE1g/vq_CBNtDR88/DCache_RAM_Lat_rmma_20110209_055954_0734_thumb%5B1%5D.png?imgmax=800" width="644" height="484" /&gt;&lt;/a&gt;Data caches: observamos las cuatro zonas de caché y la RAM.&lt;/p&gt;  &lt;p align="justify"&gt;La caché de instrucciones de nivel 0 (L0i) de los procesadores Sandy Bridge es una caché de micro operaciones, es decir, de instrucciones ya descodificadas en un formato interno, propietario del procesador.&lt;/p&gt;  &lt;p align="justify"&gt;Para un análisis a fondo de la micro op cache os recomiendo el siguiente enlace:&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a title="Intel Sandy Bridge Core i7 2600 K. Análisis X86 decoders y L0i micro op cache – ProfessionalSAT" href="http://professionalsat.blogspot.com/2011/03/intel-sandy-bridge-core-i7-2600-k.html"&gt;&lt;strong&gt;Intel Sandy Bridge Core i7 2600 K. Análisis X86 decoders y L0i micro op cache – ProfessionalSAT&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;  &lt;p align="justify"&gt;La caché L1i e igualmente los niveles superiores contienen las complicadas instrucciones X86 sin descodificar. Intel, que en su día diseño la ISA X86, sabe que es compleja y a veces absurda en su arquitectura y por ello ha tomado esta medida novedosa, la inclusión de un nuevo nivel de caché L0.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TVa3OCwc95I/AAAAAAAAE1k/4hZrKqD75ts/s1600-h/SB_uopcache%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="SB_uopcache" border="0" alt="SB_uopcache" src="http://lh3.ggpht.com/__p96Ony2voA/TVa3Ox11WXI/AAAAAAAAE1o/T1vGz9gBe3w/SB_uopcache_thumb%5B1%5D.jpg?imgmax=800" width="604" height="414" /&gt;&lt;/a&gt;L0i en Sandy Bridge.&lt;/p&gt;  &lt;p align="justify"&gt;La tasa de aciertos se cifra en torno al 80% para un tamaño sobre los 6 KB y una transferencia pico de 32 bytes / ciclo.&lt;/p&gt;  &lt;p align="justify"&gt;En las prueba de bajo nivel que he realizado su tamaño efectivo ronda los 2 a 4 KB, con unas latencias prácticamente ridículas de 2 ciclos load to use en lectura secuencial o en acceso pseudo aleatorio.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TVa3PldoRLI/AAAAAAAAE1s/f9PCzx_dqzA/s1600-h/rmma_20110209_064736_0281%5B1%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="rmma_20110209_064736_0281" border="0" alt="rmma_20110209_064736_0281" src="http://lh4.ggpht.com/__p96Ony2voA/TVa3QHjhFgI/AAAAAAAAE1w/ugUPbM8s8y8/rmma_20110209_064736_0281_thumb%5B1%5D.png?imgmax=800" width="644" height="484" /&gt;&lt;/a&gt;Instruction cache: la L0i obtiene una increíble latencia de &lt;strong&gt;2 ciclos&lt;/strong&gt;.&lt;/p&gt;  &lt;p align="justify"&gt;En acceso aleatorio puro (random access) su tasa de aciertos es cero (lógicamente las instrucciones no pueden estar decodificadas y cacheadas previamente a su petición ya que se trata de un patrón aleatorio) y se dan en su caso aciertos de L1i (L1i hits) con los habituales 4 ciclos de latencia.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Caché L3 unificada y multibanco de 8 MB y 16 vías&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Sandy Bridge cuenta con una L3 con cuatro bancos de 2 MB y 16 vías. El acceso al banco local de cada core se hace directamente y con baja latencia. A los otros tres bancos&amp;#160; se llega a través del Ring Bus.&lt;/p&gt;  &lt;p align="center"&gt;&lt;img alt="SB_4C_630p_cores" src="http://lh6.ggpht.com/__p96Ony2voA/TB37lcZbcaI/AAAAAAAAESQ/Vni_TqL8Zkw/SB_4C_630p_cores_thumb%5B1%5D.png?imgmax=800" /&gt;Sandy Bridge 32 nm. Bajo cada core está su banco local L3 de 2 MB.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TVa3QlTbpmI/AAAAAAAAE10/ygiExXWMoAk/s1600-h/L3_Lat_2048K_M2_rmma_20110211_135757_0687%5B1%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="L3_Lat_2048K_M2_rmma_20110211_135757_0687" border="0" alt="L3_Lat_2048K_M2_rmma_20110211_135757_0687" src="http://lh4.ggpht.com/__p96Ony2voA/TVa3RPy5CFI/AAAAAAAAE14/5qgJto-7kM4/L3_Lat_2048K_M2_rmma_20110211_135757_0687_thumb%5B1%5D.png?imgmax=800" width="644" height="484" /&gt;&lt;/a&gt;Acceso L3 con bloque de 2048 KB.&lt;/p&gt;  &lt;p align="justify"&gt;La latencia efectiva se sitúa en los 34 ciclos en acceso pseudo aleatorio y en 40 ciclos en modo random (aleatorio). Son resultados muy brillantes.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TFaVLxpXL1I/AAAAAAAAEVw/1SomRxYfqvg/s1600-h/SandyBridge_die4.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="SandyBridge_die" border="0" alt="SandyBridge_die" src="http://lh6.ggpht.com/__p96Ony2voA/TFaVN-_IYzI/AAAAAAAAEV0/UCuHQleQJNg/SandyBridge_die_thumb2.png?imgmax=800" width="644" height="237" /&gt;&lt;/a&gt;El core de Sandy Bridge junto con su banco local L3 de 2 MB.&lt;/p&gt;  &lt;p align="justify"&gt;Para tamaños de acceso mayores de 2 MB, el núcleo de ejecución se ve obligado a acceder a bancos de L2 de 2 MB no locales a través del Ring Bus. Por ello, lógicamente la latencia se incrementa.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TVa3Rl8SyCI/AAAAAAAAE18/NTXPRrkd56Y/s1600-h/L3_Lat_6144K_M2_rmma_20110211_140032_0843%5B1%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="L3_Lat_6144K_M2_rmma_20110211_140032_0843" border="0" alt="L3_Lat_6144K_M2_rmma_20110211_140032_0843" src="http://lh4.ggpht.com/__p96Ony2voA/TVa3SF0RHaI/AAAAAAAAE2A/EuPY-oFaIj4/L3_Lat_6144K_M2_rmma_20110211_140032_0843_thumb%5B1%5D.png?imgmax=800" width="644" height="484" /&gt;&lt;/a&gt;Acceso L3 con bloque de 6 MB (6144 KB).&lt;/p&gt;  &lt;p align="justify"&gt;En los Core i7 2600K contamos con la implementación completa de cuatro bancos L3 para un total de 8 MB, en otras versiones inferiores Intel deshabilita uno de los bancos quedando en 6 MB L3.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Esperad en breve una ampliación de este artículo, tengo bastantes datos técnicos y microarquitecturales que agregar pero voy realmente mal de tiempo… En concreto estoy preparando un análisis más exhaustivo de la L0i o micro op cache incluyendo una investigación del ancho de banda de descodificación con distintos tipos de instrucciones.&lt;/p&gt;  &lt;p align="justify"&gt;Espero que con esta pequeña introducción tengáis material suficiente para pensar como se mejora un diseño ya excelente partiendo de un core Nehalem / Westmere.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;font face="Arial"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 418px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:693964ad-236f-495d-b7a9-5e919731a321" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/cores" rel="tag"&gt;cores&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sandy+Bridge" rel="tag"&gt;Sandy Bridge&lt;/a&gt;,&lt;a href="http://technorati.com/tags/2600K" rel="tag"&gt;2600K&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sistemas" rel="tag"&gt;Sistemas&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Procesador" rel="tag"&gt;Procesador&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6482254679036551521?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6482254679036551521/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/02/intel-core-i7-2600-k-analisis-caches.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6482254679036551521?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6482254679036551521?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/VmnaGZ9U-Ew/intel-core-i7-2600-k-analisis-caches.html" title="Intel Core i7 2600 K. Análisis cachés L0i 6 KB y L3 unificada 8 MB – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/TVa3NfnflsI/AAAAAAAAE1g/vq_CBNtDR88/s72-c/DCache_RAM_Lat_rmma_20110209_055954_0734_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/02/intel-core-i7-2600-k-analisis-caches.html</feedburner:origLink></entry><entry gd:etag="W/&quot;Dk8FSXc9eip7ImA9Wx9aFEw.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6104238333658484370</id><published>2011-02-13T17:53:00.000+01:00</published><updated>2011-03-06T13:33:38.962+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-06T13:33:38.962+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="SATA bug" /><category scheme="http://www.blogger.com/atom/ns#" term="Sandy Bridge" /><title>Intel Series 6 chipsets stepping B3 – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Intel ha anunciado que a partir del 14 de Febrero estarán disponibles los primeros samples del renovado stepping B3 de los chipsets de la serie 6 afectados por el bug en las controladores SATA2.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://qdms.intel.com/dm/d.aspx/034C09F1-2F86-45A0-8A51-85A33E4B4969/PCN110456-00.pdf"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Intel_P67_H67_B3_01" border="0" alt="Intel_P67_H67_B3_01" src="http://lh6.ggpht.com/__p96Ony2voA/TXN_ExGTClI/AAAAAAAAE3o/RosVMAlY4u8/Intel_P67_H67_B3_014.png?imgmax=800" width="589" height="177" /&gt;&lt;/a&gt;&lt;a href="http://qdms.intel.com/dm/d.aspx/034C09F1-2F86-45A0-8A51-85A33E4B4969/PCN110456-00.pdf"&gt;&lt;strong&gt;&lt;font size="2"&gt;Intel Product Change Notification 110456 – 00.&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Verdaderamente es llamativo como en un periodo de tiempo tan reducido han logrado producir chips funcionales con el error de diseño corregido.&lt;/p&gt;  &lt;p align="justify"&gt;Para un análisis profundo del tema os recomiendo otros de mis artículos:&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a title="Intel Sandy Bridge- Análisis de situación – ProfessionalSAT" href="http://professionalsat.blogspot.com/2011/02/intel-sandy-bridge-analisis-de.html"&gt;&lt;strong&gt;&lt;font size="2"&gt;Intel Sandy Bridge- Análisis de situación – ProfessionalSAT&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a title="Cougar Point Intel 6 Series Chipset SATA2 bug. Actualizado – ProfessionalSAT" href="http://professionalsat.blogspot.com/2011/02/intel-6-series-chipsets-sata-bug.html"&gt;&lt;strong&gt;&lt;font size="2"&gt;Cougar Point Intel 6 Series Chipset SATA2 bug. Actualizado – ProfessionalSAT&lt;/font&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TXN_Fl7O6kI/AAAAAAAAE3s/lVHXuMsBRTw/s1600-h/Intel_P67_H67_B3_023.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="Intel_P67_H67_B3_02" border="0" alt="Intel_P67_H67_B3_02" src="http://lh4.ggpht.com/__p96Ony2voA/TXN_GQH7eKI/AAAAAAAAE3w/cFYaQed0L48/Intel_P67_H67_B3_02_thumb1.png?imgmax=800" width="614" height="613" /&gt;&lt;/a&gt;El nuevo B3 es pin compatible con los anteriores diseños.&lt;/p&gt;  &lt;p align="justify"&gt;En principio los fabricantes de placas base empezarán a recibir los primeros chips el día 14, es decir, mañana mismo. Desde ese momento comenzará la fabricación de las nuevas placas.&lt;/p&gt;  &lt;p align="justify"&gt;Incluso se especula en que en algunos diseños sería posible desoldar el chip B2 defectuoso sustituyéndolo por el nuevo B3 sin cambiar la placa ni otros cambios.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TXN_GzwxTfI/AAAAAAAAE30/fx8hC9TsBcY/s1600-h/Intel_P67_H67_B3_033.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="Intel_P67_H67_B3_03" border="0" alt="Intel_P67_H67_B3_03" src="http://lh5.ggpht.com/__p96Ony2voA/TXN_IYoECKI/AAAAAAAAE34/qucogTJ4dJk/Intel_P67_H67_B3_03_thumb1.png?imgmax=800" width="644" height="471" /&gt;&lt;/a&gt;Lista de chipsets afectados.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones:&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Quizás haya suerte y en breve tengamos placas funcionales y libres de errores para poder montar los primeros sistemas Sandy Bridge de sobremesa con garantías.&lt;/p&gt;  &lt;p align="justify"&gt;En cualquier caso, en mi opinión, Intel debe hacer &lt;strong&gt;&lt;em&gt;algo más&lt;/em&gt;&lt;/strong&gt; para recuperar la confianza, en muchos casos perdida y en otros debilitada, del consumidor final. La gente de Intel lo sabe y espero que obren en consecuencia con medidas claras.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font color="#4bacc6" face="Arial"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font color="#4bacc6" face="Arial"&gt;&lt;font style="background-color: #141414; font-size: 9.8pt"&gt;&lt;/font&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; padding-left: 0px; width: 470px; padding-right: 0px; display: block; float: none; margin-left: auto; margin-right: auto; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:dcc2e505-fba7-4825-b5cd-0ddd9b14c3ab" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel+serios+6" rel="tag"&gt;Intel serios 6&lt;/a&gt;,&lt;a href="http://technorati.com/tags/chipsets" rel="tag"&gt;chipsets&lt;/a&gt;,&lt;a href="http://technorati.com/tags/SATA2+bug" rel="tag"&gt;SATA2 bug&lt;/a&gt;,&lt;a href="http://technorati.com/tags/experiencias" rel="tag"&gt;experiencias&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6104238333658484370?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6104238333658484370/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2011/02/intel-series-6-chipsets-stepping-b3.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6104238333658484370?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6104238333658484370?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/qwH6jAifkgw/intel-series-6-chipsets-stepping-b3.html" title="Intel Series 6 chipsets stepping B3 – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/TXN_ExGTClI/AAAAAAAAE3o/RosVMAlY4u8/s72-c/Intel_P67_H67_B3_014.png?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2011/02/intel-series-6-chipsets-stepping-b3.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0MDR38zeSp7ImA9Wx9UFUQ.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-7910335023314649295</id><published>2010-11-03T20:27:00.001+01:00</published><updated>2011-02-13T11:04:36.181+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-02-13T11:04:36.181+01:00</app:edited><title>Módulos DDR3 de 4 GB. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Estos días estoy realizando algunos experimentos con módulos DDR3 de 4 GB de capacidad en un Core i7 930 a 4.2 GHz (181 MHz X23 Turbo Mode) con un total de 12 GB. En sendos artículos de ProfessionalSAT detallo algunos aspectos de sistemas diseñados con estos componentes:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;&lt;a title="Windows 7 X64 Ultimate y 24 GB de DDR3 – ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/11/windows-7-x64-ultimate-y-24-gb-de-ddr3.html"&gt;Windows 7 X64 Ultimate y 24 GB de DDR3 – ProfessionalSAT&lt;/a&gt;&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;&lt;a title="24 GB y 18 GB en Core i7 930 – ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/11/24-gb-y-18-gb-en-core-i7-930.html"&gt;24 GB y 18 GB en Core i7 930 – ProfessionalSAT&lt;/a&gt;&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TNG4Nkv4E_I/AAAAAAAAEjc/VF62mMLfIwQ/s1600-h/3DIMM_4GB_DDR3_1333%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="3DIMM_4GB_DDR3_1333" border="0" alt="3DIMM_4GB_DDR3_1333" src="http://lh4.ggpht.com/__p96Ony2voA/TNG4OtlIQ5I/AAAAAAAAEjg/dwrJgVKXv4w/3DIMM_4GB_DDR3_1333_thumb%5B1%5D.jpg?imgmax=800" width="634" height="318" /&gt;&lt;/a&gt;3 DIMM DDR3 1333 de 4 GB cada uno.&lt;/p&gt;  &lt;p align="justify"&gt;Las primeras conclusiones son las siguientes:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;No puedo configurarlos como hago normalmente con sus homólogos de 2 GB a 7-7-7-14 1T en placas base de socket 1366 para Core i7 de la serie 900, en este caso solo he conseguido llegar a 8-8-8-24 2T de manera estable.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;También noto una disipación térmica superior dando una temperatura en carga 100% bastante elevada en los chips, siendo recomendable una refrigeración directa.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Su frecuencia máxima con timings nominales 9-9-9-27 2T llega a 1500 MHz a 1.64V.&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TNG4PWu_c5I/AAAAAAAAEjk/y4Aza9mbi-M/s1600-h/DSCF0522%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="DSCF0522" border="0" alt="DSCF0522" src="http://lh5.ggpht.com/__p96Ony2voA/TNG4QQcmYqI/AAAAAAAAEjo/bkvmdHGwj68/DSCF0522_thumb%5B1%5D.jpg?imgmax=800" width="634" height="476" /&gt;&lt;/a&gt;Los chips son bastante mayores en superficie que sus análogos de 2 GB.&lt;/p&gt;  &lt;p align="justify"&gt;Ésta cantidad de memoria (12 GB) ayuda sobremanera a Windows 7 X64, sobretodo en compresión de grandes volúmenes de datos con 7zip en modo LZMA2 8 threads con grandes tamaños de diccionario. Es una tarea que ejecuto rutinariamente y el tiempo de compresión decrece de modo notable.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TNG4RFySg8I/AAAAAAAAEjs/ILo9ky9kAQ8/s1600-h/DSCF0521%5B7%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="DSCF0521" border="0" alt="DSCF0521" src="http://lh5.ggpht.com/__p96Ony2voA/TNG4R6QsBkI/AAAAAAAAEjw/rTe9dX657t4/DSCF0521_thumb%5B3%5D.jpg?imgmax=800" width="634" height="462" /&gt;&lt;/a&gt;Detalle de uno de los chips.&lt;/p&gt;  &lt;p align="justify"&gt;Otra posible utilización de esta cantidad de memoria para un usuario que no la necesite por su mix software es asignar 4 GB para un &lt;a href="http://professionalsat.blogspot.com/2010/03/ramdisk-en-intel-core-i7-triple-channel.html"&gt;disco RAM (RAMDisk)&lt;/a&gt; quedándonos con 8 GB de memoria para el sistema operativo.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TNG4Stlre9I/AAAAAAAAEj0/FiUQwK7fPX0/s1600-h/DSCF0523%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" title="DSCF0523" border="0" alt="DSCF0523" src="http://lh5.ggpht.com/__p96Ony2voA/TNG4TjO1NYI/AAAAAAAAEj4/KyEURqSpLxo/DSCF0523_thumb%5B1%5D.jpg?imgmax=800" width="634" height="425" /&gt;&lt;/a&gt;Kingston KVR1333D3N9/4G&lt;/p&gt;  &lt;p align="justify"&gt;Sin duda en poco tiempo veremos nuestros sistemas poblados por módulos de esta capacidad conforme su precio baje en comparación con sus homólogos de 2 GB.&lt;/p&gt;  &lt;p align="justify"&gt;Cuando los fabricantes de memoria pasen al siguiente nodo de fabricación, con la consiguiente reducción de voltaje y superficie del die, estaremos en condiciones de aumentar la frecuencia de módulos de esta capacidad sin problemas.&lt;/p&gt;  &lt;p style="line-height: 1.4" align="justify"&gt;&lt;font face="Arial"&gt;&lt;font style="font-size: 9.8pt" color="#4bacc6"&gt;&lt;strong&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/strong&gt;&lt;/font&gt;&lt;/font&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:e95aa409-914f-40dc-add9-cf931cc95041" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/DDR3" rel="tag"&gt;DDR3&lt;/a&gt;,&lt;a href="http://technorati.com/tags/memoria" rel="tag"&gt;memoria&lt;/a&gt;,&lt;a href="http://technorati.com/tags/4GB" rel="tag"&gt;4GB&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-7910335023314649295?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/7910335023314649295/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/11/modulos-ddr3-de-4-gb-lowlevelhardware.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7910335023314649295?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7910335023314649295?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/7YxFkmG4Hzw/modulos-ddr3-de-4-gb-lowlevelhardware.html" title="Módulos DDR3 de 4 GB. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh4.ggpht.com/__p96Ony2voA/TNG4OtlIQ5I/AAAAAAAAEjg/dwrJgVKXv4w/s72-c/3DIMM_4GB_DDR3_1333_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/11/modulos-ddr3-de-4-gb-lowlevelhardware.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0IFSHcyfCp7ImA9Wx9UFUQ.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-2009196719352572310</id><published>2010-11-01T20:19:00.000+01:00</published><updated>2011-02-13T11:05:19.994+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-02-13T11:05:19.994+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="netburst" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="trace cache" /><category scheme="http://www.blogger.com/atom/ns#" term="pentium 4" /><title>Microarquitectura en imágenes (I) Execution Trace cache. Actualizado – LowLevelHardware</title><content type="html">&lt;div align="justify"&gt;La&lt;strong&gt; &lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;Execution&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; Trace Cache&lt;/strong&gt; es uno de los signos &lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_0" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;identificativos&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; de la antigua arquitectura &lt;a href="http://www.intel.com/technology/itj/q12001/pdf/art_2.pdf"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_1" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;Intel&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_2" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;Netburst&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;. Almacena instrucciones ya descodificadas en orden de programa (traces). Su tamaño era de 12k micro ops o unos 21 &lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_3" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;KB (según Intel)&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;.&lt;/div&gt;  &lt;div align="justify"&gt;&amp;#160;&lt;/div&gt;  &lt;div align="justify"&gt;Efectivamente daba una tasa de aciertos realmente baja cercana a un 80% en código real y en caso de muchos branches llegaba a un solamente 55%, por ello se erigió en un talón de Aquiles de la microarquitectura Netburst.&lt;/div&gt;  &lt;div align="justify"&gt;&amp;#160;&lt;/div&gt; &lt;img style="text-align: center; margin: 0px auto 10px; display: block; cursor: hand" id="BLOGGER_PHOTO_ID_5195897583098047394" border="0" alt="" src="http://2.bp.blogspot.com/__p96Ony2voA/SBuJUqHeq6I/AAAAAAAAAQc/sS1_o5DMuUQ/s400/TraceCacheWillamette180nm.jpg" width="600" height="301" /&gt;   &lt;p align="center"&gt;&lt;span style="font-size: 85%"&gt;&lt;font size="2"&gt;&lt;em&gt;Trace cache&lt;/em&gt; de &lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_4" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;Willamette&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 180 &lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_5" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;nm&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; (L2 256&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_6" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;).&lt;/font&gt;&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;En sus cuatro encarnaciones (cinco si Tejas hubiese llegado al mercado), la &lt;em&gt;Trace Cache&lt;/em&gt; (en adelante &lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;) de los &lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_7" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;Intel&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_8" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;Pentium&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 4, mantuvo su organización. En &lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_9" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;&lt;a href="http://es.wikipedia.org/wiki/Pentium_4"&gt;&lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;Willamette&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; (arriba, primera generación, 180&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_10" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;nm&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;, 256 &lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_11" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; L2) y &lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_12" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;&lt;a href="http://en.wikipedia.org/wiki/Pentium_4#Northwood"&gt;&lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;Northwood&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; (abajo, segunda generación, 130 &lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_13" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;nm&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;, 512 &lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_14" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; L2) podemos ver que son prácticamente idénticas.&lt;/p&gt;  &lt;p align="justify"&gt;La &lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; sustituía a la típica cache de instrucciones L1 (L1i) de otros diseños. En lugar de almacenar instrucciones x86, almacena micro-operaciones &lt;em&gt;nativas &lt;/em&gt;del &lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_15" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;core&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_16" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;Pentium&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 4 ya decodificadas. Su tamaño efectivo era de 10k a 18k instrucciones (según su naturaleza) con unas tasas de acierto, según &lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_17" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;Intel&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;, comparable a una L1i de 8 a 16 &lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_18" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;/p&gt;  &lt;p align="center"&gt;&lt;span style="font-size: 85%"&gt;&lt;/span&gt;&lt;/p&gt; &lt;img style="text-align: center; margin: 0px auto 10px; display: block; cursor: hand" id="BLOGGER_PHOTO_ID_5195897587393014706" border="0" alt="" src="http://3.bp.blogspot.com/__p96Ony2voA/SBuJU6Heq7I/AAAAAAAAAQk/IWei68m0MSM/s400/TraceCacheNorthwood130nm.jpg" width="600" height="285" /&gt;   &lt;p align="center"&gt;&lt;/p&gt;  &lt;p align="center"&gt;&amp;#160; &lt;span style="font-size: 85%"&gt;&lt;font size="2"&gt;Trace caché de &lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_19" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;Northwood&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 130 &lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_20" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;nm&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; (L2 512&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_21" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;).&lt;/font&gt;&lt;/span&gt; &lt;/p&gt;  &lt;p align="center"&gt;&lt;span style="font-size: 85%"&gt;&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Al almacenar secuencias de micro-operaciones, llamadas &lt;em&gt;traces&lt;/em&gt;, libera así de trabajo a los &lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_22" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;decoders&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; x86 cuando se ejecuta varias veces el mismo código (se encuentra almacenado listo para su uso). Esta estructura era capaz de enviar hasta 3 instrucciones/ciclo hacia el núcleo de ejecución &lt;a href="http://camino.rutgers.edu/cs505/lecture5.html"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_23" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;OoO&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;/a&gt;(&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_24" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;Out&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_25" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;of&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_26" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;order&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;).&lt;/p&gt;  &lt;p align="justify"&gt;&lt;span style="color: #cccccc"&gt;La mayor limitación era la bajísima velocidad sostenida (&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_27" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_30" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_30" class="blsp-spelling-error"&gt;througput&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;) de decodificación de instrucciones cuando se daba un trace cache &lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_28" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;miss&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; o fallo de la &lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;.&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;span style="color: #cccccc"&gt;&lt;font color="#ff8080"&gt;El x86 &lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_29" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;decoder&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; del &lt;span id="SPELLING_ERROR_30" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_30" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_30" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;Pentium&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 4 en todas sus versiones sólo era capaz de traducir una instrucción &lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_31" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;IA&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;32 en microinstrucciones por ciclo (!!).&lt;/font&gt;&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Este era un grave factor &lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_32" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;limitante&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; de la arquitectura &lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_33" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;Netburst&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;. En ciertas condiciones un &lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_34" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_39" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;Pentium&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 4 se comportaba como un procesador &lt;em&gt;single-&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_35" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_40" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_39" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_39" class="blsp-spelling-error"&gt;issue&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;.&lt;/em&gt;     &lt;br /&gt;&lt;/p&gt;  &lt;p align="center"&gt;&lt;/p&gt;  &lt;br /&gt;  &lt;p align="left"&gt;&lt;/p&gt; &lt;img style="text-align: center; margin: 0px auto 10px; display: block; cursor: hand" id="BLOGGER_PHOTO_ID_5195905103585782722" border="0" alt="" src="http://1.bp.blogspot.com/__p96Ony2voA/SBuQKaHeq8I/AAAAAAAAAQs/XDT0cxSy7zk/s400/TraceCachePrescott90nm.jpg" width="600" height="324" /&gt;   &lt;p align="center"&gt;&lt;span style="font-size: 85%"&gt;&lt;font size="2"&gt;Trace caché de &lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_36" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_41" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_40" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_40" class="blsp-spelling-error"&gt;Prescott&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; 90 &lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_37" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_42" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_41" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_41" class="blsp-spelling-error"&gt;nm&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; (L2 2048&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_38" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_43" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_42" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_42" class="blsp-spelling-error"&gt;KB&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;).&lt;/font&gt;&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;La &lt;span id="SPELLING_ERROR_44" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_43" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_43" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; contiene &lt;em&gt;traces&lt;/em&gt;: secuencias de &lt;em&gt;&lt;span id="SPELLING_ERROR_39" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_39" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_45" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_44" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_44" class="blsp-spelling-error"&gt;uops&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/em&gt; (&lt;span id="SPELLING_ERROR_40" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_40" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_46" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_45" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_45" class="blsp-spelling-error"&gt;micro operaciones&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;) construidas en orden de programa, estas instrucciones están ordenadas en grupos de 6 por línea de &lt;span id="SPELLING_ERROR_47" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_46" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_46" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;. Además, la &lt;span id="SPELLING_ERROR_48" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_47" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_47" class="blsp-spelling-error"&gt;TC&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; contiene un pequeño &lt;span id="SPELLING_ERROR_41" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_41" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_49" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_48" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_48" class="blsp-spelling-error"&gt;predictor&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; de saltos (trace &lt;span id="SPELLING_ERROR_42" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_42" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_50" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_49" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_49" class="blsp-spelling-error"&gt;BTB, Branch Target Buffer&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;) solamente para las instrucciones presentes en ella.&lt;/p&gt;  &lt;p align="justify"&gt;Para los tipos de instrucciones &lt;span id="SPELLING_ERROR_43" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_43" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_51" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_50" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_50" class="blsp-spelling-error"&gt;IA&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;32 más complejos no se utilizaba el x86 &lt;span id="SPELLING_ERROR_44" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_52" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_51" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_51" class="blsp-spelling-error"&gt;decoder&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; ni la trace cache, sino la &lt;span id="SPELLING_ERROR_45" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_53" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_52" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_52" class="blsp-spelling-error"&gt;Microcode&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; ROM. Una memoria especializada que guarda secuencias de &lt;span id="SPELLING_ERROR_46" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_54" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_53" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_53" class="blsp-spelling-error"&gt;uops&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; de las instrucciones x86 más complejas.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TM8S4lJlBlI/AAAAAAAAEjU/HvqeXeYotic/s1600-h/CedarMill65nm_TC%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="CedarMill65nm_TC" border="0" alt="CedarMill65nm_TC" src="http://lh5.ggpht.com/__p96Ony2voA/TM8S5iivQCI/AAAAAAAAEjY/KZUgz1zQ5c4/CedarMill65nm_TC_thumb%5B1%5D.jpg?imgmax=800" width="604" height="298" /&gt;&lt;/a&gt;Trace caché en Cedar Mill 65 nm (L2 2048 KB)&lt;/p&gt;  &lt;p align="justify"&gt;En un P4, las instrucciones x86 que acabarán siendo decodificada en más de 4 &lt;span id="SPELLING_ERROR_47" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_55" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_54" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_54" class="blsp-spelling-error"&gt;uops&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; se envían a la &lt;span id="SPELLING_ERROR_48" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_56" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_55" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_55" class="blsp-spelling-error"&gt;Microcode&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; ROM, siendo su proceso de decodificación mucho más lento. &lt;span id="SPELLING_ERROR_57" class="blsp-spelling-error"&gt;&lt;a href="http://http//en.wikipedia.org/wiki/Pentium_4#Prescott"&gt;&lt;span id="SPELLING_ERROR_56" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_56" class="blsp-spelling-error"&gt;Prescott&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt; aportaba en este sentido mejoras, ya que eran menos las instrucciones que requerían su paso por la &lt;span id="SPELLING_ERROR_58" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_57" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_57" class="blsp-spelling-error"&gt;Microcode&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; ROM.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;span&gt;&lt;font style="background-color: #ffff00"&gt;&lt;/font&gt;&lt;font color="#ffff80" size="3"&gt;Conclusiones:&lt;/font&gt;&lt;/span&gt;&lt;/p&gt;  &lt;p align="justify"&gt;La trace cache aporta mejoras pero también trae consigo grandes problemas:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;Una mayor complejidad respecto a una L1i convencional.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Su gran (enorme) penalización en latencia en el caso de fallo (trace cache &lt;span id="SPELLING_ERROR_44" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_49" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_59" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_58" class="blsp-spelling-error"&gt;&lt;span id="SPELLING_ERROR_58" class="blsp-spelling-error"&gt;miss&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;).&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Su baja tasa de aciertos efectiva, normalmente sobre un 80% y a veces cercana al 55%.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Su limitado tamaño, unas 12k instrucciones, equivalente a unos meros 8 - 16 KB.&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p&gt;&lt;font color="#4bacc6"&gt;&lt;strong&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:242959ce-076a-4498-9898-b793919168bd" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/NetBurst" rel="tag"&gt;NetBurst&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Pentium+4" rel="tag"&gt;Pentium 4&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Trace+Cache" rel="tag"&gt;Trace Cache&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Decoding" rel="tag"&gt;Decoding&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-2009196719352572310?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/2009196719352572310/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2008/05/microarquitectura-en-imgenes-i.html#comment-form" title="3 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/2009196719352572310?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/2009196719352572310?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/C53R1qmU2vM/microarquitectura-en-imgenes-i.html" title="Microarquitectura en imágenes (I) Execution Trace cache. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://2.bp.blogspot.com/__p96Ony2voA/SBuJUqHeq6I/AAAAAAAAAQc/sS1_o5DMuUQ/s72-c/TraceCacheWillamette180nm.jpg" height="72" width="72" /><thr:total>3</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2008/05/microarquitectura-en-imgenes-i.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0EMQXc8fip7ImA9Wx9UFUQ.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-3937338566644579555</id><published>2010-09-14T16:32:00.000+02:00</published><updated>2011-02-13T11:08:00.976+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-02-13T11:08:00.976+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="Sandy Bridge" /><title>Microarquitectura Intel Sandy Bridge. Parte 1. Actualizado - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Estos días Intel está celebrando en San francisco el IDF 2010 (Intel Developer Forum), entre multitud de temas relacionados con el futuro de la industria de semiconductores ha hablado de Sandy Bridge.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TKmbuMwrOqI/AAAAAAAAEiE/RIGFTvn2-6U/s1600-h/SandyB_Nehalem_Westmere%5B3%5D.jpg"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="SandyB_Nehalem_Westmere" border="0" alt="SandyB_Nehalem_Westmere" src="http://lh3.ggpht.com/__p96Ony2voA/TKmbuobDijI/AAAAAAAAEiI/S_vcHWlusCs/SandyB_Nehalem_Westmere_thumb%5B1%5D.jpg?imgmax=800" width="634" height="215" /&gt;&lt;/a&gt;Sandy Bridge tiene menor superficie de die que Nehalem pese a contar con una GPU con 12 SPs.&lt;/p&gt;  &lt;p align="justify"&gt;En estos artículos me voy a centrar en los cambios microarquitecturales de Sandy Bridge sobre la anterior generación de cores de Intel, Nehalem 45 nm y Westmere 32 nm.&lt;/p&gt;  &lt;p align="justify"&gt;En esta primera parte abordaré varios aspectos:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;Intel Tock 2010. La aplastante cadencia del gigante de los semiconductores.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Sandy Bridge Ring Bus. La nueva organización de la comunicación inter die.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;El System Agent de Sandy Bridge. El Uncore o North Bridge.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;El Front End de Sandy Bridge. Las primeras etapas del pipeline.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;El mecanismo de Branch Prediction, tan críticamente importante en algoritmos de enteros.&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p&gt;&lt;font color="#ffff80" size="3"&gt;Intel Tock 2010&lt;/font&gt;&lt;/p&gt;  &lt;p&gt;Sandy Bridge es un cambio profundo respecto a la ya excelente y exitosa microarquitectura que Intel puso en juego en 2008 con Nehalem, los cores que mueven los chips Core i7.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TI-1g3Vq0RI/AAAAAAAAEgU/6vPh9L3WrzA/s1600-h/SB_TOCK_6303.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_TOCK_630" border="0" alt="SB_TOCK_630" src="http://lh3.ggpht.com/__p96Ony2voA/TI-1i5GAgOI/AAAAAAAAEgY/qKLfg732tl0/SB_TOCK_630_thumb1.png?imgmax=800" width="634" height="337" /&gt;&lt;/a&gt; Sandy Bridge es el Tock de 32 nm tras Nehalem y Westmere.&lt;/p&gt;  &lt;p align="justify"&gt;Poco había que mejorar en la arquitectura de los cores Nehalem, ya que Intel lidera en prestaciones en todos los campos… pero los grupos de ingeniería en Intel no podían quedarse dormidos en los laureles (como desafortunadamente hizo AMD tras su excelente core K8).&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TKmbxW9PbJI/AAAAAAAAEiM/w6ZL3ng6V8U/s1600-h/PIN_630%5B3%5D.png"&gt;&lt;img style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto; padding-top: 0px" title="PIN_630" border="0" alt="PIN_630" src="http://lh3.ggpht.com/__p96Ony2voA/TKmbzHld2PI/AAAAAAAAEiQ/va_ByeBqItQ/PIN_630_thumb.png?imgmax=800" width="634" height="367" /&gt;&lt;/a&gt; La próxima generación: Intel Sandy Bridge.&lt;/p&gt;  &lt;p align="justify"&gt;Por ello han procedido a un exhaustivo y profundo rediseño:&lt;/p&gt;  &lt;p align="justify"&gt;Desde el Front End, hasta las unidades de ejecución, el Branch Prediction e incluso las unidades Load – Store. También se ha modificado la arquitectura de la cache L3 dividiéndola en bancos de 2 MB por core y la interconexión interna de las diferentes partes del procesador.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TI-1mAtiBFI/AAAAAAAAEgc/g76LzQKYuc8/s1600-h/SandyBridge_Die_2_63023.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="SandyBridge_Die_2_630 (2)" border="0" alt="SandyBridge_Die_2_630 (2)" src="http://lh5.ggpht.com/__p96Ony2voA/TI-1pOo1EYI/AAAAAAAAEgg/aP_DGE6wLTc/SandyBridge_Die_2_6302_thumb1.png?imgmax=800" width="634" height="307" /&gt;&lt;/a&gt; Die de Sandy Bridge quad core 32 nm.&lt;/p&gt;  &lt;p align="justify"&gt;El Ring Bus que ahora hace de ruta de comunicación entre todas y cada una de las partes del procesador:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;cores&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Bancos de L3 de 2 MB&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;System Agent -Uncore o North Bridge-&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;GPU integrada&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Video decoder – encoder&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;Es, a mi modo de ver, uno de los cambios más significativos respecto a diseños anteriores (Westmere y Nehalem).&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TI-1qEfFL7I/AAAAAAAAEgk/dITEY8P4yv0/s1600-h/SB3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB" border="0" alt="SB" src="http://lh3.ggpht.com/__p96Ony2voA/TI-1rd2O2tI/AAAAAAAAEgo/N1c21Jc1Nbs/SB_thumb1.jpg?imgmax=800" width="604" height="423" /&gt;&lt;/a&gt; Intel no ha dejado nada al azar con Sandy Bridge.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Sandy Bridge Ring Bus&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Intel ha dotado a Sandy Bridge de un novedoso y extremadamente rápido sistema heredado de su hermano mayor Nehalem EX, un anchísimo y eficiente Ring Bus de comunicaciones para coordinar todas las transacciones de datos inter die.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TI-1sC1tXgI/AAAAAAAAEgs/5MxD75Aw34w/s1600-h/SB_RING3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_RING" border="0" alt="SB_RING" src="http://lh3.ggpht.com/__p96Ony2voA/TI-1tDlvOPI/AAAAAAAAEgw/sePsj2rs7C0/SB_RING_thumb1.jpg?imgmax=800" width="604" height="428" /&gt;&lt;/a&gt; Implementación del Ring Bus en Sandy Bridge.&lt;/p&gt;  &lt;p align="justify"&gt;El ancho de banda del bus de datos es de 32 bytes, es decir, 256 bits y su topología es en anillo, es decir, escala con el número de cores y bancos de L3. A mayor número de cores o bancos de L3 mayor ancho de banda agregado.&lt;/p&gt;  &lt;p align="justify"&gt;Lo más llamativo del bus en anillo de Sandy Bridge (y Nehalem EX) es su implementación respetuosa con el consumo y el área de die, me explico:&lt;/p&gt;  &lt;p align="justify"&gt;Todos recordamos el famoso procesador Radeon HD 2900 de ATI con un ring bus de 512 bits, que debido a su desmesurada disipación térmica y consumo no pudo competir con sus análogos de nVidia hasta que ATI lo eliminó sustituyéndolo por una arquitectura convencional en su serie Radeon HD 3800.&lt;/p&gt;  &lt;p align="justify"&gt;En Sandy Bridge Intel ha utilizado power gating y clock gating extensivamente, además de aplicar un voltaje bajísimo al ring bus para conseguir una disipación térmica muy baja.&lt;/p&gt;  &lt;p align="justify"&gt;Por otro lado, es un dato muy importante, según los ingenieros de Intel, no ha representado un incremento de área ya que la infinidad de conductores necesarios para el Ring Bus se enrutan por otras capas del diseño bajo la caché L3.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TI-1viiodBI/AAAAAAAAEg0/fHB7dwEZhO0/s1600-h/SB_Die_6303.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_Die_630" border="0" alt="SB_Die_630" src="http://lh6.ggpht.com/__p96Ony2voA/TI-1ypAIidI/AAAAAAAAEg4/5_MXp37SAdQ/SB_Die_630_thumb1.png?imgmax=800" width="634" height="317" /&gt;&lt;/a&gt; Sandy Bridge quad core para socket LGA 1155.&lt;/p&gt;  &lt;p align="justify"&gt;Lo que se consigue con este ring bus es aumentar de manera lineal el ancho de banda agregado (total) con el número de Ring Stops (cores, bancos de L3, …) consiguiendo una escalabilidad perfecta.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html" target="_blank"&gt;Como he comentado en artículos anteriores&lt;/a&gt;, además se consigue una muy notable bajada de latencia de la caché L3, del orden del 30% (!!) que ya de por sí en Nehalem y Westmere era realmente rápida.&lt;/p&gt;  &lt;p align="justify"&gt;Ahora nos encontramos en los veintitantos ciclos de latencia respecto a los 38 - 42 ciclos de Nehalem y algo más en Westmere.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;El System Agent de Sandy Bridge&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;El anteriormente denominado Uncore, Nocore o North Bridge ahora no incluye ya la caché L3, por lo que la L3 es síncrona a los cores, con lo que aumenta su frecuencia aumentando su ancho de banda y disminuye su latencia.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TI-1zch0RKI/AAAAAAAAEhA/QfeBVIC2LKc/s1600-h/SB_SA3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_SA" border="0" alt="SB_SA" src="http://lh5.ggpht.com/__p96Ony2voA/TI-10XjQxLI/AAAAAAAAEhE/_hPngdoFj_4/SB_SA_thumb1.jpg?imgmax=800" width="604" height="371" /&gt;&lt;/a&gt;Sandy Bridge System Agent.&lt;/p&gt;  &lt;p align="justify"&gt;El System Agent se encarga de controlar todas las transacciones entre los cores, la GPU integrada, los coders y decoders de video integrados con:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;La memoria principal a través de las dos controladoras DDR3.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Las GPUs externas a través de los puertos PCI Ex.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Los dispositivos externos a través del DMI vía chipset.&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;Para mejorar la disipación térmica y reducir el consumo en sistemas portátiles integra la controladora de video y la PCU (Power Control Unit) encargada de gestionar los voltajes y las frecuencias de los cores así como los Turbo Modes y los modos de ahorro de energía y el Power Gating a nivel de cores.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;El Front End de San&lt;/font&gt;&lt;font color="#ffff80" size="3"&gt;dy Bridge&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;El Front End es la parte del microprocesador encargada de suministrar la secuencia de instrucciones X86 desde la caché L1i (cache L1 de instrucciones) y de descodificarlas a un formato más manejable (micro operaciones, uops).&lt;/p&gt;  &lt;p align="justify"&gt;Intel, en este apartado ha roto con el pasado y ha desarrollado un Front End revolucionario.&lt;/p&gt;  &lt;p align="justify"&gt;Estas instrucciones ya descodificadas se encuentran en un formato interno y propietario, son llamadas uops (micro operaciones) y son características de cada microarquitectura.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TI-101ii32I/AAAAAAAAEhI/X_zrFq9c-Ag/s1600-h/SB_uopcache3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_uopcache" border="0" alt="SB_uopcache" src="http://lh4.ggpht.com/__p96Ony2voA/TI-11o4uhZI/AAAAAAAAEhM/o68lUMwmNx0/SB_uopcache_thumb1.jpg?imgmax=800" width="604" height="414" /&gt;&lt;/a&gt; uop cache en Sandy Bridge, una especie de L0i.&lt;/p&gt;  &lt;p align="justify"&gt;Sandy Bridge mejora el Loop Stream Buffer de Westmere 32 nm que contenía hasta 28 uops con una estructura dedicada llamada &lt;strong&gt;&lt;em&gt;Decoded uop Cache&lt;/em&gt;&lt;/strong&gt; que es capaz de almacenar unas 1500 uops (sobre unos 6 KB de capacidad) y que actúa a modo de caché L0 de instrucciones suministrando a las etapas de ejecución fuera de orden instrucciones con menor latencia que la L1i de 32 KB y además manteniendo más fácilmente la cadencia de 4 uops / ciclo.&lt;/p&gt;  &lt;p align="justify"&gt;Además el Fetching desde esta nueva L0i se hace en paquetes de 32 bytes / ciclo, aumentando el llenado efectivo de las unidades de ejecución que le siguen en el pipeline.&lt;/p&gt;  &lt;p align="justify"&gt;Intel cita la tasa de aciertos de esta L0i en un 80% en código de aplicaciones típicas. En el caso de acierto (que como vemos es un 80% de las veces) se desconectan las etapas de Fetch y Decoding con el consiguiente ahorro energético y de temperatura (muy notable ya que el consumo de estas etapas es muy alto en CPUs de arquitectura X86).&lt;/p&gt;  &lt;p align="justify"&gt;Entre los mecanismos que forman parte integral del Front End nos encontramos con la lógica y SRAMs de Branch Prediction encargado de cargar en el orden correcto la secuencia de instrucciones después de una bifurcación en el código (Branch) decidiendo si la condición se cumple o no mediante lógica y algoritmos de especulación y distintas tablas de datos de historia precedentes.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;El mecanismo de Branch Prediction&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Sandy Bridge ha mejorado notablemente el manejo de Branches en el código, aumentando la tasa de acierto. Los ingenieros de Intel han optimizado el diseño pero permaneciendo en el misma footprint (la misma superficie).&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TI-12e19GjI/AAAAAAAAEhQ/FbjXmYCrYeI/s1600-h/SB_Branch3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_Branch" border="0" alt="SB_Branch" src="http://lh5.ggpht.com/__p96Ony2voA/TI-13O3hTjI/AAAAAAAAEhU/chma25OFMkU/SB_Branch_thumb1.jpg?imgmax=800" width="604" height="338" /&gt;&lt;/a&gt; Optimización del Branch Prediction en Sandy Bridge.&lt;/p&gt;  &lt;p align="justify"&gt;Utilizando técnicas de &lt;strong&gt;&lt;em&gt;compresión sin pérdidas&lt;/em&gt;&lt;/strong&gt; en Sandy Bridge se almacenan más datos de historia en la misma capacidad que en Westmere por lo que efectivamente se han ampliado al doble el número de entradas en las tablas de Targets, elevando con ello la tasa de aciertos de los algoritmos respecto a Westmere.&lt;/p&gt;  &lt;p align="justify"&gt;Estoy deseando probar Sandy Bridge en &lt;a href="http://lowlevelhardware.blogspot.com/2009/09/analisis-de-algoritmos-de-inteligencia.html" target="_blank"&gt;algoritmos ajedrecísticos&lt;/a&gt;.&lt;/p&gt;  &lt;p&gt;Nos vemos en la segunda entrega.&lt;/p&gt;  &lt;p style="line-height: 1.4" align="justify"&gt;&lt;font face="Arial"&gt;&lt;font style="font-size: 9.8pt" color="#4bacc6"&gt;&lt;strong&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/strong&gt;&lt;/font&gt;&lt;/font&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:1175717a-2693-4128-95a8-c3dbcca243d9" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sandy+Bridge" rel="tag"&gt;Sandy Bridge&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPUs" rel="tag"&gt;CPUs&lt;/a&gt;,&lt;a href="http://technorati.com/tags/cores" rel="tag"&gt;cores&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesador" rel="tag"&gt;procesador&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-3937338566644579555?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/3937338566644579555/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/09/microarquitectura-intel-sandy-bridge.html#comment-form" title="4 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3937338566644579555?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3937338566644579555?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/K6smNcxNgI8/microarquitectura-intel-sandy-bridge.html" title="Microarquitectura Intel Sandy Bridge. Parte 1. Actualizado - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/TKmbuobDijI/AAAAAAAAEiI/S_vcHWlusCs/s72-c/SandyB_Nehalem_Westmere_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>4</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/09/microarquitectura-intel-sandy-bridge.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0YBQnwyfip7ImA9Wx9UFUQ.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6365466497448488567</id><published>2010-09-11T19:29:00.001+02:00</published><updated>2011-02-13T10:59:13.296+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-02-13T10:59:13.296+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="Orochi" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="Opteron" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>La microarquitectura de AMD Bulldozer. Actualizado - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Con Bulldozer AMD ciertamente ha roto moldes en el rígido diseño de un procesador X86. El concepto de módulo con dos cores de enteros y una FPU sobredimensionada es novedoso y ciertamente tiene algunas ventajas sobre los diseños más convencionales.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TIu8FHeaR7I/AAAAAAAAEeo/x27GfOFiQZA/s1600-h/Bulldozer_manipulado630%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Bulldozer_manipulado630" border="0" alt="Bulldozer_manipulado630" src="http://lh6.ggpht.com/__p96Ony2voA/TIu8JQvVuEI/AAAAAAAAEes/HKgEtcsyEiU/Bulldozer_manipulado630_thumb%5B1%5D.png?imgmax=800" width="634" height="515" /&gt;&lt;/a&gt; Fotografía manipulada del die de AMD Orochi, el primer chip de arquitectura Bulldozer.&lt;/p&gt;  &lt;p align="justify"&gt;Esta organización de las unidades de proceso conlleva también cambios en el subsistema de caché y de memoria, en ellos me centraré en este artículo.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Las unidades de ejecución de Bulldozer&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Como todos ya conocéis, Bulldozer combina dos INT cores junto con una FPU con capacidad FMAC para formar un módulo. Trabajando sobre el die manipulado por AMD y hecho público, podemos observar varios detalles, entre ellos los dos INT cores simétricos.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TI0f_Kj4yjI/AAAAAAAAEfg/0ghJg4monNg/s1600-h/core_L2_L3_Bulldozer_etiq4%5B1%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="core_L2_L3_Bulldozer_etiq" border="0" alt="core_L2_L3_Bulldozer_etiq" src="http://lh6.ggpht.com/__p96Ony2voA/TIu8N8N7H4I/AAAAAAAAEfo/DgXt43Vdd8I/core_L2_L3_Bulldozer_etiq4_thumb.png?imgmax=800" width="634" height="470" /&gt;&lt;/a&gt; Organización de uno de los módulos Bulldozer con sus cachés externas L2 y L3.&lt;/p&gt;  &lt;p align="justify"&gt;Me remito a mi artículo anterior de LowLevelHardware:&lt;/p&gt;  &lt;blockquote&gt;   &lt;p align="justify"&gt;&lt;a title="Intel Core i7 SMT vs. AMD Bulldozer CMT - LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/08/intel-core-i7-smt-vs-amd-bulldozer-cmt.html"&gt;Intel Core i7 SMT vs. AMD Bulldozer CMT – LowLevelHardware&lt;/a&gt;&lt;/p&gt; &lt;/blockquote&gt;  &lt;blockquote&gt;   &lt;p align="justify"&gt;&lt;em&gt;En un módulo Bulldozer hay duplicadas algunas de las unidades de ejecución para conseguir con ello un aumento de prestaciones a la vez que se comparten algunas unidades que por su tamaño &lt;u&gt;no&lt;/u&gt; es práctico duplicar.&lt;/em&gt;&lt;/p&gt;    &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6KTPkzNI/AAAAAAAAEd4/nvFnyNyAZtc/s1600-h/BulldozerHotChips_August24_8pmET_NDA-3_575px%5B3%5D.jpg"&gt;&lt;em&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-3_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-3_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6K2w9d3I/AAAAAAAAEd8/Vr0mewT964U/BulldozerHotChips_August24_8pmET_NDA-3_575px_thumb%5B1%5D.jpg?imgmax=800" width="500" height="285" /&gt;&lt;/em&gt;&lt;/a&gt;&lt;em&gt;&lt;/em&gt;&lt;/p&gt;    &lt;p align="center"&gt;&lt;em&gt;Diseño general de Bulldozer 32 nm.&lt;/em&gt;&lt;/p&gt;    &lt;p align="justify"&gt;&lt;em&gt;En el caso de Bulldozer 32 nm, AMD ha diseñado un procesador dotado de dos cores de enteros (INT cores) compartiendo:&lt;/em&gt;&lt;/p&gt;    &lt;ul&gt;     &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;El hardware de Branch Prediction.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;La caché L1i de instrucciones de 64 KB y 2 vías.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Las etapas de fetch (32 bytes / ciclo).&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Los cuatro decoders X86.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;   &lt;/ul&gt;    &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6LavAkCI/AAAAAAAAEeA/vFHMhtxbiuI/s1600-h/BulldozerHotChips_August24_8pmET_NDA-7_575px%5B7%5D.jpg"&gt;&lt;em&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-7_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-7_575px" src="http://lh6.ggpht.com/__p96Ony2voA/THa6MAxDAqI/AAAAAAAAEeE/iYVk7o_Y1Kk/BulldozerHotChips_August24_8pmET_NDA-7_575px_thumb%5B3%5D.jpg?imgmax=800" width="500" height="285" /&gt;&lt;/em&gt;&lt;/a&gt;&lt;em&gt;&lt;/em&gt;&lt;/p&gt;    &lt;p align="center"&gt;&lt;em&gt;Componentes compartidos en el Front End.&lt;/em&gt;&lt;/p&gt;    &lt;ul&gt;     &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;La FPU dual de 128 bit FMAC con &lt;/em&gt;&lt;em&gt;2 pipelines FMAC 128 bit y &lt;/em&gt;&lt;em&gt;2 pipelines packed INT de 128 bit MMX.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;   &lt;/ul&gt; &lt;/blockquote&gt;  &lt;blockquote&gt;   &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THa6Mn-w2-I/AAAAAAAAEeI/-xgPMlPH0wU/s1600-h/BulldozerHotChips_August24_8pmET_NDA-9_575px%5B3%5D.jpg"&gt;&lt;em&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-9_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-9_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6NG5MzDI/AAAAAAAAEeM/6p2kiJCXl7M/BulldozerHotChips_August24_8pmET_NDA-9_575px_thumb%5B1%5D.jpg?imgmax=800" width="500" height="285" /&gt;&lt;/em&gt;&lt;/a&gt;&lt;em&gt;&amp;#160;&lt;/em&gt;&lt;em&gt;La FPU compartida en Bulldozer 32 nm.&lt;/em&gt;&lt;/p&gt;    &lt;p align="justify"&gt;&lt;em&gt;También son compartidos los siguientes componentes del die de Bulldozer:&lt;/em&gt;&lt;/p&gt;    &lt;ul&gt;     &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;El Data Prefetcher encargado de precargar datos en las caches.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;La caché L2 compartida para cada dos INT cores con su &lt;/em&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/05/el-tlb-secreto-de-amd-parte-i.html"&gt;&lt;em&gt;L2 TLB&lt;/em&gt;&lt;/a&gt;&lt;em&gt;.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;   &lt;/ul&gt;    &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/THa6N109rcI/AAAAAAAAEeQ/J-RmVqdyM7I/s1600-h/BulldozerHotChips_August24_8pmET_NDA-10_575px%5B3%5D.jpg"&gt;&lt;em&gt;&lt;img title="BulldozerHotChips_August24_8pmET_NDA-10_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-10_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6OUgXWtI/AAAAAAAAEeU/Ao8XtSnZOLM/BulldozerHotChips_August24_8pmET_NDA-10_575px_thumb%5B1%5D.jpg?imgmax=800" width="500" height="285" /&gt;&lt;/em&gt;&lt;/a&gt;&lt;em&gt;&lt;/em&gt;&lt;/p&gt;    &lt;p align="center"&gt;&lt;em&gt;La L2 compartida de Bulldozer 32nm, probablemente de 1 o 2 MB y 16 vías.&lt;/em&gt;&lt;/p&gt;    &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/THa6O_sUxjI/AAAAAAAAEeY/xZnIwkS8hHU/s1600-h/BulldozerHotChips_August24_8pmET_NDA-8_575px%5B3%5D.jpg"&gt;&lt;em&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-8_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-8_575px" src="http://lh4.ggpht.com/__p96Ony2voA/THa6PTwY24I/AAAAAAAAEec/8JE6FSulOo8/BulldozerHotChips_August24_8pmET_NDA-8_575px_thumb%5B1%5D.jpg?imgmax=800" width="500" height="285" /&gt;&lt;/em&gt;&lt;/a&gt;&lt;em&gt; Los dos cores discretos de enteros en Bulldozer 32 nm.&lt;/em&gt;&lt;/p&gt;    &lt;p align="justify"&gt;&lt;em&gt;En Bulldozer, al haber dos cores de enteros completos, hay muchas estructuras duplicadas:&lt;/em&gt;&lt;/p&gt;    &lt;ul&gt;     &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Un scheduler de enteros (INT scheduler) por core, unificado para ALUs y AGUs.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Dos ALUs. Unidades de proceso de enteros.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Dos AGUs. Unidades de generación de direcciones de memoria.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;L1d de 16 KB y 4 vías de asociatividad.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/05/el-tlb-secreto-de-amd-parte-i.html"&gt;&lt;em&gt;L1 DLTB&lt;/em&gt;&lt;/a&gt;&lt;em&gt; de 32 entradas fully associative.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Juego de registros y de registros alias con su hardware de renombramiento.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;      &lt;li&gt;       &lt;p align="justify"&gt;&lt;em&gt;Unidad de Load - Store con procesamiento fuera de orden en lecturas y escrituras a memoria con sus colas de comandos.&lt;/em&gt;&lt;/p&gt;     &lt;/li&gt;   &lt;/ul&gt; &lt;/blockquote&gt;  &lt;p&gt;Analizando el die observamos los dos INT cores dentro de cada módulo:&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TIu8P3BM1xI/AAAAAAAAEfw/T6m8o4hWsEM/s1600-h/INTcores%5B1%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="INTcores" border="0" alt="INTcores" src="http://lh3.ggpht.com/__p96Ony2voA/TIu8RwGguxI/AAAAAAAAEf4/Q6vgieiST84/INTcores_thumb.png?imgmax=800" width="634" height="470" /&gt;&lt;/a&gt; Los INT cores de Bulldozer.&lt;/p&gt;  &lt;p align="justify"&gt;Después de este repaso a sus unidades de ejecución, vamos a examinar su arquitectura de caché.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Las cachés de Bulldozer&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;En cada módulo de Bulldozer AMD integra dos INT cores, cada uno con su caché privada L1d (datos) de 16 KB y 4 vías de asociatividad, en cambio, la caché L1i (instrucciones) sigue siendo única y mantiene la tradición de AMD: 64 KB y 2 vías de asociatividad.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TI0gKAMme7I/AAAAAAAAEgA/mCQn_aS2hs4/s1600-h/core_L2_L3_Bulldozer_etiq%5B1%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="core_L2_L3_Bulldozer_etiq" border="0" alt="core_L2_L3_Bulldozer_etiq" src="http://lh6.ggpht.com/__p96Ony2voA/TIu8UB8qX4I/AAAAAAAAEgE/0A0m4gByp-M/core_L2_L3_Bulldozer_etiq_thumb.png?imgmax=800" width="634" height="470" /&gt;&lt;/a&gt;Un módulo Bulldozer con su L2 privada de 2 MB y su banco de 2 MB de L3.&lt;/p&gt;  &lt;p align="justify"&gt;El análisis de die (que podéis examinar en el principio del artículo) manipulado por AMD para ocultar su verdadera estructura ya arroja algo de luz sobre las primera implementación de Bulldozer: el octal core Orochi.&lt;/p&gt;  &lt;p&gt;Ampliando los INT cores, observamos las cachés de nivel 1:&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TIu8XdSxYFI/AAAAAAAAEfI/fXAymmP-gWQ/s1600-h/L1s%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="L1s" border="0" alt="L1s" src="http://lh5.ggpht.com/__p96Ony2voA/TIu8ax_mUYI/AAAAAAAAEfM/9_HxyxdwwDI/L1s_thumb%5B1%5D.png?imgmax=800" width="634" height="470" /&gt;&lt;/a&gt;&amp;#160; Las pequeñas L1d de 16 KB y la L1i de 64 KB compartida.&lt;/p&gt;  &lt;p align="justify"&gt;Observamos numerosos bloques de SRAM, su uso es el siguiente:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;Una de ellas es el BHT (Branch History Tables) utilizadas por los mecanismos de Branch Prediction.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;Dos son los Write Buffers (Buffers de Escritura Combinada) utilizados para crear un flujo ordenado de datos hacia la L2 compartida de 2 MB desde las dos pequeñas L1d de 16 KB y 4 vías.&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;Las SRAM de los Write Buffers son necesarias ya que las L1d han cambiado su política de exclusiva (como en los cores anteriores de AMD) a inclusiva (como en los microprocesadores Intel), por ello es necesario “copiar” a L2 los datos escritos en cada una de las dos pequeñas L1d.&lt;/p&gt;  &lt;p align="justify"&gt;Con alta probabilidad en la parte inferior del módulo se observa la doble FPU FMAC de 128 bit con 2 pipelines extra para MMX 128 bit y en la parte superior las etapas de Fetch y X86 Decoding que se alimentan de las instrucciones procedentes de la caché L1i de 64 KB y dos vías a razón de 32 bytes / ciclo.&lt;/p&gt;  &lt;p align="justify"&gt;Los bloques funcionales de la izquierda son principalmente circuitería relacionada con el Hardware Prefetching.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TIu8eFU2TqI/AAAAAAAAEfQ/NK6vbfI66Xo/s1600-h/Modulo%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Modulo" border="0" alt="Modulo" src="http://lh5.ggpht.com/__p96Ony2voA/TIu8hjY7HnI/AAAAAAAAEfU/1QkaZQh1JS8/Modulo_thumb%5B1%5D.png?imgmax=800" width="634" height="470" /&gt;&lt;/a&gt; Esquema del módulo Bulldozer.&lt;/p&gt;  &lt;p align="justify"&gt;Las latencias de caché parece que serán bastante mediocres:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;4 ciclos para las L1d de 16 KB y 4 vías.&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;18 ciclos para la L2 de 2 MB (seguramente de 16 ó incluso 32 vías)&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;Veremos si gracias al motor OOO avanzado de Bulldozer AMD consigue ocultar estas altas latencias al software encontrando al vuelo instrucciones suficientes para enviar a las unidades de ejecución (sin L2 misses).&lt;/p&gt;  &lt;p align="justify"&gt;Estoy deseando echar un vistazo en Noviembre al verdadero die de Bulldozer en alta resolución.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Bulldozer y la memoria&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Los &lt;a href="http://lowlevelhardware.blogspot.com/2010/08/memcon10-roadmap-de-memoria-2015.html" target="_blank"&gt;roadmaps de tecnologías de memoria no anuncian DDR5 hasta 2015&lt;/a&gt;, nos debemos conformar con DDR3 hasta entonces.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THK7l-n2fqI/AAAAAAAAEbg/xFe-mXjgtKY/s1600-h/7%5B4%5D.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="7" border="0" alt="7" src="http://lh5.ggpht.com/__p96Ony2voA/THK7mqaUI6I/AAAAAAAAEbk/foXrkbX-h0k/7_thumb%5B1%5D.png?imgmax=800" width="634" height="476" /&gt;&lt;/a&gt; Roadmap RAM hasta 2015. Fuente: &lt;a href="http://www.denali.com/wordpress/index.php/dmr/2010/05/21/memcon-2010-july-28-time-to-register-hun"&gt;MEMCON10&lt;/a&gt;.&lt;/p&gt;  &lt;p align="justify"&gt;Bulldozer montará un dual channel DDR3 hasta 2.13 GHz para un ancho de banda agregado de 31.2 GB/s por die de 8 INT cores.&lt;/p&gt;  &lt;p align="justify"&gt;Para servidores, Interlagos, la versión MCM de Bulldozer con 2 dies de 8 INT cores en un chip para socket G34, contará con un quad channel DDR3 hasta 1.86 GHz para un ancho de banda total de 59.7 GB/s (!!) por socket.&lt;/p&gt;  &lt;p align="justify"&gt;Contemporáneamente, Sandy Bridge 8 cores (16 threads) contará con 4 canales DDR3 en socket 2011 probablemente con la misma frecuencia y ancho de banda que Interlagos (1.866 GHz y 59.7 GB/s).&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Algo “raro” en Bulldozer&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Veo una extraña y alarmante falta de ancho de banda de decodificación en Bulldozer (4 instrucciones / ciclo) para el anchísimo hardware de ejecución que tiene detrás:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;2 INT cores con 2 ALUs y 2 AGUs por core&lt;/div&gt;   &lt;/li&gt;    &lt;li&gt;     &lt;div align="justify"&gt;1 FPU con 2 pipelines FMAC de 128 bit y 2 pipelines packed integer MMX de 128 bit&lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;En total, un módulo, es capaz de ejecutar en paralelo:&lt;/p&gt;  &lt;ul&gt;   &lt;li&gt;     &lt;div align="justify"&gt;4 INT (core 0) + 4 (FPU / MMX) + 4 INT (core 1) &lt;/div&gt;   &lt;/li&gt; &lt;/ul&gt;  &lt;p align="justify"&gt;Es decir 12 instrucciones por ciclo y solo son decodificadas 4 por ciclo (??).&lt;/p&gt;  &lt;p align="justify"&gt;Quizás AMD se esconda un as en la manga …&lt;/p&gt;  &lt;p style="line-height: 1.4" align="justify"&gt;&lt;font face="Arial"&gt;&lt;font style="font-size: 9.8pt" color="#4bacc6"&gt;&lt;strong&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/strong&gt;&lt;/font&gt;&lt;/font&gt;&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:207fc60d-3b2f-4ae3-9de4-39ad0afc6a8c" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Orochi" rel="tag"&gt;Orochi&lt;/a&gt;,&lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/microqarquitectura" rel="tag"&gt;microqarquitectura&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6365466497448488567?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6365466497448488567/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html#comment-form" title="6 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6365466497448488567?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6365466497448488567?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/gtLh6HUM6A4/la-microarquitectura-de-amd-bulldozer.html" title="La microarquitectura de AMD Bulldozer. Actualizado - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/TIu8JQvVuEI/AAAAAAAAEes/HKgEtcsyEiU/s72-c/Bulldozer_manipulado630_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>6</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/09/la-microarquitectura-de-amd-bulldozer.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkMFQHg4cSp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-7184806903648026669</id><published>2010-08-28T00:05:00.001+02:00</published><updated>2011-03-17T17:46:51.639+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:46:51.639+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="core i7" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="QPI" /><category scheme="http://www.blogger.com/atom/ns#" term="L3 cache" /><category scheme="http://www.blogger.com/atom/ns#" term="Sandy Bridge" /><title>Previo Intel Sandy Bridge. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Debo reconocer que siento admiración y hasta cierto punto incluso perplejidad sobre cómo han logrado los ingenieros de Intel mejorar tanto una arquitectura ya sobresaliente como Nehalem…&lt;/p&gt; &lt;p align="justify"&gt;Ya en algunos artículos pasados he hablado de Sandy Bridge:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Intel Core i7 SMT vs. AMD Bulldozer CMT - LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/08/intel-core-i7-smt-vs-amd-bulldozer-cmt.html"&gt;Intel Core i7 SMT vs. AMD Bulldozer CMT – LowLevelHardware&lt;/a&gt;&amp;nbsp; 25 Agosto 2010&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Intel Sandy Bridge versus Westmere die. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/08/intel-sandy-bridge-versus-westmere-die.html"&gt;Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware&lt;/a&gt;&amp;nbsp;&amp;nbsp; 02 Agosto 2010&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Novedades y expectativas 2010. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html"&gt;Novedades y expectativas 2010. Actualizado – LowLevelHardware&lt;/a&gt;&amp;nbsp; 29 Julio 2010&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Micrograf&amp;iacute;a detallada de Intel Sandy Bridge &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/06/micrografia-detallada-de-intel-sandy.html"&gt;Micrografía detallada de Intel Sandy Bridge – ProfessionalSAT&lt;/a&gt;&amp;nbsp; 20 Junio 2010&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Intel Sandy Bridge. Introducci&amp;oacute;n &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/04/intel-sandy-bridge-introduccion.html"&gt;Intel Sandy Bridge. Introducción – ProfessionalSAT&lt;/a&gt;&amp;nbsp; 18 Abril 2010&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Intel Tick - Tock&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Todos conocemos el modelo de trabajo Tick - Tock de Intel, cada dos años nueva microarquitectura y en los años intermedios nuevo proceso de fabricación:&lt;/p&gt; &lt;p align="center"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="Intel Tick-Tock" alt="Intel Tick-Tock" src="http://www.intel.com/technology/pix/ticktock.jpg" width="565" height="362"&gt;El exitoso e implacable modelo Tick – Tock de Intel.&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;2005 Presler 65 nm (Intel Pentium D, 2 cores, 2 + 2 MB L2)&amp;nbsp;&amp;nbsp; Tick&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2006 Conroe 65 nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core 2 Duo, 4 cores, 4 + 4 MB L2)&amp;nbsp;&amp;nbsp; Tock&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2007 Penryn 45 nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core 2 Duo, 4 cores, 6 + 6 MB L2)&amp;nbsp;&amp;nbsp;&amp;nbsp; Tick&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2008 Nehalem 45 nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core i7, 4 cores SMT, 8 MB L3)&amp;nbsp;&amp;nbsp;&amp;nbsp; Tock&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2009 Westmere 32nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core i7, 6 cores SMT, 12 MB L3)&amp;nbsp;&amp;nbsp;&amp;nbsp; Tick&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2010 Sandy Bridge 32 nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core i7 SMT, 6+ cores SMT)&amp;nbsp;&amp;nbsp;&amp;nbsp; Tock&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;2011 Ivy Bridge 22 nm&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; (Core i7 SMT, 8+ cores SMT)&amp;nbsp;&amp;nbsp;&amp;nbsp; Tick&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;El &lt;font color="#ffff80"&gt;Tick&lt;/font&gt; significa nuevo proceso de fabricación, más fino, transistores menores y mayor densidad por unidad de superficie. Cachés mayores, menor consumo,menor disipación térmica y mayor frecuencia.&lt;/p&gt; &lt;p align="justify"&gt;El&lt;font color="#ffff80"&gt; Tock&lt;/font&gt; por el contrario consiste en una nueva microarquitectura para aprovechar todas las ventajas aportadas por el nuevo proceso de fabricación del año anterior.&lt;/p&gt; &lt;p align="justify"&gt;Sandy Bridge esta fabricado en el mismo nodo que los recientes procesadores Westmere de 6 cores y 12 MB de L3 para socket 1366 o los Core i3 e i5 con GPU integrada para socket 1156. Comparte con ellos la tecnología de fabricación de 32 nm HKMG.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Intel Sandy Bridge, pequeña introducción&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Lo que cambia en Sandy Bridge y cambia de verdad es la microarquitectura; reconozco que inicialmente y viendo la poca competencia con que Intel se enfrenta en gama alta pensé que Sandy Bridge sería una mejora más sutil sobre los excelentes cores Nehalem que nos acompañan desde 2008.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TB37hlzK6aI/AAAAAAAAESM/dobmm_4-xrk/s1600-h/SB_4C_630p_cores%5B3%5D.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="SB_4C_630p_cores" border="0" alt="SB_4C_630p_cores" src="http://lh6.ggpht.com/__p96Ony2voA/TB37lcZbcaI/AAAAAAAAESQ/Vni_TqL8Zkw/SB_4C_630p_cores_thumb%5B1%5D.png?imgmax=800" width="634" height="308"&gt;&lt;/a&gt;Intel Sandy Bridge socket 1155. Quad core con GPU integrada, 8 threads y dual DDR3.&lt;/p&gt; &lt;p align="justify"&gt;Continuará con la capacidad &lt;a href="http://lowlevelhardware.blogspot.com/2010/08/intel-core-i7-smt-vs-amd-bulldozer-cmt.html" target="_blank"&gt;SMT de dos threads por core (HyperThreading)&lt;/a&gt; y numerosas mejoras a nivel de cores, caches, interconexiones inter core, disipación térmica y GPU integrada.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TB37obreI5I/AAAAAAAAESU/STl_beD22f4/s1600-h/Core%5B3%5D.png"&gt;&lt;img title="Core" border="0" alt="Core" src="http://lh5.ggpht.com/__p96Ony2voA/TB37rZDO9WI/AAAAAAAAESY/IIbxnwI5uxA/Core_thumb%5B1%5D.png?imgmax=800" width="634" height="371"&gt;&lt;/a&gt; El núcleo de ejecución incluyendo las L1d y L1i y la caché L2 de 256 KB.&lt;/p&gt; &lt;p align="justify"&gt;A nivel de cores espero un incremento en IPC por core de un &lt;font color="#ffff80"&gt;20%&lt;/font&gt; (!!) en enteros y un&lt;font color="#ffff80"&gt; 100%&lt;/font&gt; en código AVX 256 bit FPU respecto al antiguo código SSE de 128 bit respecto a Westmere. Es algo prácticamente increíble sabiendo con qué lo comparamos pero es así… tiempo al tiempo.&lt;/p&gt; &lt;p align="justify"&gt;Una mejora crítica en Sandy Bridge es su subsistema de caché L3. Está basado en una arquitectura RING BUS. Esta arquitectura es conocida por el revolucionario procesador octal core Nehalem EX, que con su doble RING BUS bidireccional logra superlativos resultados en ancho de banda y latencia de su masiva L3 de 24 MB en 8 bancos de 3 MB.&lt;/p&gt; &lt;p align="justify"&gt;En Sandy Bridge conllevará reducciones de latencia L3 del orden de 15 ciclos para la L3 compartida de 8 MB, quedando en unos 25 – 28 ciclos efectivos load to use… simplemente brutal.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TB38DgiO-3I/AAAAAAAAETE/Fr9YthaToLg/s1600-h/L3%5B3%5D.png"&gt;&lt;img title="L3" border="0" alt="L3" src="http://lh6.ggpht.com/__p96Ony2voA/TB38FoTuQII/AAAAAAAAETI/DA07g7EFjV4/L3_thumb%5B1%5D.png?imgmax=800" width="634" height="159"&gt;&lt;/a&gt; Los cuatro bancos de L3.&lt;/p&gt; &lt;p align="justify"&gt;En el terreno del consumo eléctrico, Sandy Bridge consigue mejorar a Lynnfield (p.ej. Core i7 880), el mejor procesador en performance per watt con diferencia.&lt;/p&gt; &lt;p align="justify"&gt;Sobre la GPU integrada, Sandy Bridge llegará en sus versiones básicas al nivel de SVGAs PCIEx de gama baja como las ATI 5450. Las versiones alta de SB se moverán ya en niveles de prestaciones gráficas realmente aceptables, sobre una ATI 4650 con 320 SPs o algo superior.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TB370akGbCI/AAAAAAAAESk/tiM6a1HDqDc/s1600-h/GPU%5B3%5D.png"&gt;&lt;img title="GPU" border="0" alt="GPU" src="http://lh4.ggpht.com/__p96Ony2voA/TB373IIeI1I/AAAAAAAAESs/poupkHI3iDE/GPU_thumb%5B1%5D.png?imgmax=800" width="634" height="347"&gt;&lt;/a&gt; Detalle de la GPU y la circuitería colateral.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;Los sockets de Sandy Bridge&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Intel ha diseñado dos nuevos e incompatibles socket para Sandy Bridge:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Socket 1155. Sustituto del actual LGA1156, contará con 2 canales DDR3.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Socket 2011. Sustituto del actual LGA1366 contará con cuatro (!!) canales de DDR3 hasta 2133 MHz. Serán excelentes para mis &lt;a href="http://professionalsat.blogspot.com/2009/09/core-i7-42-ghz-algoritmos-de_07.html" target="_blank"&gt;Sistemas de Altas Prestaciones&lt;/a&gt;.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Meditad sobre el 20 % de mejora en IPC clock for clock y core for core respecto a Westmere… a mí me cuesta asumirlo. Estoy deseando echarle el guante a los primeros ejemplares para socket 2011, será en Q2 - Q3 2011.&lt;/p&gt; &lt;p align="justify"&gt;Más por llegar…&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong&gt;&lt;font color="#4bacc6"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:5d1223da-0a1e-44fd-8cea-2323f1e7f5f1" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sandy+Bridge" rel="tag"&gt;Sandy Bridge&lt;/a&gt;,&lt;a href="http://technorati.com/tags/microarquitectura" rel="tag"&gt;microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPUs" rel="tag"&gt;CPUs&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesador" rel="tag"&gt;procesador&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-7184806903648026669?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/7184806903648026669/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/08/previo-intel-sandy-bridge.html#comment-form" title="2 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7184806903648026669?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7184806903648026669?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/kPodoazwFmQ/previo-intel-sandy-bridge.html" title="Previo Intel Sandy Bridge. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/TB37lcZbcaI/AAAAAAAAESQ/Vni_TqL8Zkw/s72-c/SB_4C_630p_cores_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>2</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/08/previo-intel-sandy-bridge.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkIAQHk9cSp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-7672669298995581308</id><published>2010-08-25T19:45:00.000+02:00</published><updated>2011-03-17T17:49:01.769+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:49:01.769+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="CMT" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>Intel Core i7 SMT vs. AMD Bulldozer CMT - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;En este artículo voy a ilustrar dos conceptos:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;El concepto de procesador SMT (Simultaneous Multithreading) utilizado hace años por Intel, primero en su línea Netburst y actualmente con sus brillantes CPUs Nehalem 45 nm ,Westmere 32 nm y próximamente en 2011 Sandy Bridge (32 nm).&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;El nuevo diseño CMT (Cluster Multithreading) utilizado por AMD en sus futuros procesadores basados en la &lt;a href="http://professionalsat.blogspot.com/2010/08/amd-bulldozer-professionalsat.html" target="_blank"&gt;&lt;strong&gt;microarquitectura Bulldozer&lt;/strong&gt;&lt;/a&gt; para 2011.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/THa52DJTzpI/AAAAAAAAEc0/rQQLgiczJvg/s1600-h/BulldozerHotChips_August24_8pmET_NDA-8_575px%5B7%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-8_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-8_575px" src="http://lh5.ggpht.com/__p96Ony2voA/THa525zHPFI/AAAAAAAAEc4/Dwxq3mtm8Us/BulldozerHotChips_August24_8pmET_NDA-8_575px_thumb%5B3%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; CMT en AMD Bulldozer 32nm.&lt;/p&gt; &lt;p align="justify"&gt;Empiezo primero por el concepto de SMT utilizado por Intel en su tecnología HyperThreading, el lector impaciente puede avanzar más abajo para ver la implementación de CMT en AMD Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;SMT (Simultaneous Multithreading)&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;SMT es un concepto nacido con el fin de ocupar al máximo y durante el mayor porcentaje de tiempo posible los recursos de proceso de un procesador, esto se logra ejecutando simultáneamente dos o más threads en un único core.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/THa530EoZPI/AAAAAAAAEc8/e2zm9UJAH2I/s1600-h/image%5B19%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="image" border="0" alt="image" src="http://lh3.ggpht.com/__p96Ony2voA/THa54vLmOhI/AAAAAAAAEdA/Vew7yWlDqfM/image_thumb%5B15%5D.png?imgmax=800" width="480" height="371"&gt;&lt;/a&gt; Intel Hyper Threading.&lt;/p&gt; &lt;p align="justify"&gt;De nada sirve un core con 8 ALUs de proceso de enteros si no hay instrucciones suficientes para llenarlas o si estas instrucciones necesitan datos que no están todavía disponibles para la ejecución.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/THa58WkPwAI/AAAAAAAAEdE/Fs3iwiIEmO4/s1600-h/Willamette180nm%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Willamette180nm" border="0" alt="Willamette180nm" src="http://lh3.ggpht.com/__p96Ony2voA/THa6A3qlJwI/AAAAAAAAEdI/aKjAuDB0U8M/Willamette180nm_thumb%5B1%5D.png?imgmax=800" width="634" height="558"&gt;&lt;/a&gt; El primer integrante de la saga Netburst, Willamette 180 nm.&lt;/p&gt; &lt;p align="justify"&gt;Intel, durante el desarrollo de su primer procesador Pentium 4 (microarquitectura Netburst) se dio cuenta de que muchas de sus unidades de ejecución (ALUs, AGUs, FPUs) estaban un porcentaje significativo del tiempo de ejecución de un programa desocupadas, en reposo por falta de instrucciones o datos.&lt;/p&gt; &lt;p align="justify"&gt;Esto era debido principalmente a tres hechos:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;font color="#0080c0"&gt;L1d Cache mises:&lt;/font&gt; Fallos de caché L1d (datos). Si queremos sumar dos números, deberemos conocer esos números antes de ejecutar la instrucción suma sobre los datos. Si los datos no están en la caché L1d, el procesador deberá chequear la caché L2 debiendo esperar en circunstancias reales un mínimo absoluto de 10 ciclos en un P4 Willamette 180 nm o Northwood 130 nm.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;font color="#0080c0"&gt;Branch missprediction:&lt;/font&gt; Fallo en la predicción de saltos. Los procesadores, desde hace décadas intentan averiguar dónde va a “saltar” la ejecución del programa para tener ya esas instrucciones preprocesadas. Este mecanismo consigue aumentos notables de velocidad de proceso aunque en caso de fallo en la predicción (sobre un 5 % en CPUs modernas) se produce un vaciado de los pipelines de instrucciones y una reejecución de las mismas con la consiguiente penalidad en rendimiento.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;font color="#0080c0"&gt;Falta de ancho de banda del decoder que de la &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/microarquitectura-en-imgenes-i.html" target="_blank"&gt;trace cache&lt;/a&gt; en caso de Trace Cache Miss: &lt;/font&gt;La trace cache era capaz de suministrar tres instrucciones / ciclo a las unidades de ejecución pero en caso de no encontrarse la instrucción en la TC se daba un TC Miss. Lamentablemente, y era una increíble limitación del diseño Netburst, el decoder previo a la TC solo introducía instrucciones decodificadas a un ritmo de &lt;strong&gt;&lt;u&gt;una por ciclo&lt;/u&gt;&lt;/strong&gt;. Absolutamente insuficiente, cualquier CPU de su época decodificaba 3 instrucciones / ciclo (Pentium III, AMD Athlon).&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" border="0" alt="" src="http://3.bp.blogspot.com/__p96Ony2voA/SBuJU6Heq7I/AAAAAAAAAQk/IWei68m0MSM/s400/TraceCacheNorthwood130nm.jpg"&gt;La Trace Cache de Pentium 4 Northwood 130 nm.&lt;/p&gt; &lt;p align="justify"&gt;Las dos primeros causas de desocupación en las unidades de proceso se resolvian, al menos parcialmente gracias al SMT. Sobre el diseño de la TC, no tenía solución y lo dejo para otro artículo futuro…&lt;/p&gt; &lt;p align="justify"&gt;SMT consiste en ejecutar a la vez dos threads de una misma aplicación o de dos aplicaciones diferentes en un core. Para ello se deben de rediseñar muchos aspectos del procesador de dos modos:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Hay partes del core que se deben de duplicar por thread.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Otras estructuras deben particionarse.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THa6B8mXDAI/AAAAAAAAEdM/FJEFeLZbHTg/s1600-h/image%5B20%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="image" border="0" alt="image" src="http://lh4.ggpht.com/__p96Ony2voA/THa6CzyKO7I/AAAAAAAAEdQ/KKO-FgVtH2Y/image_thumb%5B16%5D.png?imgmax=800" width="484" height="374"&gt;&lt;/a&gt; SMT añade gran complejidad al diseño del procesador.&lt;/p&gt; &lt;p align="justify"&gt;Estas partes de la CPU a duplicar o particionar comprenden todas las zonas de almacenamiento de código y datos del procesador:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Es necesario duplicar el número de registros arquitecturales y de registros renombrados por thread.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Se deben de dimensionar al alza todas las colas (queues) de instrucciones del procesador para asegurar espacio para dos threads distintos y que la lógica de procesamiento fuera de orden (OOO Logic) tenga suficientes instrucciones dentro de la ventana (OOO window) listas para ejecutar y mantener las etapas de ejecución llenas.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Todo esto debe hacerse con un sistema que prevenga y evite la competencia por los recursos entre los dos threads, para evitar problemas de rendimiento.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6DZxMisI/AAAAAAAAEdU/i9vJE2RwNAQ/s1600-h/Image3%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Image3" border="0" alt="Image3" src="http://lh3.ggpht.com/__p96Ony2voA/THa6EL2k7cI/AAAAAAAAEdY/ovt0SzTc7f0/Image3_thumb%5B1%5D.png?imgmax=800" width="634" height="330"&gt;&lt;/a&gt; Pipeline del P4 Willamette 180 nm. En amarillo y verde instrucciones de cada thread.&lt;/p&gt; &lt;p align="justify"&gt;Todo ello conlleva una cantidad de hardware adicional (transistores) estimada entre un 5 y un 10% del área del procesador.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6EoK7BKI/AAAAAAAAEdc/3LujhDxAzGQ/s1600-h/die%5B5%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="die" border="0" alt="die" src="http://lh4.ggpht.com/__p96Ony2voA/THa6FdEo64I/AAAAAAAAEdg/ONtuGQodYJk/die_thumb%5B3%5D.jpg?imgmax=800" width="404" height="242"&gt;&lt;/a&gt; En Pentium 4 Willamette Intel cifró el incremento en un 5%.&lt;/p&gt; &lt;p align="justify"&gt;La buena noticia es que el SMT aumenta de forma típica el rendimiento de un core de un 10 a un 70% en función del código.&lt;/p&gt; &lt;p align="justify"&gt;En Pentium 4 yo medí en múltiples ocasiones sobre un 30% de mejora con Hyper Threading habilitado. En Core i7 la mejora es todavía superior.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6GO5x9oI/AAAAAAAAEdk/1j7mBlAjrfo/s1600-h/die%5B9%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="die" border="0" alt="die" src="http://lh4.ggpht.com/__p96Ony2voA/THa6HdYckCI/AAAAAAAAEds/sibiGaIJwRU/die_thumb%5B5%5D.jpg?imgmax=800" width="634" height="440"&gt;&lt;/a&gt; 4 cores, 8 threads gracias al SMT: Nehalem 45 nm Intel Core i7.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffff80" size="3"&gt;CMT (Cluster Multithreading) en AMD Bulldozer&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El concepto CMT es la respuesta de AMD al SMT de Intel: Hyper Threading.&lt;/p&gt; &lt;p align="justify"&gt;AMD llama a cada conjunto de 2 INT cores y 1 FPU compartida (más las cachés L1 y otra circuitería) un &lt;a href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html" target="_blank"&gt;módulo&lt;/a&gt;.&lt;/p&gt;         &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THa6IVjJNOI/AAAAAAAAEdw/6DEXGLPgLCc/s1600-h/Cluster_multithreading%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Cluster_multithreading" border="0" alt="Cluster_multithreading" src="http://lh5.ggpht.com/__p96Ony2voA/THa6JrQENOI/AAAAAAAAEd0/WP_ou7IGvqA/Cluster_multithreading_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt; El concepto original de CMT.&lt;/p&gt; &lt;p align="justify"&gt;CMT consiste en duplicar algunas de las unidades de ejecución para conseguir con ello un aumento de prestaciones a la vez que se comparten algunas unidades que por su tamaño no es práctico duplicar.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6KTPkzNI/AAAAAAAAEd4/nvFnyNyAZtc/s1600-h/BulldozerHotChips_August24_8pmET_NDA-3_575px%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-3_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-3_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6K2w9d3I/AAAAAAAAEd8/Vr0mewT964U/BulldozerHotChips_August24_8pmET_NDA-3_575px_thumb%5B1%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; Diseño general de Bulldozer 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;En el caso de Bulldozer 32 nm, AMD ha diseñado un procesador dotado de dos cores de enteros (INT cores) compartiendo:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;El hardware de Branch Prediction.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La caché L1i de instrucciones de 64 KB y 2 vías.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Las etapas de fetch (32 bytes / ciclo).&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Los cuatro decoders X86.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THa6LavAkCI/AAAAAAAAEeA/vFHMhtxbiuI/s1600-h/BulldozerHotChips_August24_8pmET_NDA-7_575px%5B7%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-7_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-7_575px" src="http://lh6.ggpht.com/__p96Ony2voA/THa6MAxDAqI/AAAAAAAAEeE/iYVk7o_Y1Kk/BulldozerHotChips_August24_8pmET_NDA-7_575px_thumb%5B3%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; Componentes compartidos en el Front End.&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;La FPU dual de 128 bit FMAC:&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THa6Mn-w2-I/AAAAAAAAEeI/-xgPMlPH0wU/s1600-h/BulldozerHotChips_August24_8pmET_NDA-9_575px%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="BulldozerHotChips_August24_8pmET_NDA-9_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-9_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6NG5MzDI/AAAAAAAAEeM/6p2kiJCXl7M/BulldozerHotChips_August24_8pmET_NDA-9_575px_thumb%5B1%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; La FPU compartida en Bulldozer 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;También son compartidos los siguientes componentes del die de Bulldozer:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;El Data Prefetcher encargado de precargar datos en las caches.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La caché L2 compartida para cada dos INT cores con su &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/el-tlb-secreto-de-amd-parte-i.html" target="_blank"&gt;L2 TLB&lt;/a&gt;.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/THa6N109rcI/AAAAAAAAEeQ/J-RmVqdyM7I/s1600-h/BulldozerHotChips_August24_8pmET_NDA-10_575px%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="BulldozerHotChips_August24_8pmET_NDA-10_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-10_575px" src="http://lh3.ggpht.com/__p96Ony2voA/THa6OUgXWtI/AAAAAAAAEeU/Ao8XtSnZOLM/BulldozerHotChips_August24_8pmET_NDA-10_575px_thumb%5B1%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt;La L2 compartida de Bulldozer 32nm, probablemente de 1 o 2 MB y 16 vías.&lt;/p&gt; &lt;p align="justify"&gt;En Bulldozer, al haber dos cores de enteros completos, hay muchas estructuras duplicadas:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/THa6O_sUxjI/AAAAAAAAEeY/xZnIwkS8hHU/s1600-h/BulldozerHotChips_August24_8pmET_NDA-8_575px%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="BulldozerHotChips_August24_8pmET_NDA-8_575px" border="0" alt="BulldozerHotChips_August24_8pmET_NDA-8_575px" src="http://lh4.ggpht.com/__p96Ony2voA/THa6PTwY24I/AAAAAAAAEec/8JE6FSulOo8/BulldozerHotChips_August24_8pmET_NDA-8_575px_thumb%5B1%5D.jpg?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; Los dos cores discretos de enteros en Bulldozer 32 nm.&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Un scheduler de enteros (INT scheduler) por core, unificado para ALUs y AGUs.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Dos ALUs. Unidades de proceso de enteros.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Dos AGUs. Unidades de generación de direcciones de memoria.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;L1d de 16 KB y alta asociatividad.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/05/el-tlb-secreto-de-amd-parte-i.html" target="_blank"&gt;L1 DLTB&lt;/a&gt; de 32 entradas fully associative.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Juego de registros y de registros alias con su hardware de renombramiento.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Unidad de Load - Store con procesamiento fuera de orden en lecturas y escrituras a memoria con sus colas de comandos.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;La verdad es que es una cantidad de circuitería notable a duplicar, aunque AMD afirma que la superficie del procesador no ha aumentado demasiado por ello.&lt;/p&gt; &lt;p align="justify"&gt;Según AMD, la mejora de prestaciones en enteros gracias a integrar un segundo core en el módulo ronda el 80%.&lt;/p&gt; &lt;p align="justify"&gt;En cuanto haya disponibles fotografías del die de Bulldozer veremos cuanto hay de cierto en ello y ya en 2011 cual es la competitividad real de este nuevo diseño.&lt;/p&gt; &lt;p align="justify"&gt;En cualquier caso me es llamativa la reducción de 3 a 2 ALUs y AGUs por INT core de Phenom II a Bulldozer que puede acarrear reducción de rendimiento single threaded, aunque creo que será compensada con los demás avances a nivel de core.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:7dd282c8-e381-4a3f-a751-4316da0297c6" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPUs" rel="tag"&gt;CPUs&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesador" rel="tag"&gt;procesador&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-7672669298995581308?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/7672669298995581308/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/08/intel-core-i7-smt-vs-amd-bulldozer-cmt.html#comment-form" title="3 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7672669298995581308?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7672669298995581308?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/BWEuTZkHigg/intel-core-i7-smt-vs-amd-bulldozer-cmt.html" title="Intel Core i7 SMT vs. AMD Bulldozer CMT - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/__p96Ony2voA/THa525zHPFI/AAAAAAAAEc4/Dwxq3mtm8Us/s72-c/BulldozerHotChips_August24_8pmET_NDA-8_575px_thumb%5B3%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>3</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/08/intel-core-i7-smt-vs-amd-bulldozer-cmt.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkIDSX4_cSp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-8709890317897394545</id><published>2010-08-21T11:29:00.001+02:00</published><updated>2011-03-17T17:49:38.049+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:49:38.049+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr4" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr3" /><category scheme="http://www.blogger.com/atom/ns#" term="memoria" /><title>MEMCON10: DDR4 y roadmap de memoria 2015 - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;El pasado mes de Julio se celebró la convención &lt;a href="http://www.denali.com/wordpress/index.php/dmr/2010/05/21/memcon-2010-july-28-time-to-register-hun" target="_blank"&gt;MEMCON10&lt;/a&gt;, donde acuden los principales fabricantes y diseñadores de chips de memoria así como otros expertos en la materia. En este congreso se definieron los roadmaps futuros en el campo de las memorias de acceso aleatorio para sistemas de todos los segmentos y se analizaron las previsiones pasadas y sus desviaciones con la realidad actual.&lt;/p&gt; &lt;p align="center"&gt;&amp;nbsp;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THK7l-n2fqI/AAAAAAAAEbg/xFe-mXjgtKY/s1600-h/7%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="7" border="0" alt="7" src="http://lh5.ggpht.com/__p96Ony2voA/THK7mqaUI6I/AAAAAAAAEbk/foXrkbX-h0k/7_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt; Roadmap RAM hasta 2015. Fuente: &lt;a href="http://www.denali.com/wordpress/index.php/dmr/2010/05/21/memcon-2010-july-28-time-to-register-hun" target="_blank"&gt;MEMCON10&lt;/a&gt;.&lt;/p&gt; &lt;p align="justify"&gt;En los sistemas actuales la memoria de uso generalizado es DDR3 en frecuencias desde los 1.066 GHz hasta los 1.6 GHz y en modelos concretos llegamos hasta los 2.5 GHz, se estima que el zenit de la memoria DDR3 se alcanzará en los 2.133 GHz a 1.5 V en módulos estándar (como ahora lo son los DDR3 1.333 GHz) a finales de 2014.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THK7n1a7kLI/AAAAAAAAEbo/1VmMl2eWOJY/s1600-h/b%5B6%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="b" border="0" alt="b" src="http://lh3.ggpht.com/__p96Ony2voA/THK7qHzw9FI/AAAAAAAAEbs/-Jmd_kt-rOQ/b_thumb%5B3%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; El cruce en producción DDR2 vs. DDR3 se produjo a principios de 2010.&lt;/p&gt; &lt;p align="justify"&gt;El desarrollo de DDR4 se ha dilatado en el tiempo más de lo esperado, y esto ha creado la necesidad de crear bins de mayor velocidad en DDR3, lo que nos llevará hasta los 2.133 GHz. La previsión inicial detallaba la DDR4 en sistemas ya en 2013:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THK7qsSs_hI/AAAAAAAAEbw/BcRI1sHdyOw/s1600-h/6%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="6" border="0" alt="6" src="http://lh6.ggpht.com/__p96Ony2voA/THK7rTdy-0I/AAAAAAAAEb0/nJVc7CazOnc/6_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; Roadmap inicial, posicionaba DDR4 en 2013.&lt;/p&gt; &lt;p align="justify"&gt;El tiempo ha demostrado que es más prudente asegurar el desarrollo de DDR4 y mientras tanto seguir con DDR3 poniendo énfasis en la reducción de voltaje para moderar el consumo.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/THK7sOO3lII/AAAAAAAAEb4/D1ChBRBHOsU/s1600-h/1%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="1" border="0" alt="1" src="http://lh3.ggpht.com/__p96Ony2voA/THK7s71FA2I/AAAAAAAAEb8/SR3Xn7dV6Ms/1_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; El estado presente de las tecnología RAM.&lt;/p&gt; &lt;p align="justify"&gt;Como todos sabemos, en el segmento de GPUs la memoria estrella es la GDDR5 en frecuencias que rondan ya los 5 GHz en productos finales (ATI de la serie HD5000) y hasta 7 GHz en chips discretos que serán integrados en la siguiente generación (ATI Southern Islands, ATI HD6000).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/THK7tuw7WsI/AAAAAAAAEcA/NXasrwRZ1pg/s1600-h/m%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="m" border="0" alt="m" src="http://lh4.ggpht.com/__p96Ony2voA/THK7umO_d9I/AAAAAAAAEcE/akfps800QFc/m_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; Proyecciones para DDR4.&lt;/p&gt; &lt;p align="justify"&gt;En 2015 llega DDR4 con frecuencias iniciales de 2.133 GHz y 1.20 V. Con posibilidad de llegar en futuro sobre los 4.266 GHz. En 2013 se estima estar sobre los 3.2 GHz. Más allá se abre el terreno a la especulación, pero estaremos ya en 2018…&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/THK7vbqJsWI/AAAAAAAAEcM/4MmBZ1DrZdw/s1600-h/8%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="8" border="0" alt="8" src="http://lh5.ggpht.com/__p96Ony2voA/THK7wRepp7I/AAAAAAAAEcQ/FNHCCocC5PM/8_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; Consumos estimados para cada generación de DRAM.&lt;/p&gt; &lt;p align="justify"&gt;Como vemos, la disipación térmica obliga a ir reduciendo constantemente el voltaje de los chips y con ello su consumo pero con ello se incrementa la sensibilidad al ruido de los canales de transferencia de datos obligando a los diseñadores a agudizar el ingenio con soluciones innovadoras.&lt;/p&gt; &lt;p align="justify"&gt;Se estima que la DDR3 irá reduciendo su voltaje hasta los 1.25 V en el final de su evolución y la DDR4 empezará en 1.20 V e irá paulatinamente reduciéndolo hasta los 1.05 V.&lt;/p&gt; &lt;p align="justify"&gt;En las primeras versiones, DDR4 disipará más calor que la DDR3 de voltaje reducido, para, en sucesivas revisiones ir reduciendo su consumo.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/THK7xKtAOYI/AAAAAAAAEcU/KBuV_4ZC_G4/s1600-h/d%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="d" border="0" alt="d" src="http://lh6.ggpht.com/__p96Ony2voA/THK7x0kQECI/AAAAAAAAEcY/x9gGuzE5Pn4/d_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&amp;nbsp; Conforme avanzan los procesadores multicore aumenta la necesidad de mayor ancho de banda.&lt;/p&gt; &lt;p align="justify"&gt;La preocupación principal de los expertos estriba en los voraces requerimientos de los procesadores multicore actuales y en su desmedido crecimiento año a año.&lt;/p&gt; &lt;p align="justify"&gt;La industria de la memoria no es capaz de proporcionar incrementos prestacionales de tal calibre y aumenta cada vez más el vacío de velocidad y latencia entre los cores y la memoria principal.&lt;/p&gt; &lt;p align="justify"&gt;Para paliar este fenómeno cada vez se integran cachés multinivel de estructura y gestión más compleja y mayores tamaños, así como se amplia en la medida de lo posible el acceso multicanal a los bancos de memoria RAM.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:feaee19a-1460-41db-a2e4-25927454ac8d" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/memoria" rel="tag"&gt;memoria&lt;/a&gt;,&lt;a href="http://technorati.com/tags/DDR3" rel="tag"&gt;DDR3&lt;/a&gt;,&lt;a href="http://technorati.com/tags/DDR4" rel="tag"&gt;DDR4&lt;/a&gt;,&lt;a href="http://technorati.com/tags/roadmap" rel="tag"&gt;roadmap&lt;/a&gt;,&lt;a href="http://technorati.com/tags/sistemas" rel="tag"&gt;sistemas&lt;/a&gt;,&lt;a href="http://technorati.com/tags/futuro" rel="tag"&gt;futuro&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-8709890317897394545?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/8709890317897394545/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/08/memcon10-roadmap-de-memoria-2015.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/8709890317897394545?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/8709890317897394545?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/wIp5N-cIKsc/memcon10-roadmap-de-memoria-2015.html" title="MEMCON10: DDR4 y roadmap de memoria 2015 - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/__p96Ony2voA/THK7mqaUI6I/AAAAAAAAEbk/foXrkbX-h0k/s72-c/7_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/08/memcon10-roadmap-de-memoria-2015.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkEGSX86fCp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-7178113993325513108</id><published>2010-08-02T11:52:00.001+02:00</published><updated>2011-03-17T17:50:28.114+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:50:28.114+01:00</app:edited><title>Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Las primeras imágenes del die del nuevo procesador de Intel que llegará al mercado a principios de 2011 revelan algunas peculiaridades interesantes.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TB37b69VPpI/AAAAAAAAESE/qcLDAE69wlY/s1600-h/SB_4C_630p%5B3%5D.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="SB_4C_630p" border="0" alt="SB_4C_630p" src="http://lh4.ggpht.com/__p96Ony2voA/TB37e0z7nrI/AAAAAAAAESI/K7BY6i0RJRs/SB_4C_630p_thumb%5B1%5D.png?imgmax=800" width="634" height="308"&gt;&lt;/a&gt; Sandy Bridge quad core.&lt;/p&gt; &lt;p align="justify"&gt;Será, según el fabricante, una microarquitectura que aportará algunos cambios fundamentales sobre la base de la exitosa generación Nehalem. En un &lt;a href="http://professionalsat.blogspot.com/2010/04/intel-sandy-bridge-introduccion.html" target="_blank"&gt;artículo anterior&lt;/a&gt; de &lt;a href="http://professionalsat.blogspot.com/" target="_blank"&gt;ProfessionalSAT&lt;/a&gt; describí algunos de sus detalles.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Diferencias evolutivas apreciables en el die respecto a Westmere:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Para fotografías de mayor calidad y resolución visita este artículo de ProfesionalSAT:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&amp;nbsp;&lt;a title="Micrograf&amp;iacute;a detallada de Intel Sandy Bridge &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/06/micrografia-detallada-de-intel-sandy.html"&gt;Micrografía detallada de Intel Sandy Bridge – ProfessionalSAT&lt;/a&gt;&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TB37obreI5I/AAAAAAAAESU/STl_beD22f4/s1600-h/Core%5B3%5D.png"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" title="Core" border="0" alt="Core" src="http://lh5.ggpht.com/__p96Ony2voA/TB37rZDO9WI/AAAAAAAAESY/IIbxnwI5uxA/Core_thumb%5B1%5D.png?imgmax=800" width="634" height="371"&gt;&lt;/a&gt;Intel Sandy Bridge 32 nm die. Núcleo de ejecución.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TFaVHvqkaDI/AAAAAAAAEVo/T1-JaeJ92V0/s1600-h/Westmere_core_die3.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Westmere_core_die" border="0" alt="Westmere_core_die" src="http://lh4.ggpht.com/__p96Ony2voA/TFaVKONFOCI/AAAAAAAAEVs/asK0iisLOL4/Westmere_core_die_thumb1.png?imgmax=800" width="560" height="329"&gt;&lt;/a&gt;El núcleo de ejecución de Intel Westmere 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Observando el core (núcleo de ejecución) ya se ven algunas divergencias de diseño aparentes:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;La caché L2 (esquina superior derecha) mantiene su tamaño de 256 KB pero su organización física adopta un esquema cuadrado, con menor distancia máxima y posiblemente un mejor tiempo de acceso. Se rumorean 9 ciclos.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La caché L1d (caché L1 de datos) (recuadro superior central) por contra mantiene un esquema muy similar.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;No así la L1i (caché L1 de instrucciones) (en el recuadro inferior izquierdo) que aumenta considerablemente su superficie posiblemente para reducir su consumo o quizás para ampliar su asociatividad.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Notable es la presencia de una gran SRAM sobre ella (la L1i) de gran tamaño (comparable a la L1i) y pegada a su parte superior. Pudiese ser una reedición de la &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/microarquitectura-en-imgenes-i.html" target="_blank"&gt;famosa Trace Cache&lt;/a&gt; ya conocida en la antigua microarquitectura Intel Netburst. &lt;a title="Microarquitectura en im&amp;aacute;genes (I).Trace cache" href="http://lowlevelhardware.blogspot.com/2008/05/microarquitectura-en-imgenes-i.html"&gt;Microarquitectura en imágenes (I).Trace cache&lt;/a&gt;.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Configuración de la caché L3 compartida:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;La distribución y orientación de la caché L3 en Westmere (Nehalem 32 nm) y Sandy Bridge (32 nm) difiere notablemente.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TFaVLxpXL1I/AAAAAAAAEVw/1SomRxYfqvg/s1600-h/SandyBridge_die4.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="SandyBridge_die" border="0" alt="SandyBridge_die" src="http://lh6.ggpht.com/__p96Ony2voA/TFaVN-_IYzI/AAAAAAAAEV0/UCuHQleQJNg/SandyBridge_die_thumb2.png?imgmax=800" width="644" height="237"&gt;&lt;/a&gt;El core de Sandy Bridge junto con su banco de 2 MB de L3.&lt;/p&gt;   &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TFaVQvt6R7I/AAAAAAAAEV4/x506ecVWpDQ/s1600-h/Westmere_core_die_L33.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Westmere_core_die_L3" border="0" alt="Westmere_core_die_L3" src="http://lh5.ggpht.com/__p96Ony2voA/TFaVS5DTxvI/AAAAAAAAEV8/8Khj5JwYeU0/Westmere_core_die_L3_thumb1.png?imgmax=800" width="644" height="231"&gt;&lt;/a&gt;&amp;nbsp; Westmere con su banco de 2 MB de L3.&lt;/p&gt; &lt;p align="justify"&gt;Los arrays de L3 en Bloomfield (Core i7 y Xeon de 45 nm) y Westmere (Gulftown 32 nm hexacore) son paralelos al core y la lógica de control y tags de L3 están a un lado de la SRAM, en cambio, en Sandy Bridge, la L3 tiene más bien un esquema de memoria “particionada”.&lt;/p&gt; &lt;p align="justify"&gt;Me explico, en Sandy Bridge la apariencia de la L3 es de un banco discreto perteneciente a una organización superior, probablemente su organización sea en algunos aspectos similar a la de Nehalem EX de 45 nm (Xeon octal core).&lt;/p&gt; &lt;p align="justify"&gt;Los L3 tags y buffers de escritura permanecen en el centro de dos arrays de L3 de 1 MB cada uno.&lt;/p&gt; &lt;p align="justify"&gt;Todos estos cambios se deben a que ahora la L3 no solo debe de dar servicio a los cores sino también a la GPU integrada en el die de Sandy Bridge (tiene acceso directo a L3). Por ello necesita de mayor ancho de banda y una organización distinta: un ring bus de 256 bytes.&lt;/p&gt; &lt;p align="justify"&gt;Lo que sí permanece invariado es el tamaño relativo en MB por core: 2 MB.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Los sockets de Sandy Bridge&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Las versiones de sobremesa irán montadas sobre un LGA1155 incompatible con el actual LGA1156 de los actuales i3, i5 e i7 de dual DDR3 de 2 y cuatro cores.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TFaVTWL48eI/AAAAAAAAEWA/yiCtJMKlh7Y/s1600-h/SB_11553.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_1155" border="0" alt="SB_1155" src="http://lh3.ggpht.com/__p96Ony2voA/TFaVT7V5rBI/AAAAAAAAEWE/qgUDl-R27r8/SB_1155_thumb1.png?imgmax=800" width="422" height="234"&gt;&lt;/a&gt;Socket LGA1155.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TFaVUWxx6oI/AAAAAAAAEWI/sxKO5RsAFPA/s1600-h/SB_24C_1155_6303.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_2-4C_1155_630" border="0" alt="SB_2-4C_1155_630" src="http://lh4.ggpht.com/__p96Ony2voA/TFaVU_F2C4I/AAAAAAAAEWM/RoDnzDfRhA4/SB_24C_1155_630_thumb1.png?imgmax=800" width="634" height="216"&gt;&lt;/a&gt;En LGA1155 veremos versiones de 2 y 4 cores con GPU integrada.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Sistemas de Altas Prestaciones Sandy Bridge&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Las versiones que a mí más me interesan, pues sustituirán al actual LGA 1366 de los Core i7 de triple channel DDR3, contarán con 1356 pines y se esperan octal core nativos con 16 threads (los sustitutos de los actuales Gulftown de 32 nm). Sin duda será una muy interesante actualización.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TFaVViyiMFI/AAAAAAAAEWQ/asRvmTduYjo/s1600-h/SB_8C_1356_6303.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_8C_1356_630" border="0" alt="SB_8C_1356_630" src="http://lh3.ggpht.com/__p96Ony2voA/TFaVWaPbyEI/AAAAAAAAEWU/H1mHDOi-JUY/SB_8C_1356_630_thumb1.png?imgmax=800" width="634" height="330"&gt;&lt;/a&gt; En el socket de gama alta LGA1356 vendrá el codiciado 8 cores.&lt;/p&gt; &lt;p align="justify"&gt;Contará igualmente con 3 canales DDR3 hasta 1600 MHz para 38.4 GB/s de ancho de banda agregado de memoria. Será el sweet spot para estaciones de trabajo.&lt;/p&gt; &lt;p align="justify"&gt;Los que me conocéis personalmente o por mis Blogs, sabéis que la mayoría de mis clientes necesitan el máximo absoluto en prestaciones por sus muy exigentes cargas de trabajo.&lt;/p&gt; &lt;p align="justify"&gt;Realizan procesos de cálculo que duran semanas en sistemas Quad Core i7 a 3.8 – 4 GHz optimizados en todos sus parámetros al extremo con una total garantía de estabilidad. Es por ello que esperan ansiosamente cada iteración de nuevos procesadores y rápidamente, cuando esta llega al mercado, sustituyen sus antiguos sistemas (siempre menos de 2 años) por los nuevos procesadores.&lt;/p&gt; &lt;p align="justify"&gt;Con Sandy Bridge y debido a su muy contenido TDP espero excelentes márgenes de aumento de frecuencia para mis Sistemas de Altas Prestaciones allá por el 2011 basados en esta nueva microarquitectura.&lt;/p&gt; &lt;p align="justify"&gt;Muy probablemente será seguro superar con cierto margen los 4 GHz para cargas de trabajo 100% en todos los cores ininterrumpidas en el modelo octal core. Con los procesadores actuales &lt;a href="http://professionalsat.blogspot.com/2009/09/core-i7-42-ghz-algoritmos-de.html" target="_blank"&gt;me es difícil llegar a los 4 GHz con temperaturas satisfactorias&lt;/a&gt; en estos casos, incluso tras un arduo proceso de hand picking.&lt;/p&gt; &lt;p align="justify"&gt;Para servidores de gama alta:&lt;/p&gt; &lt;p align="center"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" border="0" alt="[PIC03252[3].jpg]" src="http://lh3.ggpht.com/__p96Ony2voA/SqJV_C5cXjI/AAAAAAAAD8o/eg71Y0HAIXw/s1600/PIC03252%5B3%5D.jpg"&gt;Para superar los 4 GHz con estabilidad absoluta &lt;a href="http://professionalsat.blogspot.com/2009/09/core-i7-42-ghz-algoritmos-de.html" target="_blank"&gt;hay que hacer diabluras&lt;/a&gt;.&lt;/p&gt; &lt;p align="justify"&gt;Para sustituir a Nehalem EX 8 cores y Westmere EX 12 cores Intel nos presentará Sandy Bridge EX en socket LGA2011:&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TFaVXFw7XyI/AAAAAAAAEWY/cV_gBrw8VJY/s1600-h/SB_8C_2011_6303.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="SB_8C_2011_630" border="0" alt="SB_8C_2011_630" src="http://lh3.ggpht.com/__p96Ony2voA/TFaVX86lXwI/AAAAAAAAEWc/lwwXCbAndl0/SB_8C_2011_630_thumb1.png?imgmax=800" width="634" height="328"&gt;&lt;/a&gt; &lt;/p&gt; &lt;p align="justify"&gt;Hasta la próxima.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:92a3cf95-6acb-43eb-b1c8-ec150290b147" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sistemas" rel="tag"&gt;Sistemas&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesadores" rel="tag"&gt;procesadores&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;,&lt;a href="http://technorati.com/tags/core" rel="tag"&gt;core&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Sandy+Bridge" rel="tag"&gt;Sandy Bridge&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-7178113993325513108?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/7178113993325513108/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/08/intel-sandy-bridge-versus-westmere-die.html#comment-form" title="1 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7178113993325513108?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/7178113993325513108?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/aynz0wz_Ucg/intel-sandy-bridge-versus-westmere-die.html" title="Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh4.ggpht.com/__p96Ony2voA/TB37e0z7nrI/AAAAAAAAESI/K7BY6i0RJRs/s72-c/SB_4C_630p_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>1</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/08/intel-sandy-bridge-versus-westmere-die.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkAESXg9fCp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-4983533244725349123</id><published>2010-07-29T18:33:00.001+02:00</published><updated>2011-03-17T17:51:48.664+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:51:48.664+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="experiencias" /><category scheme="http://www.blogger.com/atom/ns#" term="GPU" /><title>Novedades y expectativas 2010. Actualizado – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Estamos en una época de transición, tanto AMD como Intel presentan en breve novedades importantes que incluyen reformas microarquitecturales profundas.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TFQy5X32phI/AAAAAAAAEVQ/omiALYyLuMM/s1600-h/GloFo32nm%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="GloFo32nm" border="0" alt="GloFo32nm" src="http://lh3.ggpht.com/__p96Ony2voA/TFQy6aKBd3I/AAAAAAAAEVU/r7YxNO8fdYs/GloFo32nm_thumb%5B1%5D.jpg?imgmax=800" width="642" height="484"&gt;&lt;/a&gt; El proceso de 32 nm va a traer muchas novedades al portafolio de CPUs de AMD.&lt;/p&gt; &lt;p align="justify"&gt;Ya he escrito varios artículos sobre los nuevos Intel Sandy Bridge 32 nm:&lt;/p&gt; &lt;ul&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Micrograf&amp;iacute;a detallada de Intel Sandy Bridge &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/06/micrografia-detallada-de-intel-sandy.html"&gt;Micrografía detallada de Intel Sandy Bridge – ProfessionalSAT&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Intel Sandy Bridge. Introducci&amp;oacute;n &amp;ndash; ProfessionalSAT" href="http://professionalsat.blogspot.com/2010/04/intel-sandy-bridge-introduccion.html"&gt;Intel Sandy Bridge. Introducción – ProfessionalSAT&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Intel Sandy Bridge versus Westmere die. Actualizado &amp;ndash; LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/04/intel-sandy-bridge-versus-westmere-die.html"&gt;Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware&lt;/a&gt;&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/ul&gt; &lt;p align="justify"&gt;y sobre los esperadísimos AMD Bulldozer de 32 nm:&lt;/p&gt; &lt;ul&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="AMD Bulldozer. Prestaciones estimadas - LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html"&gt;AMD Bulldozer. Prestaciones estimadas – LowLevelHardware&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Microarquitectura AMD Bulldozer 2011. Actualizado - LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html"&gt;Microarquitectura AMD Bulldozer 2011. Actualizado – LowLevelHardware&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a title="Previo AMD Bulldozer. Actualizado - LowLevelHardware" href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html"&gt;Previo AMD Bulldozer. Actualizado – LowLevelHardware&lt;/a&gt;&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;&lt;strong&gt;Roadmap de AMD para 2011.Roadmap de AMD 2010. &lt;/strong&gt;&lt;strong&gt;Ontario 32 nm.&lt;em&gt;&lt;em&gt;&lt;em&gt;&lt;/em&gt;&lt;/em&gt;&lt;/em&gt;&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt; &lt;p align="center"&gt;&lt;font color="#0080ff"&gt;&lt;strong&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_CPU_roadmap_2010" border="0" alt="AMD_CPU_roadmap_2010" src="http://lh5.ggpht.com/__p96Ony2voA/TFQxUJDA73I/AAAAAAAAEU8/Q6WmNS55XBY/AMD_CPU_roadmap_2010_thumb%5B1%5D.jpg?imgmax=800" width="470" height="372"&gt;&lt;/strong&gt;&lt;/font&gt;Roadmap de AMD para 2011.&lt;/p&gt; &lt;p align="justify"&gt;AMD tiene previsto para finales de este año (Q4 2010) su nuevo procesador Ontario. Un dual core con GPU DX11 integrada. Los cores de Ontario son los nuevos Bobcat de los que hablé en un pasado artículo.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TFQxVljQ_pI/AAAAAAAAEVA/lxuzHDTi4KE/s1600-h/AMD_Notebook_Roadmap_2010_1%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_Notebook_Roadmap_2010_1[1]" border="0" alt="AMD_Notebook_Roadmap_2010_1[1]" src="http://lh3.ggpht.com/__p96Ony2voA/TFQxWUi1szI/AAAAAAAAEVE/yLamtEwO2dU/AMD_Notebook_Roadmap_2010_1%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="644" height="407"&gt;&lt;/a&gt; Ontario formará parte de la plataforma Brazos.&lt;/p&gt; &lt;p align="justify"&gt;Si el proceso de 32nm SOI de Global Foundries evoluciona según lo esperado será el primer procesador fabricado en este nuevo nodo por AMD.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TFGtIgPGmII/AAAAAAAAEUQ/fXwu1cdOecI/s1600-h/amd_2010_bobcat%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="amd_bobcat_core" border="0" alt="amd_bobcat_core" src="http://lh6.ggpht.com/__p96Ony2voA/TFGtKLs8uEI/AAAAAAAAEUU/d6btvfQdbFw/amd_2010_bobcat_thumb%5B1%5D.png?imgmax=800" width="644" height="364"&gt;&lt;/a&gt;AMD Bobcat core. En Ontario habrá dos de ellos además de una GPU DX11 integrada.&lt;/p&gt; &lt;p align="justify"&gt;AMD posiciona a Bobcat como competidor de los anémicos cores de los procesadores Intel Atom. Según AMD sus prestaciones serán netamente superiores.&lt;/p&gt; &lt;p align="justify"&gt;Contará con dos pipelines de enteros y una unidad FPU simplificada con dos pipelines. Su TDP por core irá desde&amp;nbsp; algo menos de 1 W hasta los 10 W en función de las frecuencias y voltajes aplicados.&lt;/p&gt; &lt;p align="center"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_fusion" border="0" alt="AMD_fusion" src="http://lh4.ggpht.com/__p96Ony2voA/TFGtKtK0OLI/AAAAAAAAEUY/MCe8pBM7aB0/fusionmethodology_thumb%5B1%5D.jpg?imgmax=800" width="554" height="286"&gt;AMD Fusion, su primer representante de 32 nm será Ontario.&lt;/p&gt; &lt;p align="justify"&gt;En mi opinión serán cores capaces de mover Windows 7 con cierta alegría y gracias a la presencia de la GPU integrada DX11 (basada en la arquitectura ATI Radeon HD 5000) espero prestaciones decorosas en video HD y juegos. Todo ello con un consumo que permitirá su integración en netbooks de gama alta.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;&lt;strong&gt;Llano 32 nm, retrasado a principios de 2011.&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El segundo procesador de AMD para 2010 y fabricado igualmente en 32 nm por GloFo iba a ser Llano según los roadmaps de AMD. Desafortunadamente y debido a retrasos en su diseño ha sido pospuesto a principios de 2011. Será la CPU destinada a sustituir los Phenom II X2 y X4 de 45 nm.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TFQxXNr6J1I/AAAAAAAAEVI/Kbt3kdXKejA/s1600-h/AMD_Desktop_Roadmap_2010_20%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_Desktop_Roadmap_2010_20" border="0" alt="AMD_Desktop_Roadmap_2010_20" src="http://lh6.ggpht.com/__p96Ony2voA/TFQxX_sGrkI/AAAAAAAAEVM/cRS5XyJUFpg/AMD_Desktop_Roadmap_2010_20_thumb%5B1%5D.jpg?imgmax=800" width="644" height="408"&gt;&lt;/a&gt; La plataforma Lynx contará con procesadores Llano.&lt;/p&gt; &lt;p align="justify"&gt;Será un procesador con GPU integrada (también DX11) más potente que la de Bobcat (se rumorean 400 – 480 SPs) y dos o cuatro cores derivados de los que encontramos actualmente en los Phenom II.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TFGtLtzMlMI/AAAAAAAAEUc/dwozhWHnjXs/s1600-h/AMD-Fusion-LLano-Vierkern%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_Llano_core" border="0" alt="AMD_Llano_core" src="http://lh3.ggpht.com/__p96Ony2voA/TFGtMe-MT4I/AAAAAAAAEUg/vVvpM4s_Bo4/AMD-Fusion-LLano-Vierkern%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="631" height="484"&gt;&lt;/a&gt;Die de uno de los cores de Llano 40 nm.&lt;/p&gt; &lt;p align="justify"&gt;Cada core contará con 1 MB de L2 privada, no habrá caché L3 compartida y las controladoras de memoria (2 canales de DDR3) darán servicio a los 4 cores y a la GPU.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/TFGtOZ4rY6I/AAAAAAAAEUk/9azmi0k6LzU/s1600-h/AMD_K10_32nm%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_K10.6_32nm" border="0" alt="AMD_K10.6_32nm" src="http://lh4.ggpht.com/__p96Ony2voA/TFGtQFKS-EI/AAAAAAAAEUo/CfaUQ14Yi6M/AMD_K10_32nm_thumb%5B1%5D.png?imgmax=800" width="634" height="495"&gt;&lt;/a&gt; Otra vista de uno de los cores de Ontario.&lt;/p&gt; &lt;p align="justify"&gt;Los cores presentan numerosas mejoras respecto a los conocidos K10.5 de Phenom II, en el análisis del&amp;nbsp; die ya se aprecian bastantes reformas destinadas a mejorar el rendimiento en enteros y en FPU.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/TFQ1TDJEINI/AAAAAAAAEVY/xfzImHTmrFE/s1600-h/LlanoPowegate%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="LlanoPowegate[1]" border="0" alt="LlanoPowegate[1]" src="http://lh6.ggpht.com/__p96Ony2voA/TFQ1UAixzYI/AAAAAAAAEVc/KXbU92h_9d0/LlanoPowegate%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="432" height="484"&gt;&lt;/a&gt; Mejoras en los cores de Llano.&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;La ventana de instrucciones ha aumentado de 72 a 84 entradas (desde los K10.5).Es utilizada por el hardware OOO (Out of Order Execution) para extraer paralelismo y ejecutar en el orden óptimo el stream de instrucciones con la máxima ocupación de las unidades de proceso.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Se ha dotado a la unidad de enteros de hardware para la división.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Se ha reducido la latencia de las instrucciones de coma flotante FPU.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Se ha mejorado el prefetch de datos para aumentar las tasas de aciertos de las cachés L1 y L2.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Se ha reducido las latencias de transición entre los estados de caché y ha aumentado la velocidad escritura en memoria.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Como en todo procesador actual se ha trabajado duramente en reducir su consumo, ampliando el clock gating y dotándolo de core gating.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/TFGtSxGSKqI/AAAAAAAAEUs/gx8zqmTX-is/s1600-h/AMD-Fusion-LLano%5B1%5D%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="AMD_Lano_cut" border="0" alt="AMD_Lano_cut" src="http://lh5.ggpht.com/__p96Ony2voA/TFGtWC5Dm8I/AAAAAAAAEUw/lT0h4XNuRgU/AMD-Fusion-LLano%5B1%5D_thumb%5B1%5D.png?imgmax=800" width="517" height="484"&gt;&lt;/a&gt; Fotografía parcial del die de AMD Ontario 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Se observan los cuatro cores cada uno con 1 MB de L2 y abajo la GPU integrada, la fotografía está cortada por su parte inferior.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/TFGtW3enykI/AAAAAAAAEU0/j0BsV376iOo/s1600-h/apuu%5B1%5D%5B4%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Llano32nm" border="0" alt="Llano32nm" src="http://lh5.ggpht.com/__p96Ony2voA/TFGtXkV18VI/AAAAAAAAEU4/tBETY44nzYU/apuu%5B1%5D_thumb%5B2%5D.jpg?imgmax=800" width="644" height="440"&gt;&lt;/a&gt; AMD Llano 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Aunque a mi modo de ver, si AMD diseña Llano con un número de SPs elevado (más de 320) estará claramente limitado por su ancho de banda de memoria (2 canales DDR3 1333 para gráficos es poca cosa…)&lt;/p&gt; &lt;p align="justify"&gt;Veremos cono se plasma todo en los diseños definitivos, a mediados de Agosto AMD desvela la microarquitectura detrás de Bulldozer, os mantendré informados.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:00c417e2-1ed3-4c18-bc88-18d78db9adf2" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/microarquitectura" rel="tag"&gt;microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/CPU" rel="tag"&gt;CPU&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Ontario" rel="tag"&gt;Ontario&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bobcat" rel="tag"&gt;Bobcat&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Llano" rel="tag"&gt;Llano&lt;/a&gt;,&lt;a href="http://technorati.com/tags/procesador" rel="tag"&gt;procesador&lt;/a&gt;,&lt;a href="http://technorati.com/tags/radmap" rel="tag"&gt;radmap&lt;/a&gt;,&lt;a href="http://technorati.com/tags/2010" rel="tag"&gt;2010&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-4983533244725349123?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/4983533244725349123/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4983533244725349123?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4983533244725349123?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/2fhuxIvjkMA/novedades-y-expectativas-2010.html" title="Novedades y expectativas 2010. Actualizado – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/TFQy6aKBd3I/AAAAAAAAEVU/r7YxNO8fdYs/s72-c/GloFo32nm_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/07/novedades-y-expectativas-2010.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkADQHg4fCp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-3462383563733820886</id><published>2010-02-25T19:29:00.001+01:00</published><updated>2011-03-17T17:52:51.634+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:52:51.634+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="Istambul" /><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="Shanghai" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="PhenomII" /><category scheme="http://www.blogger.com/atom/ns#" term="K11" /><category scheme="http://www.blogger.com/atom/ns#" term="experiencias" /><category scheme="http://www.blogger.com/atom/ns#" term="K10" /><category scheme="http://www.blogger.com/atom/ns#" term="Magny cours" /><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="frecuencia" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="Opteron" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr3" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>AMD Bulldozer. Prestaciones estimadas - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;En el &lt;a href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html" target="_blank"&gt;tercero&lt;/a&gt; de esta serie de artículos dedicados a la próxima micro arquitectura de AMD voy a aventurar mis previsiones sobre su nivel prestacional. Además lo compararé con los diseños actuales y con su muy evolucionado y perfeccionado futuro competidor, Intel Sandy Bridge.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/S4bAPlmQ0cI/AAAAAAAAEM8/ZO-BZFoM0h0/s1600-h/Bulldozer_server%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Bulldozer_server" border="0" alt="Bulldozer_server" src="http://lh5.ggpht.com/__p96Ony2voA/S4bAQrtgc0I/AAAAAAAAENA/cTlv7_yt9EQ/Bulldozer_server_thumb%5B1%5D.png?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; AMD Bulldozer, la próxima micro arquitectura.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Bulldozer module, el módulo Bulldozer:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/S4bARobGkXI/AAAAAAAAENE/CEGA6bz5J1s/s1600-h/BulldozerModule%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="BulldozerModule" border="0" alt="BulldozerModule" src="http://lh3.ggpht.com/__p96Ony2voA/S4bASzX5OgI/AAAAAAAAENI/zquLUQlWQYE/BulldozerModule_thumb%5B1%5D.png?imgmax=800" width="543" height="521"&gt;&lt;/a&gt;AMD Bulldozer module.&lt;/p&gt; &lt;p align="justify"&gt;AMD llama &lt;font color="#ff0000"&gt;&lt;strong&gt;módulo &lt;/strong&gt;&lt;/font&gt;al conjunto siguiente:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Las etapas de Fetching&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La circuitería de Decodificación X64&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Los tres Schedulers independientes&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Las cachés L1i&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Los 2 cores de enteros compuestos de 2 ALUs y 2 AGUs&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Una doble FPU con capacidad FMAC de 128 bit&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Las cachés L1d&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La L2 compartida para todas las unidades funcionales dentro del módulo&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Este concepto se contrapone a la actual acepción de core. En los actuales diseños entendemos como core al conjunto del procesador excluyendo las interfaces externas, el North Bridge y en todo caso la caché L3 compartida (de haberla).&lt;/p&gt; &lt;p align="justify"&gt;AMD nos obliga a cambiar el concepto para subrayar que cada módulo contiene &lt;strong&gt;&lt;u&gt;dos cores&lt;/u&gt;&lt;/strong&gt; funcionales e independientes de proceso de enteros.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Prestaciones por ciclo esperadas&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;A estas alturas tengo absolutamente claro que el tamaño en mm2 de la parte lógica (excluyendo L2 e interfaces) de Bulldozer será notable, claramente superior a sus actuales cores K10.5.&lt;/p&gt; &lt;p align="justify"&gt;AMD ha comunicado que su núcleo K10 fabricado en 32 nm SOI HKMG por &lt;a href="http://www.globalfoundries.com/" target="_blank"&gt;GloFo&lt;/a&gt; ocupa solamente 9.69 mm2 para 35 M Transistores, 17.7 mm2 incluyendo 1 MB de L2 (110 MT).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/S4bAUAFoa3I/AAAAAAAAENQ/ofk-SYrWGzU/s1600-h/AMD_K10_32nm%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="AMD_K10_32nm" border="0" alt="AMD_K10_32nm" src="http://lh4.ggpht.com/__p96Ony2voA/S4bAV02WWLI/AAAAAAAAENU/8A_zvceU95c/AMD_K10_32nm_thumb%5B1%5D.png?imgmax=800" width="634" height="495"&gt;&lt;/a&gt; AMD K10 32 nm core 1 MB L2.&lt;/p&gt; &lt;p align="justify"&gt;Estimo que el área lógica (ALUs + FPU) de Bulldozer se irá a la zona de los 20 mm2 en 32 nm, el doble que K10 32 nm y más área de die que los actuales cores K10.5 de 45 nm de Phenom II (unos 17 mm2).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S4bAYfGyiYI/AAAAAAAAENY/3mI5By86TwM/s1600-h/K10.5_45nm_1MB%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="K10.5_45nm_1MB" border="0" alt="K10.5_45nm_1MB" src="http://lh4.ggpht.com/__p96Ony2voA/S4bAb8oWhbI/AAAAAAAAENc/_PIx2GCCgRQ/K10.5_45nm_1MB_thumb%5B1%5D.png?imgmax=800" width="634" height="504"&gt;&lt;/a&gt;AMD K10.5 45 nm 1 MB de L2.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Prestaciones en coma flotante (FPU)&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Donde habrá un gran incremento en número de transistores será en la gran FPU doble de 128 bit con capacidad FMAC.&lt;/p&gt; &lt;p align="justify"&gt;La actual implementación en K10.5 de 45 nm (Phenom II) comprende 3 pipelines de coma flotante especializados de 128 bit:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;FMUL&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;FADD&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;FMISC&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Esta limitación reduce su capacidad de proceso FPU puesto que cada unidad procesa un tipo de instrucciones y cada tipo de instrucción debe ir a su unidad y no otra.&lt;/p&gt; &lt;p align="justify"&gt;En Bulldozer ambos pipelines son generales (ejecutan cualquier instrucción FPU) y simétricos y por ello resulta una arquitectura mucho más potente en cálculo matemático.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#ffffff"&gt;&lt;strong&gt;&lt;u&gt;En coma flotante espero un gran avance en prestaciones &lt;em&gt;clock for clock&lt;/em&gt; respecto a los actuales diseños de AMD, cifrado en torno a un 50%&lt;/u&gt;&lt;/strong&gt;&lt;/font&gt; para 4 módulos Bulldozer con sus 4 FPUs dobles frente a las 6 FPUs con 3 pipelines de 128 bit cada una del hexacore Istambul.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/S4bAc5vRMSI/AAAAAAAAENg/iseZk_wxN_A/s1600-h/Istambul45nm%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Istambul45nm" border="0" alt="Istambul45nm" src="http://lh3.ggpht.com/__p96Ony2voA/S4bAeL9I0yI/AAAAAAAAENk/V_3h4JWxUoQ/Istambul45nm_thumb%5B1%5D.jpg?imgmax=800" width="634" height="461"&gt;&lt;/a&gt; AMD Istambul hexacore, Bulldozer lo superará en un 50% en potencia FPU.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;&lt;strong&gt;Prestaciones en proceso de enteros&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Los Int cores muy probablemente serán más cortos en transistores que los actuales cores de enteros de Phenom II. De hecho reducen su capacidad de 3 ALUs mas 3 AGUs a 2 mas 2 respectivamente. AMD claramente apuesta por un futuro multithread…&lt;/p&gt; &lt;p align="justify"&gt;Las prestaciones por Int core en cambio serán muy probablemente inferiores a las actuales en Phenom II.&lt;/p&gt; &lt;p align="justify"&gt;Según las propias estimaciones de AMD, un MCM Bulldozer con 16 Int cores será un 37% más rápido que el doble hexa core Magny Cours. Si calculamos, a igualdad de cores, llegamos a un empate técnico.&lt;/p&gt; &lt;p align="justify"&gt;Es decir, &lt;u&gt;&lt;strong&gt;&lt;font color="#ffffff"&gt;las prestaciones multithreaded en proceso de enteros serán equivalentes&lt;/font&gt;&lt;/strong&gt;&lt;/u&gt;. En cambio, en algoritmos single threaded parece que Bulldozer será inferior a los actuales cores de AMD. Me puedo equivocar pero a la luz de los datos conocidos…&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Frecuencias estimadas&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;La frecuencia de trabajo de un microprocesador actual la determinan numerosos factores:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;La capacidad de la lógica de procesamiento (ALUs, FPUs…) de funcionar con corrección y estabilidad a esa frecuencia con un voltaje razonable.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;La capacidad de realizar las comunicaciones inter core en un tiempo suficientemente corto para finalizar la transferencia antes del siguiente tick de reloj.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Frecuencia máxima de las cachés a la latencia y voltaje estipulado.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Entrar dentro del TDP de diseño (Thermal envelope) a esa frecuencia y voltaje en carga máxima combinada.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Como vemos, por un lado la frecuencia viene determinada por las capacidades del chip, del “silicio”, y por otro lado de no excederse en disipación térmica.&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;La velocidad de propagación de las señales eléctricas es limitada (y muy, muy inferior a la de la luz contrariamente a lo que algunos piensan) y por ello transcurre un tiempo finito desde que una unidad envía un resultado hasta que otra unidad lo recibe y puede comenzar su procesamiento sobre él. Esto limita la frecuencia de los procesadores y motiva que su diseño sea extremadamente complejo pues hay que posicionar las unidades que necesitan comunicación mutua lo más cerca posible (no en distancia, sino en tiempo – latencia –).&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;La disipación térmica depende de la frecuencia linealmente y del voltaje. La dependencia del voltaje es con una potencia entre 2 y 3:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Doble frecuencia, doble disipación.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Doble voltaje, de 4 a 8 veces mayor disipación térmica.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Como todos sabéis, a mayor voltaje (dentro de las limitaciones del diseño y el proceso de fabricación) mayor fiabilidad y linealidad en el rendimiento de los transistores de los que está compuesto el chip.&lt;/p&gt; &lt;p align="justify"&gt;Todos estos condicionantes dan un rango de voltaje utilizable en el procesador, cuanto más nos acercamos al máximo obtendremos una mayor frecuencia estable pero con un gran consumo y en cambio, en la parte baja del rango obtendremos una menor frecuencia pero un excelente &lt;em&gt;performance per watt.&lt;/em&gt;&lt;/p&gt; &lt;p align="justify"&gt;Estimo que las frecuencias de Bulldozer se moverán en el mismo rango que los actuales cores Shanghai y Interlagos, sus frecuencias máximas rondarán los 3+ GHz. No veo probable cruzar los 4 GHz con TDPs razonables (máximo de 140W).&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:2406a52b-328c-4345-bfa3-aa3dd3f7746d" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/roadmap" rel="tag"&gt;roadmap&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32nm" rel="tag"&gt;32nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/GloFo" rel="tag"&gt;GloFo&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-3462383563733820886?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/3462383563733820886/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html#comment-form" title="10 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3462383563733820886?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/3462383563733820886?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/K-m6T67c2iw/amd-bulldozer-prestaciones-estimadas.html" title="AMD Bulldozer. Prestaciones estimadas - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/__p96Ony2voA/S4bAQrtgc0I/AAAAAAAAENA/cTlv7_yt9EQ/s72-c/Bulldozer_server_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>10</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/02/amd-bulldozer-prestaciones-estimadas.html</feedburner:origLink></entry><entry gd:etag="W/&quot;Ck8FRHwyeyp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-8982628413442627817</id><published>2010-02-21T21:15:00.001+01:00</published><updated>2011-03-17T17:53:35.293+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:53:35.293+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="cache" /><category scheme="http://www.blogger.com/atom/ns#" term="L3 caché" /><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="Opteron" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr3" /><category scheme="http://www.blogger.com/atom/ns#" term="L3 cache" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>Microarquitectura AMD Bulldozer 2011. Actualizado - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;AMD ha diseñado y tiene ya finalizado el &lt;em&gt;floorplan&lt;/em&gt; del nuevo procesador que en 2011 inaugurará una nueva microarquitectura. Un concepto revolucionario en muchos aspectos que no por ello deja de suscitarme algunas dudas acerca de su rendimiento single thread.&lt;/p&gt; &lt;p align="justify"&gt;Será fabricado para AMD por &lt;a href="http://www.globalfoundries.com/" target="_blank"&gt;Global Foundries&lt;/a&gt; en el proceso de 32 nm SOI&amp;nbsp; high-k metal gate ya que AMD se deshizo de sus fábricas de semiconductores (wafers).&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Los orígenes de Bulldozer&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/S4GUE2ZLa6I/AAAAAAAAEL4/M4QFtSqSjzQ/s1600-h/Cluster_multithreading%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Cluster_multithreading" border="0" alt="Cluster_multithreading" src="http://lh5.ggpht.com/__p96Ony2voA/S4GUGF7HjJI/AAAAAAAAEL8/30BydEHCjvk/Cluster_multithreading_thumb%5B1%5D.png?imgmax=800" width="634" height="476"&gt;&lt;/a&gt; Captura de una presentación de AMD en 2005.&lt;/p&gt; &lt;p align="justify"&gt;Ya en 2005 AMD compartió con la prensa especializada sus ideas de futuro acerca de las líneas de diseño que se irían imponiendo en sus futuros diseños. En aquella época AMD había cancelado el diseño K9, un procesador con paralelismos a la serie Netburst de Intel, largos pipelines y probablemente SMT al estilo HyperThreading. Se rumorea que constaba de 2 clusters de 4 pipelines de enteros y una trace cache L1 similar a la del Pentium 4…&lt;/p&gt; &lt;p align="justify"&gt;Como todos sabemos AMD sabiamente escogió el camino dual core con los Athlon64 X2. El problema es que los equipos de diseño de AMD estuvieron ocupados en un procesador durante uno o dos años que fue tardíamente cancelado. Demasiado tiempo perdido…&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;El esquema general de AMD Bulldozer y algunas especulaciones de cosecha propia&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;La microarquitectura subyacente en Bulldozer ha sido someramente esbozada por AMD a finales de 2009.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/S4GUHTYp67I/AAAAAAAAEMA/Deo33XxdZZo/s1600-h/Bulldozer_module%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Bulldozer_module" border="0" alt="Bulldozer_module" src="http://lh4.ggpht.com/__p96Ony2voA/S4GUI4GfxYI/AAAAAAAAEME/ClFAGVySe5g/Bulldozer_module_thumb%5B1%5D.png?imgmax=800" width="634" height="360"&gt;&lt;/a&gt; AMD Financial Analyst Day 2009.&lt;/p&gt; &lt;p align="justify"&gt;AMD plantea cada core de Bulldozer como un dual core de enteros con una sola FPU doble de 2 x 128 bits. Las cachés L1d están duplicadas, pues está pensado para proceso concurrente de dos threads, uno por int-core (core de enteros) ya que de no ser así habría polución de caché lo que no sería nada recomendable dado su pequeño tamaño.&lt;/p&gt; &lt;p align="justify"&gt;Los schedulers de enteros también están duplicados por thread y por int-core. De este modo el critical loop de procesamiento (scheduler –&amp;gt; ejecución de enteros –&amp;gt; caché de datos) permanece aislado por thread, evitando así interferencias y manteniendo bajas latencias tanto de ejecución como de acceso a L1.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S4GUJ7k1_dI/AAAAAAAAEMI/Ybkk6MR-Zf4/s1600-h/Bulldoxer_4module_8int_cores_L3shared_630%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Bulldoxer_4module_8int_cores_L3shared_630" border="0" alt="Bulldoxer_4module_8int_cores_L3shared_630" src="http://lh4.ggpht.com/__p96Ony2voA/S4GUKTzRGbI/AAAAAAAAEMM/S7NPP5zH1CQ/Bulldoxer_4module_8int_cores_L3shared_630_thumb%5B1%5D.png?imgmax=800" width="634" height="156"&gt;&lt;/a&gt;Cada módulo consta de los dos cores de enteros con sus L1 privadas y la gran FPU doble de 2 x 128 bit.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 1, Caché L1:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Veo razonable y lógico que el tamaño de las cachés L1d disminuya desde los 64 KB actuales a 32 KB o 16 KB por int-core y su asociatividad aumente de las 2 vías actuales a 4 o 8 vías (como en los diseños de Intel). Su latencia debería permanecer en los 3 ciclos o incluso reducirse a 2 ciclos aunque lo veo muy dificultoso.&lt;/p&gt; &lt;p align="justify"&gt;La caché L1i tiene sentido que también sea duplicada reduciendo su tamaño a 32 o 16 KB, una L1i para cada Int-core ya que la FPU podría acceder directamente a la L2 compartida.&lt;/p&gt; &lt;p align="justify"&gt;Otra opción consiste en mantener una L1i unificada de tamaño similar a la actual (64 KB) pero con una asociatividad aumentada a 4 u 8 vías para servir concurrentemente a los dos Int-cores y a la doble FPU, lo que implicaría hacerla triple o quad ported lo que incrementaría mucho su complejidad y su disipación térmica.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 2, caché L2:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Todo estas unidades funcionales comparten una L2 shared de un tamaño que estimo en 256 a 512 KB; espero una latencia más reducida respecto a los actuales 15 – 17 ciclos. Sería recomendable ir hacia los 10 ciclos.&lt;/p&gt; &lt;p align="justify"&gt;La asociatividad seguramente y preferiblemente permanecerá invariada en 16 vías.&lt;/p&gt; &lt;p align="justify"&gt;Si AMD ha diseñado una L2 de gran tamaño, de 1 o 2 MB, puede dilatar las latencias de acceso y creo que sería un error de diseño y un mal compromiso para los siempre sensibles a la latencia algoritmos de proceso de enteros.&lt;/p&gt; &lt;p align="justify"&gt;En nuestros días, y contando con un tercer nivel de caché, la L2 debe ser de pequeño tamaño (256 KB bastan) pero con una latencia muy baja, similar a la de Nehalem con 10 ciclos. Es la mejor opción de diseño sin lugar a dudas.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 3, caché L3:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Será de considerable tamaño, probablemente 8 MB o quizás más para la versión de 4 módulos con 8 int cores. Si AMD hace un buen trabajo con las L2 y sitúa su latencia en un máximo de 12 ciclos (ciclos de core clock) puede aspirar a latencias L3 efectivas inferiores a los 40 ciclos (core clock).&lt;/p&gt; &lt;p align="justify"&gt;Espero una asociatividad de 16 vías para 8 MB y 24 vías para un diseño de 12 MB para favorecer una baja latencia.&lt;/p&gt; &lt;p align="justify"&gt;Si por consideraciones de diseño (poco tiempo o recursos) se deciden por 32 o más vías de asociatividad nos veremos de nuevos en los 40 y pico o 50 ciclos de latencia load-to-use en L3 lo que sería una mala noticia.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 4, Pipelines de enteros:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;No se sabe a ciencia cierta si los citados 4 pipelines de enteros por Int-core se equiparan a los 3 pipelines de proceso de enteros de los Athlon/Athlon XP/Athlon 64/Phenom/Phenom II/Athlon II, es decir &lt;u&gt;excluyen&lt;/u&gt; los tres pipelines dedicados AGU (load-store) o contrariamente los incluyen.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/S4GULShV9DI/AAAAAAAAEMQ/ILgDqMI27OE/s1600-h/amd_bulldozer_2010-2%5B4%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="amd_bulldozer_2010-2" border="0" alt="amd_bulldozer_2010-2" src="http://lh5.ggpht.com/__p96Ony2voA/S4GUM6boZlI/AAAAAAAAEMU/UW2BHuzv5bw/amd_bulldozer_2010-2_thumb%5B2%5D.png?imgmax=800" width="634" height="358"&gt;&lt;/a&gt; 3 schedulers independientes en Bulldozer.&lt;/p&gt; &lt;p align="justify"&gt;En el primer caso y a igualdad de implementación, la potencia de proceso sería un 33% superior por Int-core, lo que ciertamente a AMD le resolvería su problema prestacional principal respecto a Intel, su clara inferioridad en cálculo de enteros por ciclo y core (sobre un 30 – 40 % en Phenom II respecto a core i7 clock-for-clock).&lt;/p&gt; &lt;p align="justify"&gt;Es difícil saberlo a día de hoy, pero ciertamente espero que sea de este modo y no al contrario, como detallo a continuación:&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#008000"&gt;&lt;strong&gt;Hipótesis 1:&lt;/strong&gt;&lt;/font&gt; Si AMD utiliza 4 pipelines para cálculo entero y simultáneamente como &lt;a href="http://ecee.colorado.edu/~ecen4532/manuals/dsp56300family/ch4-agu.pdf" target="_blank"&gt;AGUs&lt;/a&gt; (Address Generation Units) o 2 pipelines de enteros y dos AGUs, la potencia de proceso descendería drásticamente en algunos algoritmos… incluso respecto al actual Shanghai 45 nm (Phenom II) core for core y clock for clock.&lt;/p&gt; &lt;blockquote&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;em&gt;He leído a algunos ingenieros de AMD e incluso a alguien de su Staff directivo alabar las cualidades de proceso multi thread de Bulldozer y eludir comentarios sobre potencia de cálculo single thread. Sinceramente, espero haber entendido mal sus comentarios…&lt;/em&gt;&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt; &lt;p align="justify"&gt;En este caso, a igualdad de reloj y en procesos single threaded sería más rápido un Phenom II actual que este hipotético Bulldozer aunque tuviese muchos más cores disponibles para ejecutar más threads.&lt;/p&gt; &lt;p align="justify"&gt;Por supuesto, en este caso Intel no tendría competencia en software single threaded. Pensad que para entonces Intel comercializará Sandy Bridge, su próxima microarquitectura.&lt;/p&gt; &lt;p align="justify"&gt;&amp;nbsp;&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Prestaciones estimadas:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="center"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S4GUNnpCqWI/AAAAAAAAEMY/TCQeel7EvAY/s1600-h/slide3%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="slide3[1]" border="0" alt="slide3[1]" src="http://lh5.ggpht.com/__p96Ony2voA/S4GUORnKkqI/AAAAAAAAEMc/dDgxCX86VKc/slide3%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="604" height="454"&gt;&lt;/a&gt;&lt;/font&gt;&lt;/strong&gt;Prestaciones estimadas en Abril de 2009 por AMD para Interlagos.&lt;/p&gt; &lt;p align="justify"&gt;Interlagos será un MCM de dos chips, un dual quad-module Bulldozer con 16 int-cores y 8 FPUs dobles de 128 bit destinado a servidores, sustituirá a los Magny-Cours 12 cores que ahora mismo AMD empieza a comercializar para socket G34. Se tratará de un MCM compuesto por dos dies de cuatro módulos Bulldozer y contará con cuatro canales DDR3 probablemente a 1600 MHz.&lt;/p&gt; &lt;p align="justify"&gt;Ambos dies irán unidos por enlaces HT3.&lt;/p&gt; &lt;p align="justify"&gt;Según las presentaciones de AMD, su velocidad relativa en enteros y FPU será la siguiente:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Un Opteron Istambul hexa core lo sitúan en 18 Int y 14 FP.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Para el MCM Magny-Cours 12 cores: 26 Int, 27 FP.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Para Interlagos 16 cores: 37 Int, 47 FP.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;En una presentación posterior observamos:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/S4GUO20_jhI/AAAAAAAAEMg/s9bsJVGpiE8/s1600-h/serverperformane%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="serverperformane[1]" border="0" alt="serverperformane[1]" src="http://lh6.ggpht.com/__p96Ony2voA/S4GUPjlypII/AAAAAAAAEMk/1h725kJbcDw/serverperformane%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="554" height="290"&gt;&lt;/a&gt; Prestaciones estimadas en Noviembre de 2009 por AMD para Interlagos.&lt;/p&gt; &lt;p align="justify"&gt;Según las nuevas presentaciones de AMD, su velocidad relativa en enteros y FPU sería la siguiente:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Un Opteron Istambul hexa core lo sitúan en 16 Int y 13 FP.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Para el MCM Magny-Cours 12 cores: 27 Int, 28 FP.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Para Interlagos 16 cores: 37 Int, 44 FP.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Con los últimos datos, basados en estimaciones de AMD a noviembre de 2009,&lt;u&gt;&lt;font color="#c0c0c0"&gt; &lt;strong&gt;Istambul será un 57% superior en coma flotante FP y un 37% en enteros al actual MCM Magny-Cours de 12 cores.&lt;/strong&gt;&lt;/font&gt;&lt;/u&gt;&lt;/p&gt; &lt;p align="justify"&gt;Teniendo en cuenta que Interlagos cuenta con 16 Int-cores y 8 FPUs dobles de 128 bit y Magny-Cours respectivamente 12 Int cores y 12 FPUs de 128 bit.&lt;/p&gt; &lt;p align="justify"&gt;Para sobremesas domésticos AMD comercializará los Zambezi, unos procesadores octal Int-cores nativos con 4 FPUs dobles de 128 bit formados por 4 módulos y con soporte para DDR3 1866 dual channel.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S4GUJ7k1_dI/AAAAAAAAEMI/Ybkk6MR-Zf4/s1600-h/Bulldoxer_4module_8int_cores_L3shared_630%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Bulldoxer_4module_8int_cores_L3shared_630" border="0" alt="Bulldoxer_4module_8int_cores_L3shared_630" src="http://lh4.ggpht.com/__p96Ony2voA/S4GUKTzRGbI/AAAAAAAAEMM/S7NPP5zH1CQ/Bulldoxer_4module_8int_cores_L3shared_630_thumb%5B1%5D.png?imgmax=800" width="634" height="156"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 5, prestaciones en enteros de Bulldozer:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Estimo unas débiles prestaciones &lt;u&gt;single threaded&lt;/u&gt; en enteros para Bulldozer respecto a Intel Sandy Bridge y también respecto a Westmere. Sin duda, en el terreno &lt;u&gt;multi thread&lt;/u&gt; su potencia representará un gran avance para AMD en enteros y en cálculo matemático en coma flotante (FPU) y probablemente luchará en igualdad con Intel en FP y quizás en enteros.&lt;/p&gt; &lt;p align="justify"&gt;Según los ingenieros de AMD (espero que sea así y no hable el departamento de marketing) se espera una mejora de un 80% en enteros gracias al segundo core integrado. Como vemos subrayan el aspecto multi thread pero nadie habla sobre su velocidad en cálculo con un solo hilo de ejecución.&lt;/p&gt; &lt;p align="justify"&gt;Como podéis inferir, me inclino por la segunda opción en la&amp;nbsp; anterior &lt;strong&gt;&lt;font color="#008000"&gt;Hipótesis 1.&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 6, la FPU de Bulldozer:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;AMD ha echado el resto con la gigantesca FPU (ocupará una gran superficie del die) de Bulldozer, hablando en porcentaje del área lógica (excluyendo caches) estimo que será similar a la suma de los dos int-cores con sus L1i y L1d (!!).&lt;/p&gt; &lt;p align="justify"&gt;Se trata de una FPU doble de 128 bit con capacidad FMAC (Fused Multiply Accumulate) y AVX de 128 y 256 bit. De echo será capaz de trabajar simultáneamente en dos threads simultáneos con 128 bit de precisión o dedicarse totalmente a un solo thread con todos sus recursos.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#ffff80"&gt;Especulación 7, AMD necesita urgentemente “Turbo Boost”:&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Una característica diferenciadora de los actuales procesadores Intel es su capacidad para aumentar la frecuencia de los cores activos siempre que haya margen hasta el TDP (Thermal Design Power).&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://en.wikipedia.org/wiki/Amdahl's_law" target="_blank"&gt;La Ley de Amdahl&lt;/a&gt; estipula que la aceleración obtenida por un sistema multiprocesador siempre estará limitada por los fragmentos de código secuencial o no paralelizable (single-threaded).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/S4GUQaX-moI/AAAAAAAAEMo/M28iomeTxWE/s1600-h/648px-AmdahlsLaw_svg%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="648px-AmdahlsLaw_svg" border="0" alt="648px-AmdahlsLaw_svg" src="http://lh5.ggpht.com/__p96Ony2voA/S4GUQ4bsp5I/AAAAAAAAEMs/DIbw2rASWbs/648px-AmdahlsLaw_svg_thumb%5B1%5D.jpg?imgmax=800" width="634" height="476"&gt;&lt;/a&gt; Aumento de velocidad con el número de cores y según el porcentaje de código paralelizable.&lt;/p&gt; &lt;p align="justify"&gt;AMD planea integrar algo similar en todos sus futuros procesadores, pues aunque resulte incómodo reconocerlo, el proceso single-thread domina la velocidad y responsividad de una máquina en los sistemas operativos actuales.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S4GUR9sNiFI/AAAAAAAAEMw/MidTr5VaINw/s1600-h/TurboMode%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="TurboMode" border="0" alt="TurboMode" src="http://lh5.ggpht.com/__p96Ony2voA/S4GUSmzFY8I/AAAAAAAAEM0/yE_qMRTTPTg/TurboMode_thumb%5B1%5D.jpg?imgmax=800" width="604" height="408"&gt;&lt;/a&gt; Turbo Boost en Core i7 serie 800 Lynnfield quad core.&lt;/p&gt; &lt;p align="justify"&gt;Por ejemplo, un Core i7 870 de 3.06 GHz nominales puede, mientras mantiene 3 cores a 1.2 GHz y un voltaje inferior a 1V (sobre 0.80 V) y en estado power-gated (con un consumo virtualmente cero), tener uno de sus núcleos procesando al 100% de carga a &lt;u&gt;3.6 GHz efectivos&lt;/u&gt;. E incluso, con dos núcleos activos en cálculo al 100% de carga, mantiene en ellos frecuencias de proceso de 3.46 GHz.&lt;/p&gt; &lt;p align="justify"&gt;AMD necesita urgentemente algo similar y parece ser que así será. En próximos procesadores integrará capacidades de power gating por core para deshabilitar y cerrar el suministro de corriente a los cores inactivos reservando TDP.&lt;/p&gt; &lt;p align="justify"&gt;Este margen se utilizará para el proceso de los núcleos que lo demanden por su carga de trabajo. De este modo podrá así aumentar su frecuencia y su voltaje sin superar el TDP estipulado por el diseño.&lt;/p&gt; &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Conclusiones&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt; &lt;p align="justify"&gt;Espero, por el bien de la sana competencia, que AMD sea capaz de llevar al mercado en 2011 esta nueva arquitectura. El proceso de 32 nm SOI&amp;nbsp; high-k metal gate de Global Foundries parece bien planteado sobre el papel y ya hay algunas muestras funcionales que incitan al optimismo.&lt;/p&gt; &lt;p align="justify"&gt;El único pero que yo veo al diseño es en algoritmos single thread que todavía (y por bastantes años) pueblan el ecosistema software de nuestros días. La mera instalación de un programa o una suite de ofimática, la navegación por internet y numerosas tareas del sistema operativo son todavía single threaded y así persistirán por largo tiempo dadas las grandes dificultades para su paralelización.&lt;/p&gt; &lt;p align="justify"&gt;Sencillamente hay ciertos procesos que no son paralelizables y para ellos necesitamos anchos procesadores con múltiples y cortos pipelines y grandes motores de ejecución fuera de orden (OOO Execution, Out Of Order Execution) funcionando a altas frecuencias.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:75ff971e-9898-47f9-a7eb-6dcbcec4a22a" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32nm" rel="tag"&gt;32nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Global+foundries" rel="tag"&gt;Global foundries&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarchitecture" rel="tag"&gt;Microarchitecture&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Processor" rel="tag"&gt;Processor&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Pipeline" rel="tag"&gt;Pipeline&lt;/a&gt;,&lt;a href="http://technorati.com/tags/cache" rel="tag"&gt;cache&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-8982628413442627817?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/8982628413442627817/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html#comment-form" title="3 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/8982628413442627817?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/8982628413442627817?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/Q-v2N12sjCM/microarquitectura-amd-bulldozer-2011.html" title="Microarquitectura AMD Bulldozer 2011. Actualizado - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh5.ggpht.com/__p96Ony2voA/S4GUGF7HjJI/AAAAAAAAEL8/30BydEHCjvk/s72-c/Cluster_multithreading_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>3</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/02/microarquitectura-amd-bulldozer-2011.html</feedburner:origLink></entry><entry gd:etag="W/&quot;Ck8BQ3c5eyp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-1589664006285456879</id><published>2010-01-15T20:03:00.001+01:00</published><updated>2011-03-17T17:54:12.923+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:54:12.923+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="32 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="core" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="nehalem" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="QPI" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr3" /><category scheme="http://www.blogger.com/atom/ns#" term="GPU" /><title>Los nuevos Intel dual core: Core i5 y Core i3. Actualizado - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Intel va a empezar en breve a desplazar (inicialmente por la gama más alta) a sus excelentes procesadores Core2Duo de 45 nm con las nuevas gamas de 32 nm basadas en núcleos de microarquitectura Westmere (descendiente de Nehalem) en configuración dual core y asociados a GPUs, por primera vez integradas en el mismo chip.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/S1C77ELsePI/AAAAAAAAEIo/cs_xx4IQ45U/s1600-h/Corei3_i5_desnudo%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Corei3_i5_desnudo" border="0" alt="Corei3_i5_desnudo" src="http://lh6.ggpht.com/__p96Ony2voA/S1C77-haGBI/AAAAAAAAEIs/-jJnFruXvOk/Corei3_i5_desnudo_thumb%5B1%5D.jpg?imgmax=800" width="634" height="424"&gt;&lt;/a&gt;Intel Core i5 y Core i3, el nuevo procesador compuestos de dos dies.&lt;/p&gt; &lt;p align="justify"&gt;Se trata de procesadores con dos dies en un mismo encapsulado, un MCM (multi chip module):&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Un die (fabricado en el nuevo proceso de &lt;strong&gt;&lt;font color="#ff0000"&gt;32 nm&lt;/font&gt;&lt;/strong&gt; con una superficie de unos 74 - 78 mm2) consta de los dos núcleos del procesador dual core junto con la caché L3 compartida de 4 MB, los write buffers de la L3, la circuitería del bus QPI para conexión con el segundo die y otras I/O.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/S1C7-7QTgWI/AAAAAAAAEJA/Iv-UitLxNvc/s1600-h/westmere-dualcoree%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="westmere-dualcoree" border="0" alt="westmere-dualcoree" src="http://lh6.ggpht.com/__p96Ony2voA/S1C7_pkPAII/AAAAAAAAEJE/1xRx9U1HV5M/westmere-dualcoree_thumb%5B1%5D.jpg?imgmax=800" width="544" height="486"&gt;&lt;/a&gt; Westmere dual core: un die de 32 nm incluyendo los núcleos, el QPI y la L3 de 4 MB con los write buffers.&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;El segundo (fabricado en 45 nm con una superficie de 111 - 116 mm2) incluye la GPU integrada con 12 clusters de procesadores gráficos DX10, las controladoras de memoria dual channel DDR3, la circuitería QPI para enlazar con la CPU (el primer die), el bus PCIe y el bus DMI para conectividad con el South Bridge.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;La GPU es un descendiente directo de la empleada en al chipset de las series G45 para Core 2 Duo, en este caso ve aumentada su capacidad de 10 a 12 procesadores y cuenta con numerosas mejoras que elevan su rendimiento al doble, permitiéndole competir con los chipsets integrados de AMD y nVidia.&lt;/p&gt; &lt;p align="justify"&gt;Las controladoras de memoria, desafortunadamente, tienen más que ver con las dual DDR3 de chipset P45 y X48 que con las soberbias integradas en Lynnfield o Nehalem.&lt;/p&gt; &lt;p align="justify"&gt;De echo las latencias de acceso a RAM en estas nuevas CPUs son muy superiores a las de Nehalem1366 o a Lynnfield1156 e incluso son superiores a un simple Core”Duo en una buena placa base P45 con DDR3 1333 y timings 7-7-7-21 2T.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S1C78SBgaUI/AAAAAAAAEIw/oLqmW1An0l4/s1600-h/Corei5_i34.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Corei5_i3_desnudo" border="0" alt="Corei5_i3_desnudo" src="http://lh3.ggpht.com/__p96Ony2voA/S1C789s_SFI/AAAAAAAAEI0/6bP48_mDw2c/Corei5_i3_thumb2.jpg?imgmax=800" width="634" height="617"&gt;&lt;/a&gt; El nuevo multi chip de Intel al descubierto.&lt;/p&gt; &lt;p align="justify"&gt;Al contar con dos dies en un mismo chip, la superficie total es bastante elevada (sobre los 190 mm2) lo que resulta en unos costes de fabricación correspondientemente altos. Por ello, Intel posiciona estos procesadores en unos precios desde los 113$ (excluyendo al muy “capado” Pentium G9650).&lt;/p&gt; &lt;p align="justify"&gt;De este modo no espero una rápida transición desde los actuales Core2Duo de 45 nm a estos nuevos chips, será una transición más bien suave…&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S1C79vAz4GI/AAAAAAAAEI4/Ts79i-iRT2w/s1600-h/GamaClarkdale3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="GamaClarkdale_Excel" border="0" alt="GamaClarkdale_Excel" src="http://lh5.ggpht.com/__p96Ony2voA/S1C7-NOsO_I/AAAAAAAAEI8/GSorbUMV20w/GamaClarkdale_thumb1.jpg?imgmax=800" width="513" height="176"&gt;&lt;/a&gt; Clarkdale: los integrantes de las versiones dual core de la gama Core i5 y Core i3.&lt;/p&gt; &lt;p align="justify"&gt;Los &lt;font color="#0080ff"&gt;Core i5&lt;/font&gt; de la serie 600 contarán con turbo Mode e HyperThreading (SMT) para un total de cuatro threads. Recordemos que por encima se sitúan los Core i5 de la serie 700, siendo éstos quad core nativos con Turbo Mode pero sin SMT basados en dies Lynnfield.&lt;/p&gt; &lt;p align="justify"&gt;En cambio los &lt;font color="#0080ff"&gt;Core i3&lt;/font&gt; de la serie 500 prescinden del turbo Mode aunque mantienen el HyperThreading. En cambio el modelo Pentium G6950 se queda con 3 MB de L3 y sin SMT además de bajar el reloj de la GPU a 533 MHz.&lt;/p&gt; &lt;p align="justify"&gt;Habrán dos versiones, que realmente serán el mismo chip, aunque con distintas funcionalidades activadas. Una de ellas será la versión de sobremesa, &lt;font color="#0080ff"&gt;Clarkdale&lt;/font&gt; y la segunda la destinada a portátiles o &lt;font color="#0080ff"&gt;Arrandale&lt;/font&gt;.&lt;/p&gt; &lt;p align="justify"&gt;La nueva arquitectura, simplifica el esquema de los Core2Duo a los que sustituye. Pasamos de tres chips a solamente dos: Procesador (MCM de dos dies) y South Bridge (en placa base).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/S1C8AEEruJI/AAAAAAAAEJI/M8Fgl59h3ZY/s1600-h/Clarkdale2chip%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Clarkdale2chip" border="0" alt="Clarkdale2chip" src="http://lh5.ggpht.com/__p96Ony2voA/S1C8A4GJ56I/AAAAAAAAEJM/23IpX1jM4Xg/Clarkdale2chip_thumb%5B1%5D.jpg?imgmax=800" width="554" height="291"&gt;&lt;/a&gt; Reducción de complejidad de la plataforma a dos chips.&lt;/p&gt; &lt;p align="justify"&gt;De todos modos, esto no se ha hecho del modo más elegante y sobretodo no del más eficiente prestacionalmente hablando, me explico:&lt;/p&gt; &lt;p align="justify"&gt;Al ser un MCM, Clarkdale pierde la excelente arquitectura de alta integración vista en Nehalem (core i7 serie 900) y Lynnfield (Core i7 serie 800 e i5 serie 700). En un solo die se integraban desde los núcleos pasando por las controladoras de memoria y la L3 hasta los QPI e incluso en el caso de Lynnfield el bus DMI (para comunicar con el chipset P55) y el PCIe 16X (para la GPU).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S1C8BsELlsI/AAAAAAAAEJQ/n5j9VX4s8fk/s1600-h/WestmereWafer1%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="" border="0" alt="" src="http://lh5.ggpht.com/__p96Ony2voA/S1C8CRuPw3I/AAAAAAAAEJU/5lxFfRRp4eM/WestmereWafer1_thumb%5B1%5D.jpg?imgmax=800" width="554" height="371"&gt;&lt;/a&gt; Wafer de dies de 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Los tamaños relativos de ambos dies se observan a continuación:&lt;/p&gt; &lt;p align="center"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="clarkdaledie_dies" border="0" alt="clarkdaledie_dies" src="http://lh3.ggpht.com/__p96Ony2voA/S1C8DG3a3CI/AAAAAAAAEJY/g1FUARva_io/clarkdaledie1_thumb1.jpg?imgmax=800" width="554" height="364"&gt; Intel Clarkdale dual core, un MCM compuesto de dos dies.&lt;/p&gt; &lt;p align="justify"&gt;Intel ha tomado “el camino de en medio” y ha diseñado Clarkdale como un MCM con dos dies con distintas funcionalidades en cada una, de hecho el segundo die integra la GPU, el engine de descompresión de video, el bus DMI y las dos controladoras DDR3, y aquí reside el problema:&lt;/p&gt; &lt;p align="justify"&gt;Al necesitar los cores utilizar el bus QPI para comunicar con el segundo die para realizar escrituras o lecturas a RAM hemos vuelto a una arquitectura “semi-FSB”, siendo este sustituido por un mas eficiente bus QPI a una velocidad reducida (en la fotografía superior marcado en ambos dies como “MCP Interface”).&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/S1C8Dz_FOUI/AAAAAAAAEJc/hYF4iPHFdKs/s1600-h/Westmere_die_sho2%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Westmere_die_sho2" border="0" alt="Westmere_die_sho2" src="http://lh3.ggpht.com/__p96Ony2voA/S1C8EtPMw1I/AAAAAAAAEJg/sDtFGK1BbTQ/Westmere_die_sho2_thumb%5B1%5D.jpg?imgmax=800" width="634" height="525"&gt;&lt;/a&gt; Detalle del die de Clarkdale.&lt;/p&gt; &lt;p align="justify"&gt;Por otro lado las frecuencias del Uncore en Clarkdale son de &lt;strong&gt;&lt;font color="#ff0000"&gt;2.13 GHz y 2.4 GHz&lt;/font&gt;&lt;/strong&gt;, frente a los 2.13GHz del i7 920, 940, 950, 960 y los 2.66 GHz del i7 965X y 975X o los 2.4 GHz de Lynnfield. Esto afecta a la latencia y transferencia de la caché L3 que se mantienen en valores similares a Nehalem o Lynnfield.&lt;/p&gt; &lt;p align="justify"&gt;En cambio, y debido al encontrarse en dies separadas, la latencia de acceso a RAM empeora ostensiblemente, ya que ahora se encuentra a mayor distancia temporal (en ns) y a través de un bus QPI.&lt;/p&gt; &lt;p align="justify"&gt;Para estos procesadores Intel ha desarrollado varios nuevos chipsets:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/S1C8FeogA4I/AAAAAAAAEJk/W1hFbczKDmU/s1600-h/clarkdale_chipsets%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="clarkdale_chipsets" border="0" alt="clarkdale_chipsets" src="http://lh3.ggpht.com/__p96Ony2voA/S1C8F3ZjudI/AAAAAAAAEJo/WnH6wZXuFo4/clarkdale_chipsets_thumb%5B1%5D.jpg?imgmax=800" width="634" height="403"&gt;&lt;/a&gt; Oferta de chipsets compatible con Clarkdale.&lt;/p&gt; &lt;p align="justify"&gt;Entre ellos se encuentra el conocido P55 conocido en las placas LGA 1156. Con este chipset se podrán montar estas CPUs pero &lt;strong&gt;&lt;u&gt;perdiendo su funcionalidad gráfica integrada&lt;/u&gt;&lt;/strong&gt; ya que no integra el bus IFDI (Intel Flexible Display Interface).&lt;/p&gt; &lt;p align="justify"&gt;Igualmente los procesadores basados en núcleos Lynnfield (Core i7 serie 800 y Core i5 serie 700) se podrán montar con estos nuevos chipsets sin problemas.&lt;/p&gt; &lt;p align="justify"&gt;En cuanto a los gráficos integrados Intel ahora los denomina HD Graphics “a secas”, es una evolución del integrado en el chipset P45 Express y sus frecuencias no serán las mismas en toda la gama:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/S1C8GUAFv8I/AAAAAAAAEJs/VS0OUFHZ0kc/s1600-h/t2%5B1%5D%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="t2[1]" border="0" alt="t2[1]" src="http://lh4.ggpht.com/__p96Ony2voA/S1C8G4nYljI/AAAAAAAAEJw/7ZMndGhDZ7g/t2%5B1%5D_thumb%5B1%5D.png?imgmax=800" width="548" height="199"&gt;&lt;/a&gt; Gama Core i5 e i3 junto al Pentium G6950.&lt;/p&gt; &lt;p align="justify"&gt;Como vemos estas oscilaran de los 533 MHz del Pentium pasando por los 733 MHz de toda la gama excepto el modelo 66&lt;strong&gt;&lt;font color="#ff0000"&gt;1&lt;/font&gt;&lt;/strong&gt; con 900 MHz en su GPU (los modelos acabados en 1 contarán con esta característica). Secundariamente este hecho aumenta su TDP en 14W extra.&lt;/p&gt; &lt;p align="justify"&gt;Los modelos Arrandale para portátiles contarán con Graphics Turbo Mode, es decir, frecuencias dinámicas en GPU para mantener un TDP global aceptable dentro de los límites del diseño y un consumo contenido para adaptarse a este mercado.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://www.intel.com/design/corei5/documentation.htm" target="_blank"&gt;Documentos técnicos de los procesadores Core i7, Core i5 y Core i3.&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:0bcedc53-065d-4f26-9bfe-fa17307843d6" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Core+i3" rel="tag"&gt;Core i3&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Core+i5" rel="tag"&gt;Core i5&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Clarkdale" rel="tag"&gt;Clarkdale&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Arrandale" rel="tag"&gt;Arrandale&lt;/a&gt;,&lt;a href="http://technorati.com/tags/32+nm" rel="tag"&gt;32 nm&lt;/a&gt;,&lt;a href="http://technorati.com/tags/NehalemEX" rel="tag"&gt;NehalemEX&lt;/a&gt;,&lt;a href="http://technorati.com/tags/LGA+1156" rel="tag"&gt;LGA 1156&lt;/a&gt;,&lt;a href="http://technorati.com/tags/LGA1155" rel="tag"&gt;LGA1155&lt;/a&gt;,&lt;a href="http://technorati.com/tags/DDR3" rel="tag"&gt;DDR3&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-1589664006285456879?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/1589664006285456879/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2010/01/los-nuevos-dual-core-de-intel-core-i5-y.html#comment-form" title="5 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1589664006285456879?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/1589664006285456879?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/6D9ey8XoBqM/los-nuevos-dual-core-de-intel-core-i5-y.html" title="Los nuevos Intel dual core: Core i5 y Core i3. Actualizado - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/S1C77-haGBI/AAAAAAAAEIs/-jJnFruXvOk/s72-c/Corei3_i5_desnudo_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>5</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2010/01/los-nuevos-dual-core-de-intel-core-i5-y.html</feedburner:origLink></entry><entry gd:etag="W/&quot;Ck4FQXo-fyp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-4215574210082109292</id><published>2009-12-06T10:38:00.001+01:00</published><updated>2011-03-17T17:55:10.457+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:55:10.457+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="Istambul" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="Shanghai" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="nehalem" /><category scheme="http://www.blogger.com/atom/ns#" term="netburst" /><category scheme="http://www.blogger.com/atom/ns#" term="CPU" /><category scheme="http://www.blogger.com/atom/ns#" term="quad core" /><category scheme="http://www.blogger.com/atom/ns#" term="K11" /><category scheme="http://www.blogger.com/atom/ns#" term="PhenomII" /><category scheme="http://www.blogger.com/atom/ns#" term="Phenom" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="quadcore" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="Opteron" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="ddr3" /><category scheme="http://www.blogger.com/atom/ns#" term="Bulldozer" /><title>Previo AMD Bulldozer. Actualizado - LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;La próxima generación del core de AMD está despertando una gran excitación entre los profesionales de la arquitectura de procesadores, e incluso entre los propios ingenieros en Intel. Tal como ahora la conocemos será un rotundo éxito si es llevada a buen puerto como apuntan los numerosos rumores y las escuetas informaciones del fabricante.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SxuOlWUCGUI/AAAAAAAAEHI/fldGH8Hzf1M/s1600-h/Bulldoxer_4module_8int_cores_L3shared_630%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Bulldoxer_4module_8int_cores_L3shared_630" border="0" alt="Bulldoxer_4module_8int_cores_L3shared_630" src="http://lh3.ggpht.com/__p96Ony2voA/SxuOmBT789I/AAAAAAAAEHM/Kj_HCT-ldHw/Bulldoxer_4module_8int_cores_L3shared_630_thumb%5B1%5D.png?imgmax=800" width="634" height="156"&gt;&lt;/a&gt; AMD Bulldozer Zambezi 8 cores: 4 módulos y 8 threads con 8 INT cores.&lt;/p&gt; &lt;p align="justify"&gt;En un artículo anterior, de Enero de este año, hice una pequeña lista de peticiones (&lt;em&gt;wish list&lt;/em&gt;) para la próxima generación de procesadores AMD. Todos sabemos que el diseño definitivo del procesador que sustituirá, ya fabricado en 32 nm, a los actuales Opteron y Phenom II basados en núcleos Shanghai es definitivo hace meses y con alta probabilidad están ya en los previos al &lt;a href="http://en.wikipedia.org/wiki/Tape-out" target="_blank"&gt;tape-out&lt;/a&gt; del primer stepping bootable.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;Un poco de historia: Intel y la era Netburst&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Durante años, desde la aparición del flamante Athlon64 en 2003, AMD gozó de una etapa de clara supremacía de sus diseños en prestaciones, consumo y disipación térmica. Intel ya desde el año 2000 comercializó su línea Netburst, unas CPUs basadas en pipelines extraordinariamente largos con la excusa de altísimas frecuencias y con un desafortunado e intrusivo (aunque necesario) mecanismo de &lt;a href="http://www.xbitlabs.com/articles/cpu/print/replay.html" target="_blank"&gt;Replay de micro operaciones&lt;/a&gt;.&lt;/p&gt; &lt;p align="justify"&gt;Fueron procesadores que más bien parecían diseñados por los equipos de márqueting que por los excelentes grupos de ingeniería en Intel…&lt;/p&gt; &lt;p align="justify"&gt;Las primera iteración del procesador Pentium 4 (Willamette 180nm) salió a la venta en 2000 compitiendo con el excelente y equilibrado procesador AMD Athlon. Con un pipeline de enteros de 20 etapas (!!) después de los decoders y la trace caché.&lt;/p&gt; &lt;p align="justify"&gt;Contaba con unos tamaños de caché claramente insuficientes: la ínfima caché L1 de 8 KB y la L2 de 256 KB. El tamaño de la L2 de 256 KB se rumorea que fue una víctima de las prisas de Intel por llevar al mercado el diseño en 180 nm. Sus frecuencias finales fueron de 1.3 a 2.0 GHz.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Sxt7H-78Q5I/AAAAAAAAEFg/g9hY4ZJRCB8/s1600-h/die_180nm13.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="die_180nm[1]" border="0" alt="die_180nm[1]" src="http://lh5.ggpht.com/__p96Ony2voA/Sxt7Lmd3EaI/AAAAAAAAEFk/C4qWqyOwUXg/die_180nm1_thumb1.png?imgmax=800" width="634" height="532"&gt;&lt;/a&gt;Intel Pentium 4&amp;nbsp; Willamette 180 nm 256 KB L2.&lt;/p&gt; &lt;p align="justify"&gt;Era una CPU muy cara y difícil en fabricación dado su tamaño y complejidad, casi toda su superficie era lógica. Contaba con un FSB &lt;a href="http://en.wikipedia.org/wiki/Quad_Data_Rate" target="_blank"&gt;quad pumped&lt;/a&gt; (4 x 100 MHz) de 400 MTs para un dual channel RAMBUS a 800 MHz y 16 bit (en el año 2000 !!). En fín, una plataforma de un coste estratosférico para finalmente y en la práctica obtener rendimientos similares o inferiores a un AMD Athlon con simple memoria SDRAM.&lt;/p&gt; &lt;p align="justify"&gt;A finales de 2001 llegó, en mi opinión, el mejor integrante de la saga: el procesador Northwood de 130 nm ya con 512 KB de L2 y posteriormente dotado con HyperThreading. Partió de los 2 GHz (FSB 400 MHz) para escalar rápidamente. En esta época ya competía con los Athlon XP de AMD de 180 nm.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Sxt7OEmTxoI/AAAAAAAAEFo/41mwbB3WRvA/s1600-h/die_130nm23.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="die_130nm[2]" border="0" alt="die_130nm[2]" src="http://lh3.ggpht.com/__p96Ony2voA/Sxt7SMS_heI/AAAAAAAAEFs/-czk3foGd14/die_130nm2_thumb1.png?imgmax=800" width="634" height="626"&gt;&lt;/a&gt;Intel Pentium 4&amp;nbsp; Nothwood 130 nm 512 KB L2.&lt;/p&gt; &lt;p align="justify"&gt;Cuando llegó a frecuencias desde los 2.8 GHz y con un FSB de 800 MHz empezó a ser el líder en prestaciones y los modelos 3.2 y 3.4 gozaron de gran fama y un excelente rendimiento.&lt;/p&gt; &lt;p align="justify"&gt;En 2004 llegó Prescott en 90 nm (1 MB L2) con un pipeline absurdamente dilatado a más de 30 atapas (!!).&lt;/p&gt; &lt;p align="justify"&gt;Fue un rediseño absoluto de Netburst, poco tenía que ver con Willamette o Northwood. Incluso se rumoreó el nombre de Pentium 5, posteriormente introdujo el proceso de 64 bit. Sus prestaciones finales fueron desalentadoras, de hecho era algo más lento &lt;em&gt;clock for clock&lt;/em&gt; que Northwood… Además su disipación térmica ponía en aprietos al mejor sistema de refrigeración de la época.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Sxt7UqsBm2I/AAAAAAAAEF0/W5TClM5g1TE/s1600-h/die_90nm_1m13.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="die_90nm_1m[1]" border="0" alt="die_90nm_1m[1]" src="http://lh4.ggpht.com/__p96Ony2voA/Sxt7YncmGrI/AAAAAAAAEF4/Q9gUVXsjqjk/die_90nm_1m1_thumb1.png?imgmax=800" width="634" height="609"&gt;&lt;/a&gt; Intel Pentium 4 Prescott 90 nm 1 MB L2.&lt;/p&gt; &lt;p align="justify"&gt;Todavía recuerdo cuando probé los primeros engineering samples de Prescott a 2.8 GHz sustituyendo un excelente Nortwood HT a 3.2 GHz obteniendo 20ºC más de temperatura y un rendimiento muy inferior… La cuerpo del disipador daba miedo…&lt;/p&gt; &lt;p align="justify"&gt;Prescott se diseño para frecuencias máximas sobre los 5 GHz, pero problemas de diseño (excesivo leakage del proceso de 90 nm en Prescott) y su incontenible consumo eléctrico y consiguiente disipación térmica lo hicieron inviable. Intel incluso tuvo en sus &lt;a href="http://www.theinquirer.net/inquirer/news/1011303/4ghz-intel-prescott-on-target-for-q1" target="_blank"&gt;roadmap&lt;/a&gt; versiones a &lt;a href="http://www.theinquirer.net/inquirer/news/1032622/4ghz-580-prescott-to-arrive-q4-but-delay-on-cards" target="_blank"&gt;4 y 4.2 GHz&lt;/a&gt; que más tarde &lt;a href="http://www.theinquirer.net/inquirer/news/1025538/intel-drops-plans-4ghz-pentium" target="_blank"&gt;canceló&lt;/a&gt;.&lt;/p&gt; &lt;p align="justify"&gt;En 2005 Intel tenía previsto el lanzamiento de Tejas (con un pipeline previsto sobre 50!!!!!! etapas). Los primeros samples fueron una gran decepción, consumos excesivos rayando lo imposible en plataformas de consumo y un rendimiento decepcionante. Fue sabiamente &lt;a href="http://www.theinquirer.net/inquirer/news/1023107/intel-confirms-tejas-jayhawk-dead" target="_blank"&gt;cancelado.&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;En Intel se cortaron algunas cabezas en los staff directivos y se replanteó totalmente el diseño de sus futuros microprocesadores. El management dio paso al diseño del equipo en Haifa (Israel), los padres del excelentísimo procesador Pentium M Banias de 90 nm derivado del núcleo Pentium III.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;El despertar de un gigante, Intel Conroe (Core 2 Duo / Quad) 65 nm&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Tras todos estos hechos, AMD equivocadamente pensó o más bien confió en que Intel continuaría con la evolución de Netburst eternamente.&lt;/p&gt; &lt;p align="justify"&gt;Se durmieron en los laureles del K8, dedicaron muchos recursos al proyecto K9, un procesador con un pipeline extra largo tipo Netburst y con SMT al estilo HyperThreading que fue tardíamente aunque acertadamente cancelado.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/Sxt7b-7UL6I/AAAAAAAAEF8/9GaEy9sy1fE/s1600-h/merom_die_image3.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="merom_die_image" border="0" alt="merom_die_image" src="http://lh6.ggpht.com/__p96Ony2voA/Sxt7fLsW4TI/AAAAAAAAEGA/mpbC3igpsTA/merom_die_image_thumb1.png?imgmax=800" width="634" height="491"&gt;&lt;/a&gt; Intel Core 2 Duo Conroe 65 nm, dual core 4 MB L2.&lt;/p&gt; &lt;p align="justify"&gt;Intel sacó al mercado en 2006 Conroe, el famoso Core 2, dando un vuelco radical mercado y consiguiendo un dominio absoluto en todos los segmentos desde portátiles a sobremesa de consumo y servidores dual core.&lt;/p&gt; &lt;p align="justify"&gt;En el terreno multisocket AMD mantenía su liderato absoluto en 4 sockets gracias a su más avanzada arquitectura con enlaces HT (HyperTransport) frente al arcaico FSB de Intel. En los servidores de dos socket había una encarnizada pelea, Intel contaba con mejores núcleos de ejecución pero AMD ganaba en ancho de banda.&lt;/p&gt; &lt;p align="justify"&gt;El éxito de Conroe reside en su poderoso núcleo de ejecución de enteros de cuatro pipelines y sus bien dimensionadas FPU de 128 bit, además de su excelente arquitectura de cachés inclusivas y de gran tamaño (2 MB de L2 por core en 65 nm y 3 MB de L2 por core en 45 nm).&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;La decepción del AMD Barcelona 65 nm&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;AMD llegó tarde al mercado con los procesadores Opteron quad core y Phenom basados en cores Barcelona de 65 nm.&lt;/p&gt; &lt;p align="justify"&gt;Con una exigua caché L3 compartida de solo 2 MB para cuatro núcleos (512 KB por core). Una caché L3 de diseño totalmente asíncrono con los núcleos que imponía altas latencias de acceso cifradas en unos 48 ciclos a frecuencias nominales. Además y debido a su pequeño tamaño, unas bajas tasas de aciertos L3 (cache hits) y grandes cargas en el dual channel DDR2 lo que causaba contención en acceso.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/Sxt7f4UimNI/AAAAAAAAEGE/aSIPupiR1sM/s1600-h/phenom3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="phenom" border="0" alt="phenom" src="http://lh5.ggpht.com/__p96Ony2voA/Sxt7g_f261I/AAAAAAAAEGI/K70Rpue7Tk4/phenom_thumb1.jpg?imgmax=800" width="454" height="473"&gt;&lt;/a&gt; AMD Barcelona 65 nm, quad core nativo con 2 MB de L3 compartida.&lt;/p&gt; &lt;p align="justify"&gt;Intel hacía meses que disponía del doble dual core Clovertown de 65 nm con dos L2 de 4 MB que aumentó más si cabe el diferencial de prestaciones con AMD, además de ser más barato de fabricar dada su poca superficie y avanzada tecnología de fabricación.&lt;/p&gt; &lt;p align="justify"&gt;Estaba formado por dos dies Core 2 Duo en un chip:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/Sxt7hDIKnMI/AAAAAAAAEGM/kybHxwgvzbI/s1600-h/intelcore2quadq6600cpus123.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="intel-core-2-quad-q6600-cpus1[2]" border="0" alt="intel-core-2-quad-q6600-cpus1[2]" src="http://lh4.ggpht.com/__p96Ony2voA/Sxt7h3Gl_iI/AAAAAAAAEGQ/nRXrjsL2unI/intelcore2quadq6600cpus12_thumb1.jpg?imgmax=800" width="379" height="284"&gt;&lt;/a&gt; El Intel Core 2 Quad, un MCM de dos Core 2 Duo. 4 + 4 MB de L2 en 65 nm.&lt;/p&gt; &lt;p align="justify"&gt;Rápidamente Intel sacó al mercado la evolución de 45 nm de Core 2, los núcleos Penryn con 6 MB de L2 compartida. Contaban con numerosas mejoras que lo hacían sobre un 16% más rápido que su antecesor de 65 nm y recuerdo como todos mis mejores clientes sustituyeron sus CPUs Conroe por Penryn en pocos meses debido a su gran mejora en algoritmos conteniendo divisiones.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/Sxt7idzozGI/AAAAAAAAEGU/RSAMBerzAqM/s1600-h/Penryn_585.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Penryn_58" border="0" alt="Penryn_58" src="http://lh6.ggpht.com/__p96Ony2voA/Sxt7jaNt7sI/AAAAAAAAEGY/qfjOlEpNeXA/Penryn_58_thumb3.jpg?imgmax=800" width="634" height="445"&gt;&lt;/a&gt; Intel Core 2 Duo Penryn 45 nm, dual core con 6 MB L2 compartida.&lt;/p&gt; &lt;p align="justify"&gt;Barcelona fue un débil rival para tales procesadores y esto se agravó cuando Intel presento el sustituto de Yorkfield, Harpertown, dotado de cuatro núcleos Penryn y 2 L2 de 6MB y proceso de 45 nm.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/Sxt7j9CPbCI/AAAAAAAAEGc/_Xb9kKKe5HY/s1600-h/penryn_quadcore3.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="penryn_quadcore" border="0" alt="penryn_quadcore" src="http://lh3.ggpht.com/__p96Ony2voA/Sxt7kSbSwnI/AAAAAAAAEGg/Cj-LOu-OD6Q/penryn_quadcore_thumb1.jpg?imgmax=800" width="634" height="476"&gt;&lt;/a&gt; Los Core 2 quad de la serie 9000, fabricados en 45 nm.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;Nivelando el terreno, AMD Shanghai&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Por fin AMD introdujo en el mercado, esta vez sí, un procesador competente con la oferta de su rival Intel: el core Shanghai de 45 nm. Lo he analizado en multitud de artículos y desde todos los ángulos en LowLevelHardware (ordenados por fecha):&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/03/el-resurgir-de-phenom-el-stepping-b3-y.html"&gt;El resurgir de Phenom. El Stepping B3 y el futuro Shanghai 45nm.&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/08/shanghai-phenom-k105-en-enero.html"&gt;Shanghai Phenom K10.5 en Enero&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/01/amd-phenom-ii-lowlevelhardware.html"&gt;El retorno de AMD: Phenom II. Actualizado – LowLevelHardware&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/03/phenom-ii-x4-940-configuracion-bios-36.html"&gt;Phenom II X4 940 3.6 GHz: BIOS en detalle. Actualizado – LowLevelHardware&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/03/phenom-ii-36-ghz-24-ghz-uncore-analisis.html"&gt;Phenom II 3.6 GHz / 2.4 GHz uncore. Análisis en RMMA. Ampliado – LowLevelHardware&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/03/phenom-ii-x4-36-ghz-analisis.html"&gt;Phenom II X4 @ 3.6 GHz. Análisis microarquitectural en RMMA – LowLevelHardware&lt;/a&gt;&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Y en ProfessionalSAT:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://professionalsat.blogspot.com/2008/12/amd-phenom-ii-shanghai-perspectivas.html"&gt;AMD Phenom II Shanghai. Perspectivas – ProfessionalSAT&lt;/a&gt;&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://professionalsat.blogspot.com/2009/03/phenom-ii-x4-940-be-overclock-36-ghz.html"&gt;Phenom II X4 940 BE: Overclock 3.6 GHz. Ampliado – ProfessionalSAT&lt;/a&gt;&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;Ha poblado las series Opteron y Phenom II dotado de una L3 de 6 MB y 48 vías desplazando al mediocre chip Barcelona. Con esta evolución logró al fin doblegar a los invencibles hasta el momento Core 2 Quad Penryn. Actualmente se comercializa en versiones hasta los 3.4 GHz (Phenom II X4 965 BE) y este modelo en particular supera a cualquier Core 2 Quad en la media de benchmarks.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/Sxt7lDW2NpI/AAAAAAAAEGk/ArXtFtQLH1w/s1600-h/K1020processor2045nm20architec20117.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="K10%20processor%2045nm%20architec%201[1]" border="0" alt="K10%20processor%2045nm%20architec%201[1]" src="http://lh6.ggpht.com/__p96Ony2voA/Sxt7l8Rj2tI/AAAAAAAAEGo/Z239j2ErtX0/K1020processor2045nm20architec2011_t.jpg?imgmax=800" width="604" height="459"&gt;&lt;/a&gt;AMD Shanghai 45 nm, quad core nativo con 6 MB de L3 compartida.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;Intel Tick–Tock. Microarquitectura Nehalem con SMT&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El pasado año 2008 (en Q4) Intel dio a luz a su última microarquitectura de altas prestaciones: Nehalem. Salió a la venta con el nombre comercial de Core i7.&lt;/p&gt; &lt;p align="justify"&gt;Este procesador lo he tratado extensamente (quizás me quedo corto…) en varios de mis blogs:&lt;/p&gt; &lt;p align="justify"&gt;En LowLevelHardware he detallado su microarquitectura:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/03/nehalem-intel-despliega-su-poder.html"&gt;Nehalem. Intel despliega su poder.&lt;/a&gt; 18 de Marzo 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/05/sobre-las-caches-de-nehalem.html"&gt;Sobre la cache de Nehalem&lt;/a&gt;. 23 de Mayo 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/06/datos-finales-sobre-intel-nehalem.html"&gt;Datos finales sobre Intel Nehalem&lt;/a&gt;. 08 de Junio 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/06/los-tres-canales-de-nehalem.html"&gt;Los tres canales de Nehalem&lt;/a&gt;. 18 de junio 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/09/anlisis-die-core-i7-nehalem.html"&gt;Análisis del die de Intel Core i7 / Nehalem&lt;/a&gt;. 06 de septiembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/10/core-i7-preliminares-intel-nehalem.html"&gt;Core i7: Preliminares Intel Nehalem – LowLevelHardware&lt;/a&gt;. 18 de Octubre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/11/imgenes-alta-calidad-intel-core-i7.html"&gt;Imágenes alta calidad Intel Core i7 – LowLevelHardware&lt;/a&gt;. 04 Noviembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/11/la-cach-l3-de-core-i7-nehalem.html"&gt;La caché L3 de Core i7 Nehalem. Actualizado - LowlevelHardware&lt;/a&gt;. 05 Noviembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/11/core-i7-vs-phenom-ancho-de-banda-de.html"&gt;Core i7 vs Phenom en dual channel. Ancho de banda de cachés y memoria. Actualizado – LowLevelHardware&lt;/a&gt;. 19 de Noviembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/11/la-verdadera-latencia-l3-core-i7.html"&gt;La verdadera latencia L3 de Core i7. Actualizado – LowLevelHardware&lt;/a&gt;. 24 de Noviembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2008/12/hyperthreading-en-core-i7.html"&gt;Hyperthreading en Core i7. Análisis – LowLevelHardware&lt;/a&gt;. 05 de Diciembre 2008&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/04/core-i7-stepping-d0-professionalsat.html"&gt;Core i7 stepping D0 – LowLevelHardware&lt;/a&gt;. 29 de Abril 2009&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;&lt;a href="http://lowlevelhardware.blogspot.com/2009/05/uncore-clock-en-core-i7-920-stepping-d0.html"&gt;Uncore clock en Core i7 920 stepping D0. Actualizado – LowLevelHardware&lt;/a&gt;. 20 de Mayo 2009&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/Sxt7m4xCk2I/AAAAAAAAEGs/01Aa7hHPCMU/s1600-h/die3.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="die" border="0" alt="die" src="http://lh4.ggpht.com/__p96Ony2voA/Sxt7n805dsI/AAAAAAAAEGw/opwFpj2Yg0A/die_thumb1.jpg?imgmax=800" width="634" height="440"&gt;&lt;/a&gt; Intel Nehalem 45 nm, quad core con SMT (8 threads) y 8 MB L3 compartida.&lt;/p&gt; &lt;p align="justify"&gt;Su gran&amp;nbsp; baza es reside en el SMT, el Turbo Mode&amp;nbsp; y un brutal y desorbitado ancho de banda dado por el triple channel DDR3 además de su excelente arquitectura de caché de tres niveles con unos 38 ciclos de latencia L3 y unas ultrarrápidas L2 de 10 ciclos y 256 KB.&lt;/p&gt; &lt;p align="justify"&gt;Con Nehalem, Intel ha logrado el liderato destacado en prestaciones en todos los terrenos: enteros, coma flotante, single thread, multithreading, ancho de banda, latencia… y AMD está pasando tiempos difíciles compitiendo con su única arma, el precio… y la inteligencia de su líder.&lt;/p&gt; &lt;p align="justify"&gt;Un Phenom II X4 965 BE (el tope de gama) compite actualmente con el procesador benjamín de la gama Nehalem el Lynnfield Core i5 750 sin SMT (HyperThreading) y con dual channel DDR3 en prestaciones y precio.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/SxuOm1f-SXI/AAAAAAAAEHQ/x7Wub2iija4/s1600-h/die-angle-620%5B1%5D%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="die-angle-620[1]" border="0" alt="die-angle-620[1]" src="http://lh3.ggpht.com/__p96Ony2voA/SxuOn_-UDlI/AAAAAAAAEHU/WzmplU9HQC4/die-angle-620%5B1%5D_thumb%5B1%5D.jpg?imgmax=800" width="624" height="449"&gt;&lt;/a&gt; Intel Lynnfield 45 nm. Integra el controlador PCIe 2.0 en el die (a la izquierda).&lt;/p&gt; &lt;p align="justify"&gt;Por encima de ellos se sitúan los Core i7 Lynnfield de socket LGA1156 con SMT, Turbo Mode agresivo y dual DDR3 Core i7 860 y 870. Este procesador, al integrar el bus PCIe en el die prescinde de los enlaces QPI y del chipset X58.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SxuOovxtpFI/AAAAAAAAEHY/07hPam3iaJ0/s1600-h/img_wafer_dessus%5B1%5D%5B8%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Lynnfield45nm" border="0" alt="Lynnfield45nm" src="http://lh3.ggpht.com/__p96Ony2voA/SxuOptHdjxI/AAAAAAAAEHc/SgXL3Ip0kZo/img_wafer_dessus%5B1%5D_thumb%5B6%5D.jpg?imgmax=800" width="634" height="395"&gt;&lt;/a&gt;Intel Lynnfield. 45 nm, 8 MB L3, SMT y PCIe integrado. &lt;/p&gt; &lt;p align="justify"&gt;La superior gama i7 LGA1366 con SMT y triple DDR3 (asociado por un QPI de 4.8 a 6.4 GT/s con el chipset X58) no cuenta a día de hoy con un procesador equivalente en velocidad en AMD aunque tampoco en precio.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;Servidores AMD e Intel en 2009&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;El año 2009 ha sido excelente para Intel, ha podido desplegar su arquitectura Nehalem hasta los dos sockets. En este terreno AMD no tiene una alternativa en paridad aunque se acerca bastante con su diseño Istambul, un hexa core nativo con 6 MB de L3 y fabricado en 45 nm:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/Sxt7oqhmJRI/AAAAAAAAEG0/zyXhdsEPBtg/s1600-h/Istambul45nm3.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Istambul45nm" border="0" alt="Istambul45nm" src="http://lh5.ggpht.com/__p96Ony2voA/Sxt7ptVTpTI/AAAAAAAAEG4/RtjiphyE3fw/Istambul45nm_thumb1.jpg?imgmax=800" width="634" height="461"&gt;&lt;/a&gt;AMD Istambul. 6 núcleos y 6 MB L3 en 45 nm.&lt;/p&gt; &lt;p align="justify"&gt;En el espacio 4 socket AMD es imbatible ya que Intel mantiene sus mastodónticos e ineficientes chips Dunnington hexa core basado en núcleos tres Penryn dual core con 3 MB de L2 shared por pareja y 6 MB de L3 compartida con una latencia superior a los 100 ciclos!!!&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/Sxt7qSLZpBI/AAAAAAAAEHA/83BB86endjo/s1600-h/Dunnington_Xeon4.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Dunnington_Xeon" border="0" alt="Dunnington_Xeon" src="http://lh6.ggpht.com/__p96Ony2voA/Sxt7rLju6ZI/AAAAAAAAEHE/wOh9YDlYDJI/Dunnington_Xeon_thumb2.jpg?imgmax=800" width="634" height="450"&gt;&lt;/a&gt; Intel Xeon Dunnington. 6 cores 3 L2 de 3 MB y 16 MB de L3 shared en 45 nm.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;AMD e Intel en 2010&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;En 2010 AMD seguirá refinando el diseño de Shanghai. Hace un mes aproximadamente lanzó el nuevo stepping C3 que reduce el consumo y disipación térmica así como permite mayores overclocks en cores y uncore (caché L3, North Bridge y controladoras de memoria).&lt;/p&gt; &lt;p align="justify"&gt;Introducirá un verdadero estado C1E lo que reducirá el consumo. Probablemente veremos versiones a 3.6 GHz del Phenom II X4 BE y como novedad la introducción del hexa core Istambul de 45 nm y 6 MB de L3 procedente de las actuales gamas de servidores Opteron de la serie (quizás Phenom II X6??) en el mercado de sobremesa llamado Thuban.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/SxuOqT95skI/AAAAAAAAEHg/DIgsMEudsOk/s1600-h/Westmere_wafer%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Westmere_wafer" border="0" alt="Westmere_wafer" src="http://lh3.ggpht.com/__p96Ony2voA/SxuOrMoXRMI/AAAAAAAAEHk/wxzXi_yiZRA/Westmere_wafer_thumb%5B1%5D.jpg?imgmax=800" width="634" height="424"&gt;&lt;/a&gt; Wafer de procesadores Intel Westmere de 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;Intel tiene previsto la migración a 32 nm con los núcleos Westmere, la evolución de Nehalem. En el terreno más prestacional veremos los Westmere de 6 cores con SMT que elevará a 12 el número de threads por procesador. Contarán con 12 MB de L3 y varias mejoras micro arquitecturales.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/SxuOr87e0nI/AAAAAAAAEHo/jxnXGTBhleQ/s1600-h/westmere%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="westmere" border="0" alt="westmere" src="http://lh6.ggpht.com/__p96Ony2voA/SxuOtGt2AwI/AAAAAAAAEHs/YE_D2HH8a08/westmere_thumb%5B1%5D.jpg?imgmax=800" width="634" height="643"&gt;&lt;/a&gt;El futuro Westmere dual core 32nm, 4 MB de L3 compartida y 256 KB L2 por core. &lt;/p&gt; &lt;p align="justify"&gt;En principio Intel no tiene planes de un quad core de 32 nm basado en núcleos Westmere, para ello habrá que esperar a Sandy Bridge en 2011. Lo que sí habrá es un hexacore nativo llamado Gulftown:&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SxuOtgK54AI/AAAAAAAAEHw/nEt-zcwRvbs/s1600-h/gulftown32nm_6core%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="gulftown32nm_6core" border="0" alt="gulftown32nm_6core" src="http://lh3.ggpht.com/__p96Ony2voA/SxuOuOkj6UI/AAAAAAAAEH0/gseFKYKucDI/gulftown32nm_6core_thumb%5B1%5D.jpg?imgmax=800" width="502" height="274"&gt;&lt;/a&gt; Gulftown 6 cores, 12 MB L3 y 12 threads en 32 nm.&lt;/p&gt; &lt;p align="justify"&gt;La buena noticia para algunos de mis clientes es que será compatible con la mayoría de actuales placas base con chipset X58 y socket LGA 1366.&lt;/p&gt; &lt;p align="justify"&gt;&lt;font color="#0080ff" size="4"&gt;AMD e Intel en 2011&lt;/font&gt;&lt;/p&gt; &lt;p align="justify"&gt;Intel introducirá Sandy Bridge, su nueva microarquitectura tras Nehalem. Incluirá también SMT y la interconexión del procesador con el Uncore y los buses y cachés L3 compartidas será a través de un anchísimo ring bus que proporcionará latencias menores que en los actuales diseños.&lt;/p&gt; &lt;p align="center"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/SxuOu4MJ8JI/AAAAAAAAEH4/AwXOat9rYXw/s1600-h/003%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="003" border="0" alt="003" src="http://lh5.ggpht.com/__p96Ony2voA/SxuOvcggYVI/AAAAAAAAEH8/sAwrsdvIVLA/003_thumb%5B1%5D.jpg?imgmax=800" width="634" height="398"&gt;&lt;/a&gt;Sandy Bridge 32 nm, la próxima evolución microarquitectural de Intel. &lt;/p&gt; &lt;p align="justify"&gt;En el siguiente artículo haré una educada estimación de la siguiente microarquitectura de AMD, el revolucionario core Bulldozer de 32 nm que verá la luz en 2011.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:931ceb08-4009-44a1-84c3-69f927f49d4d" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/roadmap" rel="tag"&gt;roadmap&lt;/a&gt;,&lt;a href="http://technorati.com/tags/2010" rel="tag"&gt;2010&lt;/a&gt;,&lt;a href="http://technorati.com/tags/2011" rel="tag"&gt;2011&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Nehalem" rel="tag"&gt;Nehalem&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Bulldozer" rel="tag"&gt;Bulldozer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/K11" rel="tag"&gt;K11&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/quad+core" rel="tag"&gt;quad core&lt;/a&gt;,&lt;a href="http://technorati.com/tags/hexa+core" rel="tag"&gt;hexa core&lt;/a&gt;,&lt;a href="http://technorati.com/tags/hexacore" rel="tag"&gt;hexacore&lt;/a&gt;,&lt;a href="http://technorati.com/tags/module" rel="tag"&gt;module&lt;/a&gt;,&lt;a href="http://technorati.com/tags/FMAC" rel="tag"&gt;FMAC&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-4215574210082109292?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/4215574210082109292/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html#comment-form" title="10 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4215574210082109292?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4215574210082109292?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/-Spmwo2EhO4/previo-amd-bulldozer-lowlevelhardware.html" title="Previo AMD Bulldozer. Actualizado - LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/SxuOmBT789I/AAAAAAAAEHM/Kj_HCT-ldHw/s72-c/Bulldoxer_4module_8int_cores_L3shared_630_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total>10</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2009/12/previo-amd-bulldozer-lowlevelhardware.html</feedburner:origLink></entry><entry gd:etag="W/&quot;C0cHRno7eyp7ImA9WhZTE0U.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-6521790718264815783</id><published>2009-09-08T19:12:00.001+02:00</published><updated>2011-03-17T17:57:17.403+01:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2011-03-17T17:57:17.403+01:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="core2quad" /><category scheme="http://www.blogger.com/atom/ns#" term="45 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="core 2 quad" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="core i7" /><category scheme="http://www.blogger.com/atom/ns#" term="optimizacion" /><title>Análisis de algoritmos de inteligencia artificial mediante PerfMonitor – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Este análisis lo he llevado a cabo en uno de mis sistemas Intel Core 2 Quad de la serie 9000 (stepping E0) con 12 MB (6 + 6) caché de L2 basado en núcleos Penryn de 45 nm a 3.4 GHz y con memoria de 4 GB a 1066 MHz, FSB1600 y Performance Level 5 para una excelente latencia de memoria de solamente 52 ns en Everest.&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SqaQSqPS7xI/AAAAAAAAD_c/CWsVFQrJMGo/s1600-h/PIC03281%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="PIC03281" border="0" alt="PIC03281" src="http://lh6.ggpht.com/__p96Ony2voA/SqaQTbwGYKI/AAAAAAAAD_g/NICGmB1o0DM/PIC03281_thumb%5B1%5D.jpg?imgmax=800" width="634" height="476"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;El software escogido es &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/perfmonitor-introduccin.html" target="_blank"&gt;PerfMonitor&lt;/a&gt;, una aplicación freeware y portable que analicé someramente en un artículo &lt;a href="http://lowlevelhardware.blogspot.com/2008/05/perfmonitor-introduccin.html" target="_blank"&gt;anterior&lt;/a&gt;.&lt;/p&gt; &lt;p align="justify"&gt;La carga de trabajo analizada son los algoritmos de cálculo utilizados en el sistema analizado en los siguientes artículos de ProfessionalSAT:&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://professionalsat.blogspot.com/2009/09/core-i7-42-ghz-algoritmos-de_07.html"&gt;Core i7 @ 4.2 GHz. Algoritmos de inteligencia artificial. Parte III – ProfessionalSAT&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://professionalsat.blogspot.com/2009/09/core-i7-42-ghz-algoritmos-de.html"&gt;Core i7 @ 4.2 GHz. Algoritmos de inteligencia artificial. Parte II – ProfessionalSAT&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;&lt;a href="http://professionalsat.blogspot.com/2009/08/sistemas-de-altas-prestaciones.html"&gt;Sistemas de Altas Prestaciones, algoritmos de Inteligencia Artificial. Parte I – ProfessionalSAT&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;Todos los resultados son del Core 0 del procesador Core 2 Quad, aunque se pueden extrapolar a los demás pues son idénticos.&lt;/p&gt; &lt;p&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SqaQT1lN8EI/AAAAAAAAD_k/ux9S-MBt2kk/s1600-h/Image2%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Image2" border="0" alt="Image2" src="http://lh4.ggpht.com/__p96Ony2voA/SqaQUuATh3I/AAAAAAAAD_o/QrpDjqsEcj4/Image2_thumb%5B1%5D.png?imgmax=800" width="304" height="404"&gt;&lt;/a&gt;&lt;/p&gt; &lt;p align="justify"&gt;En primer lugar observamos cuatro lecturas:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Non Halted Clock Cicles: ciclos del procesador en actividad. Podemos ver que lo 3400 M de ciclos por segundo la CPU está ocupada. Uso de CPU: 100%. &lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Instructions Decoded: número total de instrucciones descodificadas por segundo. Vemos unos 4070M de instrucciones por segundo, más de una por ciclo (1.19 por ciclo).&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Bus Clock Cicles: ciclos de uso del FSB. 100% de uso del FSB.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;IPC: 0.9 instrucciones/ciclo ejecutadas.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&amp;nbsp;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/SqaQVLX3ZmI/AAAAAAAAD_s/X6MD7HXImg8/s1600-h/Image3%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Image3" border="0" alt="Image3" src="http://lh3.ggpht.com/__p96Ony2voA/SqaQVsIWmhI/AAAAAAAAD_w/JiActKycIVM/Image3_thumb%5B1%5D.png?imgmax=800" width="304" height="404"&gt;&lt;/a&gt; En esta captura podemos ver:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Retired Mispredicted Branches: fallos de predicción del Branch prediction. 21.3 M por segundo.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Retired Branches: Branches (en millones) retiradas (procesadas) por segundo. 373 M Branch/s.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Retired Instructions: total de instrucciones procesadas y retiradas por segundo en millones. 2345 M instrucciones/s.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;Branch Prediction Success Rate: tasa de acierto de los predictores de saltos del procesador Core i7 en este algoritmo: 94.3 %.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/SqaQWm3vnyI/AAAAAAAAD_0/pGh_sWZw81s/s1600-h/Image6%5B3%5D.png"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Image6" border="0" alt="Image6" src="http://lh3.ggpht.com/__p96Ony2voA/SqaQXTQnBvI/AAAAAAAAD_4/Bv7-CQcsHjE/Image6_thumb%5B1%5D.png?imgmax=800" width="304" height="404"&gt;&lt;/a&gt;&amp;nbsp; &lt;/p&gt; &lt;p align="justify"&gt;Aquí observamos:&lt;/p&gt; &lt;ul&gt; &lt;li&gt; &lt;div align="justify"&gt;Retired Instructions: total de instrucciones procesadas y retiradas por segundo en millones. 2345 M instrucciones/s.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;LLC Request: peticiones del procesador al LLC (Last Level Caché), en este caso las L2 unificadas de 6 MB, en millones por segundo. 145.9 M/s. Esto indica una importante tasa de fallos de las pequeñas L1 de 32 KB como ya he comentado en otros artículos hablando de los procesadores Core2.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;LLC Mises: fallos de la L2 de 6 MB. 1.9 M/s. En este caso el procesador hace una petición por el FSB al chipset para pedir un acceso a RAM.&lt;/div&gt; &lt;li&gt; &lt;div align="justify"&gt;LLC Success Rate: Tasa de aciertos de la L2. 98.7 %. Excelente tasa gracias al gran tamaño de 6 MB para cada dos núcleos.&lt;/div&gt;&lt;/li&gt;&lt;/ul&gt; &lt;p align="justify"&gt;&lt;a href="http://lh4.ggpht.com/__p96Ony2voA/SqaQX33CyqI/AAAAAAAAD_8/f2lFB72qrIk/s1600-h/PIC03241%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="PIC03241" border="0" alt="PIC03241" src="http://lh3.ggpht.com/__p96Ony2voA/SqaQZT7DywI/AAAAAAAAEAA/dEUP8cxT-3w/PIC03241_thumb%5B1%5D.jpg?imgmax=800" width="634" height="844"&gt;&lt;/a&gt; &lt;/p&gt; &lt;p align="justify"&gt;En un sentido más práctico comentar que esta carga de trabajo contiene un mix de instrucciones de enteros y su velocidad de ejecución viene marcada por la altísima cantidad de branches en el código lo que hace inevitable un alto número absoluto de fallos de predicción que acarrean latencias de “recuperación” del fallo de predicción.&lt;/p&gt; &lt;p align="justify"&gt;Para minimizar esta latencia es crítica una configuración extrema en la frecuencia del Uncore y en las latencias y anchos de banda de L3 y memoria y también del subsistema de disco.&lt;/p&gt; &lt;p align="justify"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; font-family: ; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px; font-family: " class="Apple-style-span"&gt;&lt;strong style="text-align: left"&gt;&lt;font style="text-align: left" color="#4bacc6"&gt;&lt;span style="text-align: left; line-height: normal; widows: 2; text-transform: none; text-indent: 0px; border-collapse: separate; white-space: normal; orphans: 2; letter-spacing: normal; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px" class="Apple-style-span"&gt;&lt;span style="text-align: left; line-height: 18px" class="Apple-style-span"&gt;&lt;font style="text-align: left" face="Arial"&gt;&lt;font style="text-align: left"&gt;&lt;font style="font-size: 9.8pt"&gt;Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.&lt;/font&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/strong&gt;&lt;/span&gt;&lt;/span&gt;&lt;font style="font-size: 12pt" color="#000000" face="Times New Roman"&gt; &lt;/font&gt;&lt;/p&gt; &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:6868f1c0-1dc6-44fa-913a-bfa21feecaef" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Branch" rel="tag"&gt;Branch&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Integer" rel="tag"&gt;Integer&lt;/a&gt;,&lt;a href="http://technorati.com/tags/PerfMonitor" rel="tag"&gt;PerfMonitor&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-6521790718264815783?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/6521790718264815783/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2009/09/analisis-de-algoritmos-de-inteligencia.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6521790718264815783?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/6521790718264815783?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/Ur02tb4JgbE/analisis-de-algoritmos-de-inteligencia.html" title="Análisis de algoritmos de inteligencia artificial mediante PerfMonitor – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/SqaQTbwGYKI/AAAAAAAAD_g/NICGmB1o0DM/s72-c/PIC03281_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2009/09/analisis-de-algoritmos-de-inteligencia.html</feedburner:origLink></entry><entry gd:etag="W/&quot;CkIDQ3c8eSp7ImA9WxNSEko.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-4743770892799071479</id><published>2009-08-25T09:04:00.001+02:00</published><updated>2009-08-26T09:09:32.971+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2009-08-26T09:09:32.971+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="nehalem" /><category scheme="http://www.blogger.com/atom/ns#" term="netburst" /><category scheme="http://www.blogger.com/atom/ns#" term="cache" /><category scheme="http://www.blogger.com/atom/ns#" term="QPI" /><category scheme="http://www.blogger.com/atom/ns#" term="Power7" /><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="IBM" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="45 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="AMD" /><category scheme="http://www.blogger.com/atom/ns#" term="L3 cache" /><title>Athlon II X4, IBM Power 7 e Intel Nehalem EX – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Desde hace ya unos años los fabricantes de semiconductores están dando un giro copernicano a su estrategia de prestaciones a toda costa a cambio de una moderación clara en la disipación térmica de sus diseños.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;AMD Athlon X4&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Ya en un &lt;a href="http://lowlevelhardware.blogspot.com/2009/06/phenom-ii-x2-y-athlon-ii-nuevos-dual.html" target="_blank"&gt;artículo anterior&lt;/a&gt; de Junio 2009 hablé ligeramente sobre estos nuevos procesadores de AMD. Su comercialización está prevista para Septiembre.&lt;/p&gt;  &lt;p align="center"&gt;&lt;img title="PhenomII_NO_L3" border="0" alt="PhenomII_NO_L3" src="http://lh3.ggpht.com/__p96Ony2voA/SibgH0HJfJI/AAAAAAAADfk/mwcVCYoF3g0/PhenomII_NO_L3_thumb%5B1%5D.jpg?imgmax=800" width="634" height="564" /&gt;AMD Athlon X4 de 45 nm. Cuatro núcleos con 512 KB de L2 cada uno.&lt;/p&gt;  &lt;p align="justify"&gt;AMD ha decidido reducir costes eliminando la caché L3 de 6 MB de los Phenom II X4 y prescinde además de tres de los enlaces HT (HyperTransport) quedando uno para comunicación con el chipset. La superficie estimada para este procesador ronda los 160 – 170 mm2 proporcionando una gran reducción de costes respecto a Phenom II.&lt;/p&gt;  &lt;p align="justify"&gt;Los precios serán muy reducidos y habrá variantes Triple core con uno&amp;#160; de los procesadores desactivado:&lt;/p&gt;  &lt;p align="center"&gt;&lt;img style="display: block; float: none; margin-left: auto; margin-right: auto" src="http://resources.vr-zone.com//uploads/7484/athlonx2.jpg" /&gt;Gama de procesadores Athlon II X2, X3 y X4.&lt;/p&gt;  &lt;p align="justify"&gt;Se rumorean precios inferiores en unos 25€ al quad más barato de Intel. inicialmente su frecuencia máxima será de 2.6 GHz, pero sin duda será sencillo dejarlos sobre los 3.8 GHz con un trivial overclock.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;&lt;strong&gt;La era del performance per watt&lt;/strong&gt;&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Intel, con su “&lt;em&gt;&lt;a href="http://video.intel.com/?fr_story=542de663c9824ce580001de5fba31591cd5b5cf3&amp;amp;rf=sitemap" target="_blank"&gt;right hand turn&lt;/a&gt;&lt;/em&gt;”, acabó con su microarquitectura &lt;em&gt;Netburst&lt;/em&gt; (la línea Pentium 4) &lt;a href="http://lowlevelhardware.blogspot.com/2008/03/nehalem-intel-despliega-su-poder.html" target="_blank"&gt;cancelando el procesador Tejas&lt;/a&gt; de 90 – 65 nm (el cuarto integrante de la saga) y dando paso a la exitosa (y derivada de la anterior microarquitectura Pentium III) línea Core 2 Conroe 65 nm y Penryn 45 nm.&lt;/p&gt;  &lt;p align="justify"&gt;Ahora es IBM quien adopta esta línea de moderación en consumo huyendo de sus anteriores &lt;em&gt;&lt;a href="http://books.google.es/books?id=Nibfj2aXwLYC&amp;amp;pg=PA386&amp;amp;lpg=PA386&amp;amp;dq=speed+demon+processor&amp;amp;source=bl&amp;amp;ots=RZZARGG5IG&amp;amp;sig=zzQNt1iJP3pqohCdgUADjOwdgcI&amp;amp;hl=es&amp;amp;ei=d4OTStOgIdirjAeNyaXgDQ&amp;amp;sa=X&amp;amp;oi=book_result&amp;amp;ct=result&amp;amp;resnum=5#v=onepage&amp;amp;q=speed%20demon%20processor&amp;amp;f=false" target="_blank"&gt;speed demons&lt;/a&gt;&lt;/em&gt; (IBM Power 6). Power 7 será un diseño mucho más equilibrado, con ocho cores en un die y con la novedad de utilizar &lt;a href="http://en.wikipedia.org/wiki/EDRAM" target="_blank"&gt;eDRAM&lt;/a&gt; para el último nivel de caché (con el doble de densidad por mm2).&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SpOM3tWdyvI/AAAAAAAAD2o/0JN8TcGgEz4/s1600-h/Power6%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Power6" border="0" alt="Power6" src="http://lh4.ggpht.com/__p96Ony2voA/SpOM5BZULWI/AAAAAAAAD2s/bhGtqsoAZUs/Power6_thumb%5B1%5D.jpg?imgmax=800" width="634" height="487" /&gt;&lt;/a&gt; IBM Power6, un masivo dual core con un consumo eléctrico desmesurado y casi 5 GHz.&lt;/p&gt;  &lt;p align="justify"&gt;Probablemente contará con 24 MB de eDRAM para los ocho procesadores con SMT de dos o quizás cuatro vías (para un total de 16 o 32 threads por chip). El ancho de banda por socket excederá los 300 GB/s de Power6 (ya de por sí todo un record).&lt;/p&gt;  &lt;p align="justify"&gt;Personalmente espero un rendimiento sobresaliente para estos procesadores (no como en su día para el Power6, que no me gustó nada cuando en su día su microarquitectura fue hecha pública) que a mi juicio retoman una línea de trabajo más lógica para IBM, ya que el mundo x86 está presionando fuertemente.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Intel Nehalem EX&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;  &lt;p align="justify"&gt;El rival del anteriormente mencionado IBM Power7 será un procesador de ocho cores con SMT de dos vías para 16 threads por chip. Contará con 24 MB de L3 compartida y cachés L2 de 256 KB para cada core.&lt;/p&gt;  &lt;p align="justify"&gt;Se alojará en el nuevo socket 1566 LGA. Ya hablé de este procesador en un &lt;a href="http://lowlevelhardware.blogspot.com/2009/05/nehalem-ex-beckton-lowlevelhardware.html" target="_blank"&gt;artículo anterior&lt;/a&gt;.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh6.ggpht.com/__p96Ony2voA/SpOM5yzfYhI/AAAAAAAAD2w/KuRSq6uPRy0/s1600-h/Image1%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Image1" border="0" alt="Image1" src="http://lh5.ggpht.com/__p96Ony2voA/SpOM7D_5lII/AAAAAAAAD20/G_yCYC0RxvI/Image1_thumb%5B1%5D.jpg?imgmax=800" width="634" height="523" /&gt;&lt;/a&gt; Intel Nehalem EX.&lt;/p&gt;  &lt;p align="justify"&gt;Con 2.3 BT (2.300.000.000 transistores) fabricados en el nodo de 45 nm cuenta con ocho núcleos basados en la arquitectura Nehalem (similar a los Core i7 de sobremesa) y cuatro enlaces QPI para comunicación con otros tres sockets y el chipset.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SpOM8Cv_MXI/AAAAAAAAD24/e6hF0Jsgd9g/s1600-h/Image2%5B3%5D.jpg"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Image2" border="0" alt="Image2" src="http://lh6.ggpht.com/__p96Ony2voA/SpOM9CXmHNI/AAAAAAAAD28/eoL9hYQYwZU/Image2_thumb%5B1%5D.jpg?imgmax=800" width="634" height="274" /&gt;&lt;/a&gt; Diagrama del die.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Los tamaños de caché. La L3 de 24 MB&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Una cuestión interesante es la inclusión de una L3 de 24 MB con acceso compartido por ocho núcleos. Teniendo en cuenta que las L2 son de solo 256 KB sus tasas de acierto no serán espectaculares y esto nos lleva a pensar que la L3 tendrá mucho trabajo.&lt;/p&gt;  &lt;p align="justify"&gt;Hace unos meses haciendo profiling comparativo en máquinas Core 2 y Athlon64 comprobé que los Core 2 fuerzan mucho más (en el sentido de acceder muchas más veces) su L2 de 6 MB que los AMD Athlon64. Esto es debido a que los Athlon64 cuentan con una L1 de 64 KB que mitiga mucho (dada su mayor tasa de aciertos) los accesos a L2, en cambio, los Core 2 con su pequeña L1 de 32 KB hacen un uso intensivo de su excelente (rapidísima para su tamaño) y gigantesca L2 de 6 MB.&lt;/p&gt;  &lt;p align="justify"&gt;Sin duda, con Beckton (Nehalem EX) el extenso equipo de ingeniería de Intel ha hecho un excelente trabajo en la identificación de los más favorables tamaños relativos de sus cachés y han llegado al diseño final de 24 MB de L3 (LLC) para 8 cores con 16 threads.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;strong&gt;&lt;font color="#0080ff"&gt;Caché de cuarto nivel, L4&lt;/font&gt;&lt;/strong&gt;&lt;/p&gt;  &lt;p align="justify"&gt;Lo que sí es cierto es que espero, en generaciones posteriores y ya con un número de núcleos mayor, la aparición de masivas cachés L4 compartidas (de tamaños sobre los 48 - 64 MB) probablemente con buses ring-bus.&lt;/p&gt;  &lt;p align="justify"&gt;Para mitigar los accesos hacia ellas habrá cachés L3 compartidas parciales (entre unos 4 – 8 núcleos por L3) de menor tamaño (sobre 4 – 8 MB) y mejor latencia que las actuales L3 de Beckton.&lt;/p&gt;  &lt;p align="justify"&gt;Por supuesto, todo esto nos espera en los 22nm y más allá …&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:bf1521f0-0ffc-40f6-b6aa-001fcdf4a7af" class="wlWriterEditableSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AMD" rel="tag"&gt;AMD&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IBM" rel="tag"&gt;IBM&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Beckton" rel="tag"&gt;Beckton&lt;/a&gt;,&lt;a href="http://technorati.com/tags/NehalemEX" rel="tag"&gt;NehalemEX&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Power6" rel="tag"&gt;Power6&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Power7" rel="tag"&gt;Power7&lt;/a&gt;,&lt;a href="http://technorati.com/tags/AthlonII" rel="tag"&gt;AthlonII&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Microarquitectura" rel="tag"&gt;Microarquitectura&lt;/a&gt;,&lt;a href="http://technorati.com/tags/cache" rel="tag"&gt;cache&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-4743770892799071479?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/4743770892799071479/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2009/08/athlon-ii-x4-ibm-power-7-e-intel.html#comment-form" title="2 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4743770892799071479?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/4743770892799071479?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/yRmjunWjsxY/athlon-ii-x4-ibm-power-7-e-intel.html" title="Athlon II X4, IBM Power 7 e Intel Nehalem EX – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh3.ggpht.com/__p96Ony2voA/SibgH0HJfJI/AAAAAAAADfk/mwcVCYoF3g0/s72-c/PhenomII_NO_L3_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>2</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2009/08/athlon-ii-x4-ibm-power-7-e-intel.html</feedburner:origLink></entry><entry gd:etag="W/&quot;D0ECQHk-eip7ImA9WxJbEUg.&quot;"><id>tag:blogger.com,1999:blog-6644579903369065806.post-2133024298577837679</id><published>2009-06-18T20:17:00.001+02:00</published><updated>2009-07-21T07:54:21.752+02:00</updated><app:edited xmlns:app="http://www.w3.org/2007/app">2009-07-21T07:54:21.752+02:00</app:edited><category scheme="http://www.blogger.com/atom/ns#" term="SAT" /><category scheme="http://www.blogger.com/atom/ns#" term="processor" /><category scheme="http://www.blogger.com/atom/ns#" term="IT" /><category scheme="http://www.blogger.com/atom/ns#" term="nehalem" /><category scheme="http://www.blogger.com/atom/ns#" term="quad core" /><category scheme="http://www.blogger.com/atom/ns#" term="intel" /><category scheme="http://www.blogger.com/atom/ns#" term="roadmap" /><category scheme="http://www.blogger.com/atom/ns#" term="microarquitectura" /><category scheme="http://www.blogger.com/atom/ns#" term="45 nm" /><category scheme="http://www.blogger.com/atom/ns#" term="x86" /><category scheme="http://www.blogger.com/atom/ns#" term="Procesador" /><category scheme="http://www.blogger.com/atom/ns#" term="quadcore" /><category scheme="http://www.blogger.com/atom/ns#" term="core i7" /><title>LGA 1156. Intel Core i3, Core i5 y Core i7 – LowLevelHardware</title><content type="html">&lt;p align="justify"&gt;Intel ha desvelado sus planes finales para los sustitutos de sus exitosas líneas Core 2 Duo y Quad, todos ellos serán procesadores de socket LGA 1156 con dos canales de memoria DDR3 y con conexión con el nuevo chipset Intel P55 mediante un simple enlace DMI de 2 – 4 GB/s.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SmVYBKnVgcI/AAAAAAAAD2g/npDS6UEXUNk/s1600-h/LGA1156%5B3%5D.jpg"&gt;&lt;img style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="LGA1156" border="0" alt="LGA1156" src="http://lh6.ggpht.com/__p96Ony2voA/SmVYC9Stp1I/AAAAAAAAD2k/3udhEnV8JmA/LGA1156_thumb%5B1%5D.jpg?imgmax=800" width="638" height="428" /&gt;&lt;/a&gt; LGA 1156, el nuevo socket mainstream de Intel.&lt;/p&gt;  &lt;p align="justify"&gt;Todos ellos estarán basados en la arquitectura Nehalem ya conocida en los actuales Core i7 LGA 1366. En cuanto a la caché L3, los quad core contarán con 8 MB de L3 y los dual core con la mitad, 4 MB.&lt;/p&gt;  &lt;p align="center"&gt;&lt;a href="http://blogs.intel.com/technology/2009/06/over_the_last_year_or.php" target="_blank"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Tech_Intel" border="0" alt="Tech_Intel" src="http://lh3.ggpht.com/__p96Ony2voA/Sjs1eCq3mQI/AAAAAAAADpM/D1ym1k36u7c/Tech_Intel%5B1%5D.jpg?imgmax=800" width="634" height="254" /&gt;&lt;/a&gt;&lt;a href="mailto:Technology@Intel"&gt;Technology@Intel&lt;/a&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;Core i7 LGA 1366 serie 900&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;La actual serie 900 que todos conocemos con triple canal DDR3 y bus QPI para comunicación con el Intel X58. Seguirá manteniendo el liderato en prestaciones y el mayor precio.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;Core i7 LGA 1156 serie 800&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/SjqEnDxyOtI/AAAAAAAADoA/25I1SfYsxPw/s1600-h/i7%5B2%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="i7" border="0" alt="i7" src="http://lh3.ggpht.com/__p96Ony2voA/SjqEnU4rAtI/AAAAAAAADoE/mHv8L0etbYo/i7_thumb.png?imgmax=800" width="82" height="63" /&gt;&lt;/a&gt; Los actuales procesadores Core i7 de socket LGA 1366 quedan como gama alta (serie 900) y se lanzarán varios modelos para placas de socket 1156 y chipset P55 (serie 800) con doble canal DDR3.&lt;/p&gt;  &lt;p align="justify"&gt;Contarán con cuatro núcleos con HyperThreading y Turbo Mode para un total de ocho threads como en la actual gama 900.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;Core i5 LGA 1156 serie 600&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a href="http://lh3.ggpht.com/__p96Ony2voA/SjqEn3k9T_I/AAAAAAAADoI/prbZin5EfMM/s1600-h/i5%5B2%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="i5" border="0" alt="i5" src="http://lh6.ggpht.com/__p96Ony2voA/SjqEoDqDwYI/AAAAAAAADoM/WpShki5GCKc/i5_thumb.png?imgmax=800" width="82" height="63" /&gt;&lt;/a&gt; Habrá modelos de dos y cuatro núcleos, los de dos núcleos contaran con HyperThreading (SMT) y en cambio los quad cores lo llevarán deshabilitado para diferenciarlos de los Core i7. Todos ellos contarán con Turbo Mode.&lt;/p&gt;  &lt;p align="justify"&gt;También como chipset con el Intel P55 mediante DMI.&lt;/p&gt;  &lt;p align="justify"&gt;&lt;font color="#0080ff"&gt;Core i3 LGA 1156 serie 500&lt;/font&gt;&lt;/p&gt;  &lt;p align="justify"&gt;&lt;a href="http://lh5.ggpht.com/__p96Ony2voA/SjqEoh5A4lI/AAAAAAAADoQ/0QmlmoFLToo/s1600-h/i3%5B2%5D.png"&gt;&lt;img style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="i3" border="0" alt="i3" src="http://lh6.ggpht.com/__p96Ony2voA/SjqEo1jcs-I/AAAAAAAADoU/9690MTfrlRE/i3_thumb.png?imgmax=800" width="82" height="63" /&gt;&lt;/a&gt; Serán idénticos a los i5 pero con Turbo Mode deshabilitado y seguramente frecuencias inferiores. Igualmente con el Intel P55.&lt;/p&gt;  &lt;div style="padding-bottom: 0px; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: none; padding-top: 0px" id="scid:0767317B-992E-4b12-91E0-4F059A8CECA8:cfb527f8-6b87-4c1e-bd7a-92c92732669c" class="wlWriterSmartContent"&gt;Etiquetas de Technorati: &lt;a href="http://technorati.com/tags/Nehalem" rel="tag"&gt;Nehalem&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Core+i7" rel="tag"&gt;Core i7&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Core+i5" rel="tag"&gt;Core i5&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Core+i3" rel="tag"&gt;Core i3&lt;/a&gt;,&lt;a href="http://technorati.com/tags/LGA1156" rel="tag"&gt;LGA1156&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Intel" rel="tag"&gt;Intel&lt;/a&gt;,&lt;a href="http://technorati.com/tags/SAT" rel="tag"&gt;SAT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/IT" rel="tag"&gt;IT&lt;/a&gt;,&lt;a href="http://technorati.com/tags/Roadmap" rel="tag"&gt;Roadmap&lt;/a&gt;&lt;/div&gt;  &lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/6644579903369065806-2133024298577837679?l=lowlevelhardware.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel="replies" type="application/atom+xml" href="http://lowlevelhardware.blogspot.com/feeds/2133024298577837679/comments/default" title="Enviar comentarios" /><link rel="replies" type="text/html" href="http://lowlevelhardware.blogspot.com/2009/06/lga-1156-intel-core-i3-core-i5-y-core.html#comment-form" title="0 comentarios" /><link rel="edit" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/2133024298577837679?v=2" /><link rel="self" type="application/atom+xml" href="http://www.blogger.com/feeds/6644579903369065806/posts/default/2133024298577837679?v=2" /><link rel="alternate" type="text/html" href="http://feedproxy.google.com/~r/Lowlevelhardware/~3/IOQhCcBvFBM/lga-1156-intel-core-i3-core-i5-y-core.html" title="LGA 1156. Intel Core i3, Core i5 y Core i7 – LowLevelHardware" /><author><name>Carlos Yus</name><uri>http://www.blogger.com/profile/17016594305206647569</uri><email>noreply@blogger.com</email><gd:image rel="http://schemas.google.com/g/2005#thumbnail" width="32" height="24" src="http://bp0.blogger.com/__p96Ony2voA/SDbqafSPilI/AAAAAAAAAfo/wA1sQRZ8BP0/S220/PIC00677.png" /></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="http://lh6.ggpht.com/__p96Ony2voA/SmVYC9Stp1I/AAAAAAAAD2k/3udhEnV8JmA/s72-c/LGA1156_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total>0</thr:total><feedburner:origLink>http://lowlevelhardware.blogspot.com/2009/06/lga-1156-intel-core-i3-core-i5-y-core.html</feedburner:origLink></entry></feed>

