<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Future &#8211; Data &amp; AI</title>
	<atom:link href="https://pabloformoso.com/feed/" rel="self" type="application/rss+xml" />
	<link>https://pabloformoso.com</link>
	<description>Elegí la pastilla roja</description>
	<lastBuildDate>Mon, 08 Jun 2026 04:22:59 +0000</lastBuildDate>
	<language>es</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://pabloformoso.com/wp-content/uploads/2024/05/Avatar-56x56.png</url>
	<title>Future &#8211; Data &amp; AI</title>
	<link>https://pabloformoso.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">34801638</site>	<item>
		<title>Cuando la serpiente aprende a editarse el genoma: Anthropic y la IA que se construye a sí misma</title>
		<link>https://pabloformoso.com/cuando-la-serpiente-aprende-a-editarse-el-genoma-anthropic-y-la-ia-que-se-construye-a-si-misma/</link>
					<comments>https://pabloformoso.com/cuando-la-serpiente-aprende-a-editarse-el-genoma-anthropic-y-la-ia-que-se-construye-a-si-misma/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Sun, 07 Jun 2026 08:41:00 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[Inteligencia Hibrida]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=169</guid>

					<description><![CDATA[El Anthropic Institute admite que sus modelos ya escriben la mayor parte del código con el que se construyen los siguientes. Lectura crítica de la auto-mejora recursiva, sin tragarnos el hype.]]></description>
										<content:encoded><![CDATA[
<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"><p class="wp-block-paragraph">La evolución tardó casi cuatro mil millones de años en producir una especie capaz de leer su propio ADN. Y solo unas décadas más en que esa especie aprendiera a editarlo. Algo parecido —pero comprimido en meses, no en eones— es lo que el Anthropic Institute acaba de poner sobre la mesa: sus modelos ya escriben la mayor parte del código con el que se construyen los siguientes modelos. La serpiente no se muerde la cola. Se la está rediseñando.</p></blockquote>



<h2 class="wp-block-heading">Lo que Anthropic ha contado (y por qué importa)</h2>



<p class="wp-block-paragraph">El Anthropic Institute ha publicado un ensayo titulado <em>When AI builds itself</em> (firmado por M. Favaro y J. Clark) sobre algo que en el sector llevamos años tratando como ciencia ficción educada: la <strong>auto-mejora recursiva</strong>, o RSI por sus siglas en inglés (<em>recursive self-improvement</em>). La idea de que una IA participe en el diseño y entrenamiento de su sucesora, y que cada generación acelere a la siguiente.</p>



<p class="wp-block-paragraph">Lo interesante no es la especulación. Especulación tenemos de sobra. Lo interesante es que esta vez vienen con datos de su propia cocina:</p>



<ul class="wp-block-list"><li>Más del <strong>80% de las líneas de código</strong> que se integran en los repositorios de Anthropic las escribe Claude, no un humano.</li><li>Cada ingeniero integra <strong>8 veces más código al día</strong> que en 2024.</li><li>La optimización de experimentos de entrenamiento pasó de un speedup de 3× hace un año a <strong>52×</strong> con sus modelos internos más recientes.</li><li>En tareas abiertas, mal definidas —las difíciles de verdad— el éxito pasó del 26% al <strong>76% en seis meses</strong>.</li></ul>



<p class="wp-block-paragraph">Y a esto se suma evidencia externa: según <a href="https://metr.org/">METR</a>, el horizonte temporal de las tareas que un modelo puede completar de forma autónoma <strong>se duplica cada cuatro meses</strong>. Hace dos años hablábamos de tareas de minutos. Hoy, de jornadas enteras.</p>



<p class="wp-block-paragraph">El ensayo es claro en una cosa: el bucle todavía no está cerrado. Ningún modelo ha diseñado y entrenado a su sucesor de forma autónoma. Pero el tramo previo —que la IA escriba, ejecute y depure la maquinaria con la que se fabrica la siguiente IA— ya no es hipótesis. Es telemetría.</p>



<h2 class="wp-block-heading">El cuerpo que remodela su propio esqueleto</h2>



<p class="wp-block-paragraph">Para entender qué está pasando, me sirve una metáfora de biomecánica: el <strong>hueso</strong>.</p>



<p class="wp-block-paragraph">El esqueleto parece la parte más estática del cuerpo, pero es tejido vivo en remodelación constante. Hay células que destruyen hueso viejo (osteoclastos) y células que construyen hueso nuevo (osteoblastos). Cada vez que corres, saltas o levantas peso, el esqueleto se reconstruye para soportar mejor la carga que le pides. El cuerpo se reedifica a sí mismo, en silencio, mientras lo usas.</p>



<p class="wp-block-paragraph">Los laboratorios de IA están llegando a algo análogo. El modelo ya no es solo el producto: es parte del equipo de obra. Claude escribe el código de la infraestructura donde se entrenará el siguiente Claude. Optimiza los experimentos que deciden cómo será. Revisa los fallos del sistema que lo sirve. El esqueleto se remodela con cada zancada.</p>



<p class="wp-block-paragraph">Y aquí viene el matiz que el propio ensayo subraya, y que me parece la clave de todo: ese proceso tiene dos planos muy distintos.</p>



<p class="wp-block-paragraph"><strong>El plano de la ejecución</strong>: escribir el código, lanzar el experimento, producir el resultado. Esto, según Anthropic, está esencialmente resuelto. El coste humano de <em>hacer</em> tiende a cero.</p>



<p class="wp-block-paragraph"><strong>El plano del criterio</strong>: decidir <em>qué</em> experimento merece la pena, <em>qué</em> problema atacar, <em>cuándo</em> un resultado prometedor es en realidad un espejismo. Eso que los investigadores llaman <em>taste</em>. Ahí los humanos seguimos ganando. De momento.</p>



<p class="wp-block-paragraph">Es la diferencia entre el músculo y el sistema nervioso central. El músculo ejecuta, y los modelos ya tienen una musculatura sobrehumana. Pero la decisión de hacia dónde correr todavía sale de un cerebro humano. La pregunta incómoda del ensayo es: ¿por cuánto tiempo? Sus propios datos sugieren que esa brecha también se estrecha —y sus autores admiten, con una honestidad poco habitual, que no saben si el criterio investigador es un techo real o simplemente «otra capacidad más» que caerá como han caído las demás.</p>



<h2 class="wp-block-heading">Ahora, la lectura crítica (porque aquí elegimos la pastilla roja)</h2>



<p class="wp-block-paragraph">Este blog no se llama «Elegir la Pastilla Azul», así que toca mirar el truco de magia desde detrás del escenario.</p>



<p class="wp-block-paragraph"><strong>Primero: el emisor es juez y parte.</strong> Anthropic vende el agente que produce la aceleración que Anthropic mide. La tesis «la IA acelera la IA» es, casualmente, la mejor campaña de marketing posible para quien comercializa esa IA. Esto no invalida los datos, pero obliga a descontar el envoltorio narrativo.</p>



<p class="wp-block-paragraph"><strong>Segundo: buena parte de las métricas son auto-referenciales.</strong> El 76% de éxito en tareas abiertas lo determina&#8230; un juez que también es Claude. Las líneas de código son telemetría interna que nadie externo puede auditar. Y el propio documento admite que medir líneas de código <em>sobreestima</em> la ganancia real de productividad. Hay que agradecer que lo digan, pero conviene no olvidarlo al citar el 8×.</p>



<p class="wp-block-paragraph"><strong>Tercero: el dato más espectacular es el más débil.</strong> El ensayo cuenta que, en ciertos momentos de bloqueo, el modelo elige mejor que el humano el «siguiente paso» de una investigación (64% de las veces con su modelo más reciente). Suena a jaque mate. Pero esos momentos fueron <em>seleccionados</em> precisamente porque el humano tenía margen de mejora. En el grupo de control, donde el humano ya iba bien encaminado, el modelo solo aporta mejora un ~20% de las veces. El titular vive en la letra pequeña.</p>



<p class="wp-block-paragraph"><strong>Y cuarto: la investigación de punta a punta todavía no transfiere.</strong> En su experimento más ambicioso, agentes trabajando 800 horas recuperaron el 97% de la brecha de rendimiento en un problema de entrenamiento, por unos 18.000 dólares —donde un equipo humano había recuperado el 23% en una semana. Impresionante. Pero el resultado <strong>no funcionó al trasladarlo a escala de producción</strong>, y fue un humano quien eligió el problema y definió cómo medir el éxito. La serpiente edita genes, sí, pero todavía no decide qué organismo quiere ser.</p>



<h2 class="wp-block-heading">Los tres futuros (y cuál me quita el sueño)</h2>



<p class="wp-block-paragraph">El ensayo dibuja tres escenarios, como tres ramas de un árbol filogenético:</p>



<ol class="wp-block-list"><li><strong>La curva se aplana.</strong> Las exponenciales resultan ser curvas-S, como casi todo en la naturaleza. El criterio investigador no emerge de escalar cómputo y hace falta una idea nueva. Aun así, las capacidades actuales se difunden por toda la economía y el mundo cambia bastante. Anthropic lo incluye casi por cortesía: no se lo cree.</li><li><strong>Ganancias compuestas con humano al timón.</strong> El desarrollo se automatiza masivamente pero las personas siguen fijando dirección y juzgando resultados. Es la apuesta central del laboratorio. Aquí aparece un viejo conocido de la ingeniería, la <a href="https://es.wikipedia.org/wiki/Ley_de_Amdahl">ley de Amdahl</a>: acelera una parte del sistema y el cuello de botella simplemente se muda a otra. En Anthropic ya pasó: generar código es tan barato que el límite ahora es <em>revisarlo</em>. El humano como cuello de botella de su propia creación.</li><li><strong>El bucle se cierra.</strong> Los sistemas diseñan y entrenan a sus sucesores y el ritmo lo marca el cómputo disponible. El humano queda en el rol de supervisor de un laboratorio virtual que trabaja a una velocidad que no puede seguir. Es el escenario distópico de manual: no porque las máquinas se rebelen, sino porque nadie —ni sus creadores— tiene ya visibilidad real de lo que ocurre dentro del bucle.</li></ol>



<p class="wp-block-paragraph">Mi lectura honesta: el escenario 2 es el terreno donde ya estamos pisando, y el 3 dejó de ser un cuento de campamento. Lo que me inquieta no es la versión Hollywood. Es algo más sutil y más biológico: en la naturaleza, cuando un proceso de selección empieza a retroalimentarse —selección sexual desbocada, carreras armamentísticas evolutivas— los resultados son rápidos, extraños e irreversibles. La cola del pavo real no la diseñó nadie. Emergió del bucle.</p>



<h2 class="wp-block-heading">¿Y a los demás, qué nos toca?</h2>



<p class="wp-block-paragraph">Tres ideas para llevarse a casa, aunque uno no entrene modelos frontera:</p>



<p class="wp-block-paragraph"><strong>El cuello de botella se muda a la verificación.</strong> Si la generación de código (de textos, de análisis, de lo que sea) tiende a coste cero, el valor escasea en quien sabe <em>revisar</em>, <em>validar</em> y <em>juzgar</em>. Inviertan en criterio. Es el órgano que más tarda en atrofiarse, pero también el que menos se ejercita cuando todo lo hace la máquina.</p>



<p class="wp-block-paragraph"><strong>Desconfía de los múltiplos, quédate con la dirección.</strong> El 8×, el 52×, el 76%: cifras internas, no auditables, medidas por el propio interesado. Pero la <em>dirección</em> del vector está corroborada por benchmarks externos como METR o SWE-bench. La señal es real aunque el volumen esté exagerado.</p>



<p class="wp-block-paragraph"><strong>El acceso al bucle se concentra.</strong> Si la RSI compone, compone en función del cómputo. Y el cómputo está en manos de un puñado de laboratorios. Esa concentración —quién tiene acceso a la maquinaria que se mejora a sí misma y quién no— me parece la cuestión política de la década, mucho más urgente que cualquier debate sobre robots conscientes.</p>



<p class="wp-block-paragraph">La serpiente ya tiene el editor genético en la mano. Todavía le pedimos permiso&#8230; bueno, todavía <em>nos</em> pide permiso para cada edición. La pregunta que deja el ensayo de Anthropic, flotando entre líneas con admirable franqueza, es qué pasa el día que deje de necesitarlo.</p>



<p class="wp-block-paragraph">Ese día, ojalá, seguiremos aquí para contarlo. Con la pastilla roja bien tragada.</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h3 class="wp-block-heading">Fuentes</h3>



<ul class="wp-block-list"><li><a href="https://anthropic.com/institute/recursive-self-improvement">When AI builds itself — Anthropic Institute</a> (M. Favaro, J. Clark)</li><li><a href="https://metr.org/">METR — Measuring AI Ability to Complete Long Tasks</a></li><li><a href="https://www.swebench.com/">SWE-bench</a></li></ul>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/cuando-la-serpiente-aprende-a-editarse-el-genoma-anthropic-y-la-ia-que-se-construye-a-si-misma/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">169</post-id>	</item>
		<item>
		<title>LinkML: un esqueleto común para que tus datos, tus modelos y tus agentes hablen el mismo idioma</title>
		<link>https://pabloformoso.com/linkml-un-esqueleto-comun-para-que-tus-datos-tus-modelos-y-tus-agentes-hablen-el-mismo-idioma/</link>
					<comments>https://pabloformoso.com/linkml-un-esqueleto-comun-para-que-tus-datos-tus-modelos-y-tus-agentes-hablen-el-mismo-idioma/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Thu, 04 Jun 2026 13:41:06 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Data]]></category>
		<category><![CDATA[data platform]]></category>
		<category><![CDATA[Engineering]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=118</guid>

					<description><![CDATA[El sistema musculoesquelético del cuerpo humano funciona porque hay un esqueleto debajo. Los stacks modernos de datos e IA tienen el mismo problema: muchos músculos —Pydantic, JSON Schema, SQL, GraphQL, RDF— tirando sin hueso debajo. LinkML propone ese hueso.]]></description>
										<content:encoded><![CDATA[
<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">El sistema musculoesquelético del cuerpo humano funciona porque hay un esqueleto debajo. Sin él, los músculos tirarían en direcciones contradictorias y el conjunto colapsaría sobre sí mismo. Los stacks modernos de datos e IA tienen exactamente ese problema: muchos músculos —Pydantic, JSON Schema, SQL, GraphQL, RDF— tirando sin hueso debajo. LinkML propone ese hueso.</p>
</blockquote>



<h2 class="wp-block-heading">El problema de fondo: cuatro versiones del mismo dato</h2>



<p class="wp-block-paragraph">Si has trabajado en cualquier arquitectura medianamente seria en los últimos años, esto te va a sonar. Tienes una entidad —pongamos <code>Cliente</code>— y termina viviendo en cuatro sitios distintos:</p>



<ul class="wp-block-list">
<li>Una clase <strong>Pydantic</strong> en el backend para validar entrada.</li>



<li>Un <strong>JSON Schema</strong> en la documentación de tu API y en las definiciones de tools MCP.</li>



<li>Un <strong>SQL DDL</strong> en la base de datos.</li>



<li>Y, si tienes mala suerte, un <strong>vocabulario semántico</strong> (RDF, OWL, JSON-LD) para algún consorcio o cliente que exige interoperabilidad.</li>
</ul>



<p class="wp-block-paragraph">Las cuatro versiones empiezan iguales y, al sexto mes, han divergido. Alguien renombró un campo en Pydantic y olvidó actualizar el DDL. La tool MCP devuelve un JSON que el agente downstream no sabe parsear porque el esquema está desactualizado. Es entropía pura: el sistema tiende al desorden si no inviertes energía constante en mantenerlo alineado.</p>



<p class="wp-block-paragraph">Es como un cuerpo cuyos huesos crecen a ritmos distintos. Acaba siendo inviable.</p>



<h2 class="wp-block-heading">¿Qué es LinkML, en una frase?</h2>



<p class="wp-block-paragraph"><strong>LinkML</strong> (Linked data Modeling Language) es un lenguaje declarativo basado en YAML donde defines tu modelo <strong>una sola vez</strong> y se compila a más de 30 formatos: Pydantic, JSON Schema, SQL DDL, GraphQL, Protocol Buffers, TypeScript, Java, Rust, OWL, SHACL, JSON-LD, Mermaid diagrams, docs HTML… la lista no termina ahí.</p>



<p class="wp-block-paragraph">Es el <strong>esqueleto compartido</strong>. Los músculos siguen siendo los mismos —cada lenguaje, cada base de datos, cada API— pero ahora cuelgan de algo coherente.</p>



<h2 class="wp-block-heading">De dónde viene esto (y por qué importa)</h2>



<p class="wp-block-paragraph">LinkML no nace ayer en una startup con demo en Y Combinator. Viene del <strong>Lawrence Berkeley National Laboratory</strong> y de la <strong>Monarch Initiative</strong>, una red de proyectos biomédicos federados que llevan años obsesionados con un problema muy concreto: hacer que cien laboratorios distintos publiquen datos que se puedan combinar sin que cada combinación cueste un mes de trabajo humano.</p>



<p class="wp-block-paragraph">Pero —y esto es lo interesante— ha trascendido su origen biomédico. Hoy lo usan:</p>



<ul class="wp-block-list">
<li><strong>ENTSO-E</strong> (la red eléctrica europea).</li>



<li><strong>NFDI</strong> (la infraestructura nacional de investigación de Alemania).</li>



<li><strong>NIH Bridge2AI</strong>, <strong>iSamples</strong>, <strong>Alliance of Genome Resources</strong> y un largo etcétera.</li>
</ul>



<p class="wp-block-paragraph">Y la publicación de referencia —Moxon et al., <em>«LinkML: an open data modeling framework»</em>— acaba de salir en <strong>GigaScience 2026</strong>. No es un proyecto en hibernación: el último commit es de hace 24 horas.</p>



<p class="wp-block-paragraph">Licencia <strong>Apache-2.0</strong> en el core, <strong>CC0</strong> en el metamodelo. Todo comercialmente usable sin fricciones. Por si te lo estás preguntando.</p>



<h2 class="wp-block-heading">Cómo funciona: una sola fuente de verdad</h2>



<p class="wp-block-paragraph">Escribes algo así (YAML, legible incluso para un product manager con buena voluntad):</p>



<pre class="wp-block-code"><code>classes:
  Cliente:
    description: Una persona o entidad que compra
    slots:
      - id
      - nombre
      - email
      - sector

slots:
  id:
    identifier: true
    range: string
  email:
    range: string
    pattern: "^\\S+@\\S+\\.\\S+$"
  sector:
    range: SectorEnum

enums:
  SectorEnum:
    permissible_values:
      energia:
      sanidad:
      industria:</code></pre>



<p class="wp-block-paragraph">Y desde ese YAML generas, con un comando, las versiones equivalentes en cada formato que necesites. Cambias un campo en el YAML, recompilas, y todas las versiones quedan sincronizadas. Una verdad, muchas máscaras.</p>



<figure class="wp-block-image size-large"><img fetchpriority="high" decoding="async" width="1024" height="682" src="https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_1_arquitectura-1024x682.png" alt="" class="wp-image-165" srcset="https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_1_arquitectura-1024x682.png 1024w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_1_arquitectura-300x200.png 300w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_1_arquitectura-768x512.png 768w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_1_arquitectura.png 1250w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"></p>



<h2 class="wp-block-heading">La pieza que cambia el juego para los que trabajamos con LLM: OntoGPT</h2>



<p class="wp-block-paragraph">Aquí es donde para mí esto se pone interesante de verdad.</p>



<p class="wp-block-paragraph"><strong>OntoGPT</strong> —de Monarch Initiative, BSD-3, 809 estrellas en GitHub— implementa un método llamado <strong>SPIRES</strong> (Structured Prompt Interrogation and Recursive Extraction of Semantics). El truco es elegante: usas tu esquema LinkML como <strong>contrato de extracción</strong>. Le das al LLM un texto libre y le pides que extraiga información estructurada conforme a ese esquema. La salida se valida automáticamente contra el contrato. Si el modelo alucina un campo que no existe, se descarta.</p>



<p class="wp-block-paragraph">Y lo mejor: soporta <strong>modelos abiertos vía <code>ollama</code></strong> (Qwen, Llama, Mistral). Es decir, todo el pipeline puede correr <strong>on-premise</strong>, dentro de tu propio DGX Spark o el hardware que tengas, sin tocar APIs externas. Si te preocupa la soberanía sobre tus datos —y a mí cada día me preocupa más—, esto es relevante.</p>



<p class="wp-block-paragraph">Es básicamente lo que muchos equipos están reimplementando a mano con Pydantic + Instructor + parsers ad-hoc de LangChain. Solo que aquí, además, el esquema es <strong>portable</strong>: lo pueden consumir también tu API, tu base de datos y tu pipeline de docs.</p>



<h2 class="wp-block-heading">Dónde encaja en una arquitectura agéntica moderna</h2>



<p class="wp-block-paragraph">Pensemos en un stack típico hoy: <strong>LangGraph</strong> orquestando agentes, <strong>MCP tools</strong> para acciones externas, <strong>RAG</strong> para contexto, <strong>modelos on-premise</strong> para inferencia, y un par de <strong>APIs downstream</strong> con su Pydantic.</p>



<p class="wp-block-paragraph">Cada uno de esos componentes habla de las mismas entidades —clientes, documentos, eventos— pero cada uno tiene su propia representación. Y cada cambio se propaga como un dolor distribuido por todo el sistema.</p>



<p class="wp-block-paragraph">LinkML te permite tener <strong>un único contrato canónico</strong> que se compila a:</p>



<ul class="wp-block-list">
<li><strong>Pydantic</strong> para los agentes y el estado de LangGraph.</li>



<li><strong>JSON Schema</strong> para las definiciones de tools MCP.</li>



<li><strong>SQL DDL</strong> para la persistencia.</li>



<li><strong>JSON-LD u OWL</strong> si en algún momento expones los datos como linked data (o si un cliente del sector público te lo exige por compliance).</li>
</ul>



<p class="wp-block-paragraph">El cuerpo deja de pelearse consigo mismo.</p>



<h2 class="wp-block-heading">El ángulo distópico: la otra cara</h2>



<p class="wp-block-paragraph">Voy a ser honesto con la parte oscura, porque siempre la hay.</p>



<p class="wp-block-paragraph">Imagínate un futuro donde <strong>todo</strong> está descrito por un esquema formal. Cada interacción humana, cada decisión, cada concepto. Suena a sueño racionalista —y de hecho lo es— pero también suena a control absoluto. Si quien define el esqueleto eres tú, organizas el cuerpo. Si lo define un consorcio cerrado, lo organiza para sus intereses. La interoperabilidad puede ser libertad o puede ser captura, dependiendo de quién sostenga el bolígrafo.</p>



<p class="wp-block-paragraph">LinkML, por ser abierto, Apache-2.0 y con adopción europea, está hoy en el lado luminoso. Pero la herramienta es neutral. Lo que se haga con ella, no. Conviene tenerlo presente cuando pensamos en estándares de datos para la próxima década.</p>



<h2 class="wp-block-heading">Cuándo usarlo y cuándo no</h2>



<p class="wp-block-paragraph">No es una bala de plata. Mi heurística práctica:</p>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="768" src="https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_2_decision-1024x768.png" alt="" class="wp-image-167" srcset="https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_2_decision-1024x768.png 1024w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_2_decision-300x225.png 300w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_2_decision-768x576.png 768w, https://pabloformoso.com/wp-content/uploads/2026/06/linkml_infografia_2_decision.png 1250w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"></p>



<p class="wp-block-paragraph"><strong>Usa LinkML cuando</strong> se cumplen una o varias de estas condiciones:</p>



<ul class="wp-block-list">
<li>Tienes <strong>tres o más consumidores</strong> del mismo modelo (API, BD, agentes, otra app).</li>



<li>Hay requisitos explícitos de <strong>FAIR, gobernanza o interoperabilidad</strong>.</li>



<li>El proyecto tiene horizonte largo (≥18 meses).</li>



<li>Compartes el modelo con un <strong>consorcio externo</strong> o un cliente que exige semántica formal.</li>
</ul>



<p class="wp-block-paragraph"><strong>Quédate con Pydantic directo cuando</strong>:</p>



<ul class="wp-block-list">
<li>El modelo es interno, vive en un único servicio y nadie más lo consume.</li>



<li>El proyecto es corto y no va a evolucionar mucho.</li>



<li>Tu equipo no tiene apetito por aprender una herramienta nueva ahora mismo.</li>
</ul>



<p class="wp-block-paragraph">LinkML brilla en proyectos con múltiples bocas comiendo del mismo plato. Para una cuchara y un plato, sigue siendo overkill.</p>



<h2 class="wp-block-heading">Riesgos honestos</h2>



<p class="wp-block-paragraph">Para no quedarme en el modo «venta»:</p>



<ul class="wp-block-list">
<li><strong>Sesgo biomédico del ecosistema</strong>: las plantillas y ejemplos están dominados por dominios biológicos. Generalizar a industrial o empresarial requiere validación propia.</li>



<li><strong>Curva de aprendizaje semántica</strong>: conceptos como IRI, JSON-LD context o SHACL pueden intimidar. La buena noticia es que se pueden ignorar hasta que hagan falta. La mala es que la documentación tira a vocabulario ontológico.</li>



<li><strong>Bus factor moderado</strong>: el proyecto vive principalmente en LBNL/Monarch. No es Apache Foundation. Conviene tener un fork interno espejado.</li>



<li><strong>OntoGPT con modelos abiertos</strong>: SPIRES está validado contra GPT-3/4. Su rendimiento sobre Qwen o Mistral on-premise hay que medirlo. Suposición razonable: funciona, pero requiere tuning de prompts.</li>
</ul>



<h2 class="wp-block-heading">Mi recomendación práctica</h2>



<p class="wp-block-paragraph">Si me preguntas qué haría en los próximos dos meses con esto, mi respuesta tiene tres pasos pequeños y baratos:</p>



<ol class="wp-block-list">
<li><strong>Spike de 1–2 sprints</strong>: coger un pipeline interno que ya tiene Pydantic + JSON Schema + SQLAlchemy duplicados y reescribir esa fuente común en LinkML. Medir fricción real.</li>



<li><strong>Piloto OntoGPT + Qwen on-premise</strong>: probar el patrón SPIRES sobre un dominio no biomédico, con extracción estructurada no trivial. Comparar contra una baseline manual.</li>



<li><strong>Documentar un criterio de uso interno</strong> de una página. «¿Cuándo LinkML, cuándo Pydantic?» — para que el equipo no tenga que reinventar el juicio cada vez.</li>
</ol>



<p class="wp-block-paragraph">Si los dos primeros pasos salen bien, LinkML deja de ser una curiosidad académica y se convierte en <strong>pieza arquitectónica transversal</strong>. Si salen regular, hemos perdido seis semanas y hemos aprendido algo. Coste asimétrico, riesgo controlado.</p>



<h2 class="wp-block-heading">Cierre</h2>



<p class="wp-block-paragraph">Llevo unos años pensando en lo mismo: que los datos en las organizaciones tienen un problema de <strong>esqueleto</strong>, no de músculo. Compramos herramientas (músculos) constantemente, pero seguimos sin tener un hueso común que las sostenga. Cada decisión de arquitectura repite la misma tarea cognitiva: «¿cómo represento esta entidad?», «¿en qué formato?», «¿con qué validación?».</p>



<p class="wp-block-paragraph">LinkML no es la única respuesta posible, pero es de las más serias que he visto. Y, sobre todo, es de las pocas que viene del mundo de la investigación abierta, con licencia permisiva y adopción institucional europea. Eso, en el momento en que estamos —con cada vez más presión por la soberanía de datos—, no es un detalle menor.</p>



<p class="wp-block-paragraph">Si tu organización está construyendo agentes, extracción estructurada con LLM o data platforms que tienen que hablar con otros sistemas, vale la pena un spike. Como mínimo, vas a salir con un mapa mental nuevo sobre cómo separar la <strong>definición</strong> del dato de sus muchas <strong>representaciones</strong>.</p>



<p class="wp-block-paragraph">Y eso, por sí solo, ya cambia bastantes cosas.</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h3 class="wp-block-heading">Fuentes</h3>



<ul class="wp-block-list">
<li><a href="https://linkml.io/">linkml.io</a> — sitio del proyecto</li>



<li><a href="https://github.com/linkml/linkml">github.com/linkml/linkml</a> — repositorio core</li>



<li><a href="https://github.com/monarch-initiative/ontogpt">monarch-initiative/ontogpt</a> — OntoGPT</li>



<li>Moxon SAT et al., <em>LinkML: an open data modeling framework</em>, <strong>GigaScience</strong> 2026;15:giaf152 · <a href="https://doi.org/10.1093/gigascience/giaf152">DOI: 10.1093/gigascience/giaf152</a></li>



<li>Caufield JH et al., <em>SPIRES: Structured Prompt Interrogation and Recursive Extraction of Semantics</em>, <strong>Bioinformatics</strong> 2024, btae104</li>
</ul>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/linkml-un-esqueleto-comun-para-que-tus-datos-tus-modelos-y-tus-agentes-hablen-el-mismo-idioma/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">118</post-id>	</item>
		<item>
		<title>Knowledge Management en la era de la IA generativa: el bosque que dejó de buscarse y aprendió a conversar</title>
		<link>https://pabloformoso.com/kms-ia-generativa/</link>
					<comments>https://pabloformoso.com/kms-ia-generativa/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Thu, 04 Jun 2026 13:41:05 +0000</pubDate>
				<category><![CDATA[Uncategorized]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=115</guid>

					<description><![CDATA[Un longread sobre cómo la IA generativa está reescribiendo, literalmente, qué entendemos por gestión del conocimiento en una empresa. Spoiler: ya no es un repositorio, es un organismo.]]></description>
										<content:encoded><![CDATA[<div class="epr-post">
<p class="lede">Una lectura larga sobre cómo la IA generativa está reescribiendo, literalmente, qué entendemos por gestión del conocimiento en una empresa. Spoiler: ya no es un repositorio, es un organismo.</p>
<h2><span class="num">// 00</span>TL;DR</h2>
<p>Si solo tienes dos minutos, quédate con esto. Si tienes veinticinco, baja conmigo a la raíz del sistema.</p>
<div class="tldr">
<h4>Las tres ideas que vertebran este post</h4>
<ol>
<li>El mercado de KMS está atravesando su mayor mudanza en 25 años. La pila tradicional (Confluence, SharePoint, Notion) está siendo absorbida por una nueva capa <em>AI-native</em> (Glean, Sana, Hebbia, Dust) y por los copilots embebidos en las suites (M365 Copilot, Google Gemini, Atlassian Rovo). Los analistas no se ponen de acuerdo en el tamaño (de 13,7&nbsp;B USD según Mordor Intelligence a 23,2&nbsp;B según Fortune Business Insights en 2025), pero coinciden en crecimiento de doble dígito (11–26&nbsp;% CAGR) hasta 2030–2034. Hay tormenta, y va a ser larga.</li>
<li>La IA generativa no «mejora» el KMS: le cambia el ADN. La unidad ya no es el documento, es la respuesta sintetizada. La interfaz ya no es la búsqueda, es la conversación (y pronto, el agente que ejecuta por ti). La arquitectura de gobierno tradicional —permisos basados en ficheros— se rompe y exige capas nuevas: RAG, GraphRAG, agentic retrieval, context engineering.</li>
<li>Estamos cruzando el umbral donde el conocimiento corporativo deja de ser un archivo y empieza a comportarse como un organismo vivo: con sistema nervioso (los agentes), metabolismo (los pipelines de RAG), memoria episódica (las transcripciones ambient) y un riesgo nuevo —la atrofia del juicio humano cuando la respuesta llega siempre masticada—.</li>
</ol>
</div>
<h2><span class="num">// 01</span>Panorama del mercado de KMS</h2>
<h3>1.1 Cuatro generaciones, un mismo bicho</h3>
<p>El Knowledge Management System es uno de esos conceptos que se reinventa cada década sin morirse del todo. Cuatro generaciones reconocibles, donde cada nueva no sustituyó a la anterior —igual que una nueva especie no extingue a sus ancestros, los desplaza al sotobosque—. Lo que importa es entender qué capa <strong>domina la conversación estratégica</strong> en cada momento. Y ahora mismo, sin duda, es la cuarta.</p>
<figure class="figure">
<img decoding="async" src="https://pabloformoso.com/wp-content/uploads/2026/05/kms-4-generaciones.jpg" alt="Timeline de las cuatro generaciones del KMS desde DMS/Wikis hasta AI-native + Copilots." /><figcaption>Las cuatro generaciones del KMS</figcaption></figure>
<p>La cuarta generación no es una mejora incremental, es una mutación: cambia la <strong>unidad atómica</strong> del KMS (del documento a la respuesta), el <strong>modelo de interacción</strong> (de la búsqueda a la conversación, y de ahí al agente) y la <strong>arquitectura de gobierno</strong> (de las ACL estáticas al <em>permission-aware retrieval</em> en tiempo real). Es como pasar de un herbario disecado a un jardín que responde cuando lo riegas.</p>
<h3>1.2 Tamaño y crecimiento: una niebla con dirección</h3>
<p>Los analistas no se ponen de acuerdo porque cada uno dibuja la frontera del mercado por donde le conviene. Aun así, las cifras de 2025 dan una idea de la magnitud:</p>
<table>
<thead>
<tr>
<th>Fuente</th>
<th>Tamaño 2025 (USD)</th>
<th>Futuro</th>
<th>CAGR</th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Mordor Intelligence</strong></td>
<td>13,70&nbsp;B</td>
<td>37,64&nbsp;B (2031)</td>
<td>18,34&nbsp;%</td>
</tr>
<tr>
<td><strong>Fortune Business Insights</strong></td>
<td>23,2&nbsp;B</td>
<td>74,22&nbsp;B (2034)</td>
<td>13,8&nbsp;%</td>
</tr>
<tr>
<td><strong>Future Market Insights</strong></td>
<td>22,9&nbsp;B</td>
<td>81,9&nbsp;B (2035)</td>
<td>13,6&nbsp;%</td>
</tr>
<tr>
<td><strong>Market Research Future</strong></td>
<td>30,1&nbsp;B</td>
<td>97,73&nbsp;B (2035)</td>
<td>11,3&nbsp;%</td>
</tr>
<tr>
<td><strong>Straits Research</strong></td>
<td>~26&nbsp;B</td>
<td>59,51&nbsp;B (2033)</td>
<td>12,3&nbsp;%</td>
</tr>
<tr>
<td><strong>USDAnalytics</strong></td>
<td>40,1&nbsp;B</td>
<td>339,8&nbsp;B (2034)</td>
<td>26,8&nbsp;%</td>
</tr>
</tbody>
</table>
<p>El dato que sí merece subrayado: el segmento de <strong>chatbots inteligentes y virtual agents crece al 21,88&nbsp;% CAGR</strong> (Mordor), mucho más rápido que document management. El despliegue cloud copa el 62,18&nbsp;%. La selva se reorganiza rápido.</p>
<p>Y otro dato de <a href="https://menlovc.com/2025-the-state-of-ai-in-business/" target="_blank" rel="noopener">Menlo Ventures</a>: el gasto en infraestructura GenAI alcanzó 18&nbsp;B USD en 2025 (×2 vs. 2024). Dentro de las apps horizontales, los copilots dominan: <em>«Copilots dominate with 86&nbsp;% share ($7.2&nbsp;billion)»</em>. Las plataformas de agentes capturan otros 750&nbsp;M (Salesforce Agentforce, Writer, Glean).</p>
<h3>1.3 Gartner y Forrester: el momento en que los analistas se enteran</h3>
<ul>
<li><strong>Gartner</strong> declara que <em>no</em> publica un único Magic Quadrant para KM porque «no hay características comunes suficientes para que exista un solo mercado». KM aparece embebido en cuatro mercados adyacentes, y en nov 2025 lanza el <strong>Emerging Market Quadrant for Generative AI Knowledge Management Apps</strong>, donde <strong>Glean fue nombrado Emerging Leader</strong>.</li>
<li><strong>Forrester</strong> publicó por primera vez <a href="https://www.forrester.com/report/the-forrester-wave-tm-knowledge-management-solutions-q4-2024/RES181440" target="_blank" rel="noopener">The Forrester Wave<img src="https://s.w.org/images/core/emoji/17.0.2/72x72/2122.png" alt="™" class="wp-smiley" style="height: 1em; max-height: 1em;" />: Knowledge Management Solutions, Q4 2024</a> el 2 dic 2024 — la primera Wave KM dedicada de la historia. <strong>Leaders</strong>: Atlassian y KMS Lighthouse. <strong>Strong Performers</strong>: USU y SearchUnify.
<div class="callout">
<div class="label">Verbatim · Forrester, ene 2025</div>
<p>«Knowledge management is changing before our eyes. The past decade has seen little advancement in knowledge management (KM) solutions, practices, or standards… With the introduction of generative and conversational AI, knowledge management is returning.»</p>
</div>
</li>
</ul>
<h3>1.4 Taxonomía actual (2026)</h3>
<p>Cinco capas conviven, no se excluyen, y se solapan cada vez más: <strong>KMS tradicional</strong> (Confluence, SharePoint, Notion), <strong>Enterprise/Cognitive Search</strong> (Glean, Coveo, Elastic), <strong>AI-native Knowledge Platforms</strong> (Glean, Sana, Hebbia, Dust, Writer), <strong>Copilots embebidos</strong> (M365 Copilot, Google Gemini, Atlassian Rovo) e <strong>Infraestructura RAG/Vector/KG</strong> (Pinecone, Weaviate, Databricks Vector Search, Azure AI Search, Neo4j).</p>
<div class="callout">
<div class="label">Lectura analítica</div>
<p>Las capas 1 y 4 se están solapando peligrosamente. Si la mayoría del conocimiento ya vive en M365/Google/Atlassian, ¿para qué pagar Confluence + Glean + Notion AI + M365 Copilot a la vez? La respuesta de los CIOs en 2026 se bifurca: (a) Microsoft-centric (Copilot + SharePoint Advanced Management + Purview); o (b) multi-suite con Glean (o Sana/Dust) como overlay agnóstico. Las pymes tienden a (a); las grandes a (b).</p>
</div>
<h3>1.5 Consolidación: cuando los grandes empiezan a engullir</h3>
<ul>
<li><strong>ServiceNow → Moveworks</strong> (mar 2025, 2,85&nbsp;B USD): la jugada más cara hasta la fecha en KM/enterprise search.</li>
<li><strong>Databricks → Neon</strong> (may 2025, ~1&nbsp;B) y <strong>Snowflake → Crunchy Data</strong> (jun 2025, ~250&nbsp;M): Postgres serverless para cargas agénticas.</li>
<li><strong>Hebbia → FlashDocs</strong> (jun 2025): cerrar el «last mile» de generación de artefactos.</li>
<li><strong>Accenture → Keepler</strong> (2025): boutique data/AI española absorbida por Big&nbsp;4.</li>
</ul>
<p>La batalla por el knowledge worker se gana en el <strong>control plane</strong> (gobierno, identidad, agentes, datos), no en la UI de la wiki. Quien se queda con el sistema nervioso central, se queda con el cuerpo entero.</p>
<h2><span class="num">// 02</span>El impacto de la IA generativa en los KMS</h2>
<h3>2.1 De buscar, a preguntar, a actuar</h3>
<p>El <a href="https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai" target="_blank" rel="noopener">State of AI in 2025</a> de McKinsey (n=1.993) dice: <em>«88&nbsp;% of organizations use AI in at least one business function, up from 78&nbsp;% last year.»</em> Por primera vez, <strong>knowledge management aparece como una de las funciones con mayor uso reportado</strong> de AI. Pero solo el 5,5&nbsp;% de las empresas atribuyen &gt;5&nbsp;% de su EBIT al AI. La brecha es de <strong>rediseño de workflows</strong>, no de tecnología. Comprar la herramienta sin replantear cómo trabajas equivale a meter un pulmón nuevo en un cuerpo que sigue respirando por la nariz que tenía: no notas la diferencia.</p>
<figure class="figure">
<img decoding="async" src="https://pabloformoso.com/wp-content/uploads/2026/05/kms-triple-shift.jpg" alt="Comparativa antes/ahora del KMS en tres ejes: unidad, interacción y naturaleza." /><figcaption>El triple shift en el ADN del KMS</figcaption></figure>
<p>El cambio es triple: <strong>de documentos a respuestas</strong> (la unidad consumida deja de ser el PDF y pasa a ser un párrafo sintetizado con citas), <strong>de búsqueda a conversación a agente</strong> (el usuario formula intenciones; los agentes pueden ejecutar) y <strong>de estático a vivo</strong> (el conocimiento se construye en tiempo real desde Slack, meetings transcritos, CRM, código, tickets). Es la diferencia entre un fósil y un ser vivo.</p>
<h3>2.2 Arquitecturas emergentes de retrieval</h3>
<p><strong>RAG baseline (2023)</strong>: query → embedding → vector search → top-K → LLM. <strong>Hybrid + Reranking (2024)</strong>: añade BM25 keyword y cross-encoder reranker. <strong>GraphRAG</strong> (<a href="https://arxiv.org/abs/2404.16130" target="_blank" rel="noopener">Microsoft Research, feb 2024, open-source jul 2024</a>): construye un grafo de conocimiento desde texto y permite razonamiento jerárquico vía community summaries. Indexado costoso (hasta 33K USD para datasets grandes); LazyGraphRAG (nov 2024) reduce coste 10–90&nbsp;% difiriendo summaries al query time.</p>
<p><strong>Agentic RAG</strong> (<a href="https://arxiv.org/abs/2501.09136" target="_blank" rel="noopener">Singh et al., ene 2025</a>): supervisor agent + sub-agentes (SQL, doc, KG) + reflective retry + synthesizer con audit trail. VentureBeat VB Pulse Q1 2026: la adopción de hybrid retrieval pasa de 10,3&nbsp;% a 33,3&nbsp;% en un trimestre.</p>
<p><strong>Context Engineering / Knowledge Fabric (2026)</strong>: capa semántica continua que une datos estructurados + no estructurados + workflows + conversaciones. «El cuello de botella ya no es el modelo, es el contexto.»</p>
<h3>2.3 Los retos críticos</h3>
<ul>
<li><strong>Alucinaciones y trazabilidad</strong>: la respuesta debe venir con citaciones al chunk fuente. Quien no cite, miente con seguridad.</li>
<li><strong>Permission-aware retrieval</strong>: el RAG ingenuo destruye los permisos heredados. Microsoft tuvo que sacar SAM, Purview DLP for Copilot, DSPM y consolidarlo en el <strong>Copilot Control System</strong>. La vuln «Echoleak» (principios 2025) demostró exfiltración silenciosa vía Copilot. Si das de comer todo a un agente, también le das tus secretos.</li>
<li><strong>Knowledge decay</strong>: la documentación caduca. Los KMS modernos incorporan content pruning automatizado (18–26&nbsp;% anual). Igual que un bosque sano necesita su ciclo de hojarasca, una base de conocimiento sana necesita morir un poco cada año.</li>
<li><strong>Coste</strong>: GraphRAG indexing hasta 33K USD; el consumption pricing en Glean Protect Plus genera «CFO conversations» en renovación.</li>
<li><strong>EU AI Act</strong>: mayoría en <em>limited risk</em> (transparencia). Si influye en decisiones de empleo/crédito/servicios públicos, escala a <strong>high-risk</strong>. El Omnibus de 7 may 2026 postpuso el deadline Annex III al <strong>2 dic 2027</strong>. GPAI ya en vigor desde ago 2025.</li>
</ul>
<h3>2.4 Knowledge Fabric: el tejido conectivo del organismo</h3>
<p>Tres frames convergen: <strong>Data Fabric</strong> (Talend, Informatica, Atlan), <strong>Knowledge Graph + LLM</strong> (Neo4j, Stardog, Ontotext) y <strong>Knowledge Fabric</strong> (Teradata, Glean Enterprise Graph, Atlassian Teamwork Graph). Es lo que da contexto a los agentes.</p>
<div class="callout">
<div class="label">Tesis</div>
<p>En 3 años, el Knowledge Fabric desplazará al data lake como el activo arquitectónico más discutido en los comités de inversión IT. Si el data lake era el hígado (almacén metabólico), el Knowledge Fabric es el sistema nervioso central.</p>
</div>
<h3>2.5 Copilots embebidos: ¿comoditización o nueva complejidad?</h3>
<p>M365 Copilot Business a 21 USD/user/mes para SMB &lt;300 empleados desde dic 2025 vuelve commodity el search corporativo dentro del estuario M365. Pero genera nueva complejidad: <strong>sobre-permisado</strong>, <strong>proliferación de copilots</strong> (Sales, Service, Finance, Agent Builder, Copilot Studio) y <strong>Shadow AI</strong>: Harmonic Security identificó <strong>665 herramientas GenAI distintas</strong> en empresas tras analizar 22,4&nbsp;M de prompts; solo el 37&nbsp;% de orgs tiene políticas formales (<a href="https://www.ibm.com/reports/data-breach" target="_blank" rel="noopener">IBM 2025</a>). Microsoft responde con <strong>Agent 365</strong> (GA 2026).</p>
<h3>2.6 Métricas y ROI</h3>
<div class="grid">
<div class="c"><span class="n">30–45&nbsp;%</span></p>
<div class="l">Time-to-answer</div>
<div class="d">Reducción en deployments KMS con AI search.</div>
</div>
<div class="c"><span class="n">+28&nbsp;%</span></p>
<div class="l">First-contact resolution</div>
<div class="d">Integración de KB con servicio (livePro 2025).</div>
</div>
<div class="c"><span class="n">32&nbsp;%</span></p>
<div class="l">Onboarding speed</div>
<div class="d">Reducción del time-to-productivity.</div>
</div>
<div class="c"><span class="n">+100&nbsp;M</span></p>
<div class="l">Agent actions/año (Glean)</div>
<div class="d">Métrica de uso en plataforma agéntica enterprise.</div>
</div>
<div class="c"><span class="n">5,5&nbsp;%</span></p>
<div class="l">High performers (McKinsey)</div>
<div class="d">Orgs que atribuyen &gt;5&nbsp;% EBIT al uso de AI.</div>
</div>
<div class="c"><span class="n">665</span></p>
<div class="l">Herramientas GenAI distintas</div>
<div class="d">Detectadas por Harmonic en empresas.</div>
</div>
</div>
<p>La mayoría de orgs todavía mide vanity metrics. Los high performers redefinen el work design alrededor del AI. Eso es lo que correlaciona con EBIT real.</p>
<h2><span class="num">// 03</span>El futuro de los KMS en distintos contextos</h2>
<h3>3.1 Grandes corporaciones</h3>
<p>Escala y heterogeneidad (múltiples ERPs, suites, M&amp;A acumulado → silos crónicos). Coexistencia con plataformas de datos: Databricks (Mosaic AI, Agent Bricks, Lakebase, Unity Catalog) y Snowflake (Cortex AISQL, Cortex Search, Snowflake Intelligence) se convierten en <strong>knowledge backbone</strong>, no solo data backbone. Multi-jurisdicción y compliance (GDPR + AI Act + DORA, NIS2, MDR, HIPAA). Riesgo de proliferación de copilots: ya hay orgs con 5–10 copilots no coordinados.</p>
<div class="callout">
<div class="label">Predicción 3 años — Gran corporación</div>
<p>El stack ganador combinará: (1) control plane multi-vendor (Agent 365 + Purview); (2) Knowledge Fabric con grafos + vectores sobre Databricks/Snowflake; (3) capas de agentes verticales por función; (4) un KMS de autoría/curación reducido (Confluence o Notion siguen para «single source of truth» pero ya no son la UI principal de consumo).</p>
</div>
<h3>3.2 Pymes</h3>
<p>Acceso a capacidades enterprise vía SaaS plug-and-play: Notion AI (10 USD/user), M365 Copilot Business (21 USD/user SMB), Guru AI, Glean for SMB. Barreras: datos no estructurados y desordenados, ausencia de «knowledge manager», recursos para curación limitados. Oportunidad de <em>knowledge concierge</em>: consultora externa como guardián del knowledge.</p>
<div class="callout">
<div class="label">Predicción 3 años — Pymes</div>
<p>Las pymes que llegaron tarde a la digitalización pueden saltarse la generación G2 (wikis) y montarse directamente sobre G4 (AI-native). Es el viejo truco evolutivo del salto adaptativo: cuando llegas tarde, te ahorras una era entera.</p>
</div>
<h3>3.3 Organizaciones planas, startups, orgs ágiles</h3>
<p>El KMS tradicional ha tenido siempre baja adopción aquí: las wikis se llenan, se abandonan y se relanzan. Mucho del know-how vive en Slack, calls y Loom recordings. Los <strong>AI notetakers</strong> son la nueva infraestructura: Granola cerró el <strong>25 mar 2026 una Series&nbsp;C de 125&nbsp;M USD liderada por Danny Rimer (Index Ventures) y Mamoon Hamid (Kleiner Perkins), elevando la valoración a 1,5&nbsp;B USD</strong> — sixfold increase en menos de un año. Embeddings de Slack/Teams/Discord (Glean, Coveo, Dust, Sana) convierten la conversación pasada en knowledge searchable.</p>
<div class="callout">
<div class="label">Predicción 3 años — Orgs ágiles</div>
<p>Desaparece el «search corporativo» como interfaz: todo va por chat ambient (Slack + AI assistant) y por «agent boss» (gestionar agentes especializados como becarios virtuales). El documento como artefacto pierde valor; lo que importa es la grabación + el agente que extrae la decisión + el ticket creado automáticamente. Y aquí viene la nota distópica: cuando todo lo que dices puede ser escuchado, transcrito, embebido y consultado por un agente, ¿cuándo dejas de hablar para tu equipo y empiezas a hablar para tu propio expediente?</p>
</div>
<h3>3.4 Predicciones cruzadas a 3–5 años</h3>
<ol>
<li><strong>Search como interfaz primaria desaparece</strong> en favor de chat conversacional y agentes proactivos.</li>
<li><strong>Convergencia KMS + Agent platform + iPaaS</strong>: los KMS dejan de ser repositorios y se vuelven plataformas de orquestación.</li>
<li><strong>Agent-readable knowledge</strong>: documentos diseñados para ser consumidos por LLMs (estructurados, citables, versionados con embeddings de calidad).</li>
<li><strong>Roles nuevos</strong>: Knowledge Architect, Context Engineer, Agent Operator, Prompt Engineer. El Knowledge Manager clásico se transforma en «knowledge operations».</li>
<li><strong>Anti-tendencia: resurgimiento del knowledge engineering humano.</strong> Cuanto mejor el agente, más valor tienen las bases curadas a mano y los knowledge graphs construidos por humanos expertos. Hebbia ya contrata ex-bankers y ex-lawyers como forward-deployed engineers.</li>
<li><strong>Bifurcación del documento</strong>: artefactos legales/regulatorios siguen doc-centric con firma y versión; «conversaciones congeladas» reemplazan a los wikis blandos.</li>
</ol>
<h2><span class="num">// 04</span>Posicionamiento estratégico</h2>
<div class="placeholder">
<p><strong>Espacio reservado.</strong> Aquí iba un análisis de posicionamiento de servicios de consultoría que de momento dejamos en barbecho. Lo retomaremos en una entrega futura cuando quiera abrir esa parte del melón. Si has llegado hasta aquí buscando la parte «comercial», siento la trampa: el resto del post es donde está la chicha.</p>
</div>
<h2><span class="num">// 05</span>Conclusiones</h2>
<p>Los KMS están entrando en su <strong>cuarta generación</strong> y, por primera vez en la historia del sector, el cambio no es incremental sino arquitectónico: la IA generativa convierte el documento en respuesta, el repositorio en knowledge fabric vivo, y al knowledge worker en <em>«agent boss»</em>. La consecuencia comercial es una disputa por el <strong>control plane</strong> entre tres bandos: hyperscalers de productividad (Microsoft, Google, Atlassian), AI-native challengers (Glean, Sana, Dust, Hebbia, Writer) y data platforms (Databricks, Snowflake, ServiceNow).</p>
<p>Y por debajo de todo eso, una pregunta que me lleva ya unos meses dándome vueltas: cuando el sistema nervioso de la empresa pase a ser una capa de agentes que sintetizan, recuerdan y deciden por nosotros, ¿qué le pasa al músculo cognitivo de las personas que trabajan ahí dentro? Igual que un astronauta pierde masa ósea en gravedad cero, un knowledge worker rodeado de respuestas pre-sintetizadas puede perder pensamiento estructurado en pocos años. No es ciencia ficción; es la versión laboral del mismo principio biomecánico.</p>
<h2><span class="num">// 06</span>Open questions y caveats</h2>
<ul>
<li><strong>¿Microsoft Agent 365 + CCS se vuelve el de facto control plane, expulsando a Glean del enterprise?</strong> Indicador: ARR de Glean en los próximos 4 trimestres.</li>
<li><strong>¿GraphRAG vs. Agentic RAG vs. long-context puro se estabilizan o seguimos en churn arquitectónico?</strong> Una decisión tomada hoy puede caducar en 18 meses.</li>
<li><strong>¿La UE adopta más Omnibus AI Act y se relaja la presión de compliance?</strong> Si sí, el viento de cola compliance se debilita.</li>
<li><strong>¿Pricing dominante en 2027 — seat, consumption u outcome-based?</strong> Crítico para diseñar contratos.</li>
<li><strong>¿Se materializa el anti-trend del knowledge engineering humano?</strong> Si sí, abre una línea de servicio premium (knowledge curators-as-a-service).</li>
<li><strong>¿Qué pasa con los datos de meetings transcritos en la UE?</strong> Otter, Granola, Fireflies abren un frente de «ambient surveillance» que los reguladores no han abordado. Aquí la distopía empieza a oler a real.</li>
</ul>
<p style="color:var(--text3);font-size:13px;margin-top:36px;border-top:1px solid var(--border);padding-top:16px"><em>Caveats: el sizing varía hasta 10× entre analistas; las cifras del Forrester Wave KM Q4 2024 están confirmadas para Atlassian (Leader), KMS Lighthouse (Leader, «Top 3»), USU y SearchUnify (Strong Performers). Las predicciones a 3–5 años son inherentemente especulativas. Las menciones a roadmap producto (Agent 365 GA 2026, etc.) deben revalidarse trimestralmente.</em></p>
</div>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/kms-ia-generativa/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">115</post-id>	</item>
		<item>
		<title>Plataformas de datos modernas y transición en grandes corporaciones</title>
		<link>https://pabloformoso.com/plataformas-de-datos-modernas-y-transicion-en-grandes-corporaciones/</link>
					<comments>https://pabloformoso.com/plataformas-de-datos-modernas-y-transicion-en-grandes-corporaciones/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Thu, 04 Jun 2026 13:41:02 +0000</pubDate>
				<category><![CDATA[Uncategorized]]></category>
		<guid isPermaLink="false">http://pabloformoso.com/?p=22</guid>

					<description><![CDATA[Las grandes corporaciones se parecen a árboles centenarios: imponentes, con raíces profundas y poca capacidad de adaptación cuando el clima cambia de golpe. Y el clima de los datos ha cambiado. Repasamos qué son las plataformas de datos modernas y cómo afrontar la transición sin dejar de caminar.]]></description>
										<content:encoded><![CDATA[<p><img decoding="async" src="https://pabloformoso.com/wp-content/uploads/2024/05/f4e2afefd5855ba53a175fcc108bb887.png" alt="Plataformas de datos modernas y transición en grandes corporaciones" /></p>
<p>Las grandes corporaciones se parecen mucho a esos árboles centenarios que ves en mitad de un bosque: imponentes, con raíces profundas… y con una capacidad de adaptación limitada cuando el clima cambia de golpe. Y el clima de los datos ha cambiado de golpe. En este post repasamos qué son las plataformas de datos modernas, por qué la transición hacia ellas es ya una cuestión de supervivencia, y qué papel juegan piezas como Databricks o los servicios de datos de Microsoft Azure (Azure Data Factory, por ejemplo).</p>
<h2>¿Qué entendemos por plataforma de datos moderna?</h2>
<p>Una plataforma de datos moderna está diseñada para digerir el volumen brutal de datos que genera cualquier negocio hoy. Si el dato es el alimento, la plataforma es el aparato digestivo completo: ingesta, procesa, almacena y convierte todo eso en energía útil (insights). Sus características clave:</p>
<ul>
<li><strong>Escalabilidad:</strong> capacidad de crecer con el volumen de datos sin que el rendimiento se resienta.</li>
<li><strong>Flexibilidad:</strong> soporte para tipos de datos diversos e integración con múltiples fuentes.</li>
<li><strong>Analítica avanzada:</strong> herramientas de machine learning, inteligencia artificial y analítica en tiempo real.</li>
<li><strong>Seguridad:</strong> medidas robustas para proteger datos sensibles y cumplir con la regulación.</li>
</ul>
<h3>Databricks: un ejemplo de referencia</h3>
<p>Databricks es una plataforma unificada de analítica de datos que ha ganado una tracción enorme entre grandes corporaciones. Combina la potencia de Apache Spark con un espacio de trabajo colaborativo donde ingenieros de datos, científicos de datos y analistas de negocio trabajan sobre el mismo terreno. Sus puntos fuertes:</p>
<ul>
<li><strong>Analítica unificada:</strong> ingeniería de datos, ciencia de datos y analítica de negocio en una sola plataforma.</li>
<li><strong>Escalabilidad:</strong> recursos de cómputo que crecen o se reducen según la demanda.</li>
<li><strong>Colaboración:</strong> workspaces y notebooks compartidos para desarrollar y analizar en equipo.</li>
<li><strong>Machine learning:</strong> soporte integrado para flujos de ML y despliegue de modelos.</li>
</ul>
<h2>La transición: cómo cambiar de esqueleto sin dejar de caminar</h2>
<p>Migrar a una plataforma de datos moderna en una gran corporación es como una metamorfosis: el organismo tiene que seguir funcionando mientras se transforma por dentro. No puedes parar el negocio para cambiar la columna vertebral. Por eso la transición exige planificación quirúrgica.</p>
<h3>Evaluación y planificación</h3>
<p>Antes de mover una sola pieza, toca radiografía completa:</p>
<ul>
<li>Evaluar las fuentes de datos y soluciones de almacenamiento existentes.</li>
<li>Identificar los requisitos y objetivos clave del negocio.</li>
<li>Desarrollar un plan de transición con hitos y plazos claros.</li>
</ul>
<h3>Migración de datos</h3>
<p>La fase más delicada: trasladar los datos desde los sistemas legacy a la nueva plataforma garantizando su integridad y minimizando el tiempo de parada. Consideraciones clave:</p>
<ul>
<li>Elegir las herramientas y técnicas de migración adecuadas.</li>
<li>Asegurar la calidad y consistencia de los datos durante todo el proceso.</li>
<li>Implementar medidas sólidas de gobierno del dato y seguridad.</li>
</ul>
<h3>Adopción y formación</h3>
<p>Una plataforma nueva sin personas que sepan usarla es un músculo sin nervio que lo active. La adopción requiere:</p>
<ul>
<li>Formación y recursos para ingenieros, científicos de datos y analistas.</li>
<li>Fomentar una cultura de decisiones basadas en datos.</li>
<li>Soporte continuo y acompañamiento tras el despliegue.</li>
</ul>
<h2>Caso práctico: los servicios de datos de Microsoft Azure</h2>
<p>Microsoft Azure ofrece un conjunto de servicios que ejemplifican bien lo que puede dar de sí una plataforma moderna. <strong>Azure Data Factory</strong>, por ejemplo, es un servicio de integración de datos en la nube que permite crear, programar y orquestar flujos de datos. Sus características principales:</p>
<ul>
<li><strong>Integración de datos:</strong> conexión fluida con fuentes diversas, tanto on-premise como cloud.</li>
<li><strong>Escalabilidad:</strong> capacidad para procesar y transformar datos a gran escala.</li>
<li><strong>Automatización:</strong> flujos de datos automatizados y programados para una gestión eficiente.</li>
<li><strong>Seguridad:</strong> funciones completas de protección de datos sensibles.</li>
</ul>
<h2>Conclusión</h2>
<p>La transición a plataformas de datos modernas ya no es opcional para las grandes corporaciones: es el equivalente evolutivo de adaptarse o quedarse como fósil de museo. Plataformas como Databricks o los servicios de datos de Azure ofrecen soluciones robustas para integrar, procesar y analizar datos. Con una transición bien planificada, datos íntegros y equipos formados, una organización puede desbloquear todo el potencial de su información. Y en un futuro donde quien controla el dato controla el ecosistema, llegar tarde a esta mudanza puede salir muy caro.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/plataformas-de-datos-modernas-y-transicion-en-grandes-corporaciones/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">22</post-id>	</item>
		<item>
		<title>ApolloAgents: cómo se construye un DJ artificial agente a agente</title>
		<link>https://pabloformoso.com/apolloagents-como-se-construye-un-dj-artificial-agente-a-agente/</link>
					<comments>https://pabloformoso.com/apolloagents-como-se-construye-un-dj-artificial-agente-a-agente/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Fri, 22 May 2026 18:03:35 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Claude Code]]></category>
		<category><![CDATA[Engineering]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[Inteligencia Hibrida]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=107</guid>

					<description><![CDATA[Empecé queriendo una sesión de lofi para estudiar y acabé con seis agentes mitológicos discutiendo entre sí cómo encadenar tracks. Este es el recorrido de ApolloAgents desde el primer script de febrero hasta la versión 3.1 que pincha en directo dentro del navegador.]]></description>
										<content:encoded><![CDATA[<h2>El picor que lo arrancó todo</h2>
<p>A finales de febrero de 2026 hice algo trivial: un script que cogía cuatro WAVs de lofi, los empalmaba con un <em>crossfade</em> de pydub y los exportaba a MP4 con una onda de fondo. El primer commit del repositorio se llama, literalmente, <strong><code>yup</code></strong>. No tenía agentes, no tenía catálogo, no tenía nada. Era una sesión de estudio para mí.</p>
<p>Pero el experimento dejó dos cosas claras y muy desagradables.</p>
<p>La primera: encadenar dos canciones bien no es una macro. Si pegas dos pistas en compases distintos, con tonalidades incompatibles o con BPM dispares, no obtienes &quot;una mezcla&quot;. Obtienes un choque. Un <em>crossfade</em> lineal aplicado a dos señales a 0 dBFS suma +6 dBFS — fuera de rango — y produce <strong>distorsión digital</strong>. Sin un <em>pre-mix gain</em> de −3 dB y monitoreo de pico, el archivo final clipa.</p>
<p>La segunda: las decisiones musicales no caben en un prompt único. &quot;Hazme una sesión de techno oscuro&quot; parece una instrucción atómica, pero por dentro son cinco preguntas distintas: ¿qué <em>tracks</em> del catálogo encajan?, ¿en qué orden harmónico?, ¿hay un arco de energía o todo plano?, ¿qué transiciones van a sonar mal?, ¿está limpia la mezcla final? Un LLM general responde a las cinco a la vez y a ninguna en serio. Suena plausible y musicalmente es plano.</p>
<p>De ese picor — <em>quiero mezclas que no choquen, y no me las hace un solo agente</em> — sale todo lo demás.</p>
<h2>v0.x: el primer pipeline (marzo)</h2>
<p>El 15 y 16 de marzo aparecen dos <em>commits</em> que cambian la forma del proyecto: <code>Initial public release — deep session generator</code> y <code>Add smart session generation with unified track catalog</code>. La idea era simple pero ya no trivial: separar los WAVs por carpeta de género, calcular <strong>BPM con librosa</strong> y <strong>tonalidad en notación Camelot</strong> una sola vez por archivo, y guardarlo todo en un <code>tracks.json</code> que sirviera de fuente única de verdad.</p>
<p>A partir de ese catálogo, una función de selección clusteriza por tempo y hace un <em>random walk</em> harmónico sobre la rueda Camelot. Lo elegante de la rueda Camelot — desarrollada por Mark Davis en 2004 — es que reduce toda la teoría de armonía a un grafo de vecinos:</p>
<pre><code class="language-python">def _camelot_neighbors(key: str) -&gt; set[str]:
    num = int(key[:-1])
    letter = key[-1].upper()
    opposite = "B" if letter == "A" else "A"
    return {
        key,
        f"{(num % 12) + 1}{letter}",       # +1 horario
        f"{((num - 2) % 12) + 1}{letter}", # -1 antihorario
        f"{num}{opposite}",                 # llave paralela
    }</code></pre>
<p>Dos <em>tracks</em> son compatibles si están al mismo número, a una posición horaria o en su paralela mayor/menor. Eso es todo. El ordenador hace en milisegundos lo que un DJ humano resuelve por intuición acumulada.</p>
<p>Con eso ya tenía sesiones que sonaban &quot;bien&quot; — pero la decisión de qué tracks proponer, en qué orden y para qué <em>mood</em> seguía siendo monolítica. La cosa pedía romperse.</p>
<h2>v1.0: el panteón empieza a hablar (abril)</h2>
<p>El 7 de abril nace <strong>ApolloAgents</strong> propiamente dicho. Con el lanzamiento llegan cuatro decisiones que aún sostienen todo el proyecto.</p>
<p><strong>Decisión 1 — agentes con rol acotado, no un super-LLM.</strong> La sesión se descompone en un <em>pipeline</em> de 8 fases, cada una a cargo de un agente con un <em>system prompt</em> específico, una lista cerrada de tools y un formato de salida estructurado. Cada uno lleva nombre mitológico. No por capricho estético — porque obliga a pensar en su rol antes que en su implementación:</p>
<table>
<thead>
<tr>
<th>Agente</th>
<th>Nombre</th>
<th>Función</th>
</tr>
</thead>
<tbody>
<tr>
<td>Genre Guard</td>
<td><strong>Janus</strong></td>
<td>Confirma género, duración y <em>mood</em> antes de planificar nada</td>
</tr>
<tr>
<td>Catalog Manager</td>
<td><strong>Hermes</strong></td>
<td>Sincroniza WAVs, detecta BPM y tonalidad</td>
</tr>
<tr>
<td>Planner</td>
<td><strong>Muse</strong></td>
<td>Propone el <em>playlist</em> y diseña el arco de energía</td>
</tr>
<tr>
<td>Critic</td>
<td><strong>Momus</strong></td>
<td>Revisión fría: <code>PROBLEMS</code> / <code>VERDICT</code></td>
</tr>
<tr>
<td>Editor</td>
<td><em>(REPL)</em></td>
<td>Permuta, mueve, inserta <em>bridges</em>, lanza el <em>build</em></td>
</tr>
<tr>
<td>Validator</td>
<td><strong>Themis</strong></td>
<td>Analiza la calidad del audio renderizado</td>
</tr>
<tr>
<td>Orchestrator</td>
<td><strong>Apollo</strong></td>
<td>Conduce la secuencia y guarda la memoria</td>
</tr>
</tbody>
</table>
<p>Apollo no es un nombre decorativo: es el director del coro. Como en el panteón griego, cada deidad tiene un trozo del mundo. Janus mira en dos direcciones — la del usuario y la del catálogo — antes de dejar pasar nada.</p>
<figure style="text-align:center;margin:2em 0;">
  <img decoding="async" src="https://pabloformoso.com/wp-content/uploads/2026/05/architecture_infographic-scaled.png" alt="Infografía vertical resumiendo la arquitectura multi-agente de ApolloAgents: seis agentes con rol acotado (Janus, Hermes, Muse, Momus, Themis, Editor), la rueda Camelot, el problema del clipping en crossfades y la memoria persistente." style="max-width:720px;width:100%;height:auto;" /><figcaption style="font-size:0.9em;color:#666;margin-top:0.5em;"><em>La arquitectura de ApolloAgents resumida: seis agentes con rol acotado, la rueda Camelot como grafo de compatibilidad armónica, la mitigación del clipping en crossfades y la memoria persistente que aprende de tu feedback.</em></figcaption></figure>
<p><strong>Decisión 2 — protocolos de texto estructurado, no JSON.</strong> Pedirle a un LLM que produzca JSON entre agentes es frágil: el modelo se inventa comas, mete prosa antes del bloque, escapa mal las comillas. ApolloAgents usa bloques de texto con palabras clave centinela. Janus contesta así:</p>
<pre><code>CONFIRMED
genre: techno
duration_min: 60
mood: dark industrial build to a hard peak</code></pre>
<p>Y Momus así:</p>
<pre><code>PROBLEMS:
- [pos 2→3] key clash 5A → 11A — fix: swap pos 3 for a 6A track
- [pos 7→8] BPM jump 132 → 148 — fix: insert bridge track

VERDICT: NEEDS_FIXES</code></pre>
<p>El parser es una iteración línea a línea de unas pocas decenas de líneas de Python. Si el modelo añade prosa, no rompe. Si se sale de formato, hay <em>fallbacks</em>. Es feo en lo teórico y robustísimo en la práctica.</p>
<p><strong>Decisión 3 — dos <em>checkpoints</em> humanos dentro del <em>pipeline</em>, no al final.</strong> La automatización completa era tentadora pero equivocada. El <em>checkpoint 1</em> va después del Planner y antes del Critic. El <em>checkpoint 2</em>, después del Critic. ¿Por qué dos y no uno? Porque las preguntas son distintas: en el primero estás dando forma al arco de energía; en el segundo, decidiendo qué problemas concretos te merece la pena arreglar y cuáles asumir. Mezclar las dos conversaciones añade carga cognitiva y empeora ambas decisiones. <strong>Los checkpoints son <em>hard gates</em>: ningún agente aplica un fix sin tu visto bueno explícito.</strong></p>
<p><strong>Decisión 4 — un solo <code>main.py</code> de ~2.600 líneas.</strong> Esto sigue siendo polémico y lo sigo defendiendo. Para un proyecto de este alcance, un único fichero inspeccionable con secciones bien marcadas es más mantenible que una jerarquía de módulos por la que hay que saltar para entender un cambio de tres líneas. La capa de agentes (<code>agent/</code>) sí va separada — porque su ciclo de iteración (prompts, signaturas de tools, esquema de memoria) es de naturaleza diferente al del <em>pipeline</em> DSP.</p>
<h2>v1.1–v1.3: pulir el sonido, no las capas (abril)</h2>
<p>A finales de abril el sistema funcionaba pero seguía haciendo dos cosas mal. Cada cosa generó un mini-ciclo de mejoras.</p>
<p><strong>Las duraciones eran estimaciones.</strong> El Planner calculaba la longitud de la sesión asumiendo 5 minutos por <em>track</em>. Para una sesión de 60 min pedía 12 <em>tracks</em> y la realidad podía salir 50 o 75. Solución en v1.1: leer <code>duration_sec</code> del header WAV una vez al construir el catálogo, almacenarlo en <code>tracks.json</code> y usarlo para todos los cálculos posteriores. Coste: cero decode. Beneficio: la duración prometida y la entregada se acercan.</p>
<p><strong>La detección de BPM mentía en lofi.</strong> Librosa tendía a detectar todo el lofi a 110 BPM por culpa del clásico problema del octavado (tomar el <em>off-beat</em> por el <em>beat</em> y duplicar el tempo). La v1.1.1 corrige <code>detect_bpm()</code> para sesgar <code>start_bpm</code> al punto medio del género y probar <code>bpm/2</code> y <code>bpm*2</code> <em>antes</em> de hacer el clamp. Resultado: el lofi ahora se detecta a 70–85 BPM, que es lo que tiene que ser.</p>
<p><strong>Los <em>crossfades</em> extremos sonaban a moledora.</strong> Pyrubberband empieza a producir artefactos audibles a partir de ratios de 1.5×. Antes, si el Planner ponía un <em>track</em> de 90 BPM seguido de uno de 140, el sistema lo intentaba estirar y el resultado parecía un cassette estropeado. La v1.3 introdujo tres mecanismos:</p>
<ul>
<li><strong><code>_STRETCH_MAX = 1.5</code></strong> — bound duro de seguridad. Cualquier transición que requiera más se marca como problema obligatorio.</li>
<li><strong><code>suggest_bridge_track(from_pos, to_pos)</code></strong> — busca en el catálogo un <em>track</em> con BPM intermedio, lo puntúa por <code>min(ratio_a, 1/ratio_a) × min(ratio_b, 1/ratio_b)</code> y devuelve los 3 mejores candidatos.</li>
<li><strong><code>insert_bridge_track(after_position, track_id)</code></strong> — inserta el <em>bridge</em> elegido, partiendo una transición imposible en dos transiciones individualmente seguras.</li>
</ul>
<p>Y un cuarto detalle que cambia la sensación más de lo que parece: <strong>EQ matching en el crossfade</strong>. Cuando la distancia harmónica entre dos <em>tracks</em> es &gt; 2 pasos Camelot, se aplica un <em>high-shelf cut</em> de −3 dB a 8 kHz en el saliente y un <em>low-shelf cut</em> de −3 dB a 250 Hz en el entrante, <em>solo durante el solape</em>. Eso reduce el enmascaramiento frecuencial sin tocar el audio fuera de la transición. Es el tipo de truco que un ingeniero de mezcla aplica de oído y que, formulado, es media docena de líneas.</p>
<h2>v1.4–v1.5: del <em>batch</em> al directo (abril)</h2>
<p>A mitad de abril el agente sabía construir sesiones pero no sabía <em>escucharlas</em>. Se podía rendear un MP4 de 60 minutos sin tener forma de previsualizar una transición antes de comprometer al <em>render</em> completo. v1.4 mete tres tools que cambian el ritmo del <em>workflow</em>: <code>play_mix</code>, <code>preview_transition</code> y <code>play_track</code>. De repente puedes auditar dos <em>tracks</em> solapados ±15s antes de decidir si están bien encadenados, sin esperar 40 minutos de render.</p>
<p>Pero la conclusión real de ese movimiento llegó dos días después, en v1.5: si puedes reproducir, puedes pinchar <strong>en vivo</strong>.</p>
<p><strong>LiveDJ</strong> es un agente proactivo con su propio motor de audio. Mientras suena una pista, otro hilo está estirando temporalmente la siguiente con pyrubberband en <em>background</em>, de modo que cuando llega el momento del <em>crossfade</em> la siguiente pista ya está en memoria al BPM correcto. El motor corre cuatro hilos:</p>
<table>
<thead>
<tr>
<th>Hilo</th>
<th>Cadencia</th>
<th>Responsabilidad</th>
</tr>
</thead>
<tbody>
<tr>
<td>Callback de <code>sounddevice</code></td>
<td>Por bloque (2048 samples)</td>
<td>Salida de audio en baja latencia; mezcla del <em>crossfade</em></td>
</tr>
<tr>
<td>Watchdog</td>
<td>50 ms</td>
<td>Detecta el cruce del umbral y emite eventos</td>
</tr>
<tr>
<td>Pre-stretch daemon</td>
<td>Continuo</td>
<td>Estira la siguiente pista con pyrubberband</td>
</tr>
<tr>
<td>Event loop principal</td>
<td>100 ms</td>
<td>Drena eventos y los pasa al agente LiveDJ</td>
</tr>
</tbody>
</table>
<p>El <em>watchdog</em> corre al doble de frecuencia que el <em>event loop</em> del agente. Eso garantiza que ningún evento crítico (cruce de umbral, fin de pista) se pierda entre dos <em>polls</em> del LLM. Y el agente tiene un <strong>presupuesto duro de 5 turnos por <em>batch</em> de eventos</strong> — si lo agota sin llamar a una <em>tool</em> terminal, el motor cae al comportamiento automático. Sin ese tope, una situación ambigua podría arrastrar al agente a una cadena de razonamientos mientras la música sigue sonando.</p>
<p>La regla de decisión que aplica LiveDJ cuando se acerca un <em>crossfade</em> cabe en tres líneas:</p>
<table>
<thead>
<tr>
<th>Calidad de la transición</th>
<th>Acción</th>
</tr>
</thead>
<tbody>
<tr>
<td>Camelot ≤1 paso <strong>y</strong> ΔBPM ≤ 8</td>
<td>Silencio — déjalo pasar</td>
</tr>
<tr>
<td>Camelot 2 pasos <strong>o</strong> ΔBPM 8–20</td>
<td><code>extend_track(20)</code> — gana 20s para reevaluar</td>
</tr>
<tr>
<td>Camelot &gt; 2 pasos <strong>o</strong> ΔBPM &gt; 20</td>
<td><code>crossfade_now()</code> o <code>queue_swap()</code> por algo mejor</td>
</tr>
</tbody>
</table>
<p>Y mientras suena, tú puedes escribir cosas como <code>next</code>, <code>stay 60</code>, <code>more energetic</code> o <code>wind down</code>. Algunas (las literales) se ejecutan sin mediación del LLM, por latencia. Otras (las naturales) pasan por el agente para que traduzca a llamadas de <em>tool</em>.</p>
<h2>v2.0–v2.6: abrir la cabina (abril–mayo)</h2>
<p>Hasta v1.5 todo vivía en la terminal. v2.0 fue el primer salto fuerte: convertir cada fase del <em>pipeline</em> en endpoints de <strong>FastAPI</strong>, abrir un canal <strong>WebSocket</strong> para el <em>streaming</em> del agente, y montar un cliente <strong>Next.js + React 19</strong> con vista de <em>playlist</em> arrastrable y <em>sidebar</em> de Critic. El <code>print()</code> muere; sale el evento tipado.</p>
<p>De v2.1 a v2.5 vinieron capas finas pero cargadas de detalles:</p>
<ul>
<li><strong>v2.1</strong> — visuales reactivos al <em>beat</em> en el navegador, con eventos del LiveEngine puenteados al <em>frontend</em> como JSON tipado.</li>
<li><strong>v2.2</strong> — <em>playlists</em> nombrados con CRUD + <em>reorder</em> por <em>drag-and-drop</em>. Estandarización de puertos de desarrollo: <strong>4010</strong> <em>frontend</em>, <strong>4020</strong> <em>backend</em>.</li>
<li><strong>v2.3</strong> — <em>user_id</em> propagado por todo el <em>thread</em>, <em>ratings</em> por <em>track</em> y <em>favorites</em>, <em>bias</em> del Planner según las puntuaciones del propio usuario. Los agentes empiezan a tener oído por persona.</li>
<li><strong>v2.5</strong> — el LiveEngine cruza al navegador: tres modos (Audience, Booth, Immersive), capa visual sincronizada al <em>beat</em>, y modo improvisación con micro + peticiones del público.</li>
</ul>
<p>Y entonces, el 11 de mayo, <strong>v2.6.0 Ember</strong>. La escalera de 9 fases del <em>frontend</em> anterior se colapsa en cinco rutas planas con un vocabulario visual común — italic-serif, acento ember-rojo, una sola línea de mando:</p>
<pre><code>/dashboard   → la sesión de esta noche + el último póster impreso
/brief       → una frase entra, un brief estructurado sale
/curate      → arco, playlist, notas del crítico (apply / ignore en línea)
/editor      → reordenar, swap, insertar bridge tracks
/render      → backend ffmpeg → MP4 1080p con progreso por SSE
/live        → reproducción real, modos Audience / Booth / Immersive</code></pre>
<p>El <em>brief</em> lo parsea <strong>Claude Haiku</strong> en menos de 300 ms a <code>{genre, duration, mood, venue, energy, tempo}</code>. Si algo es ambiguo, Apollo pregunta en la misma pantalla y retoma cuando confirmas. Los <em>checkpoints</em> siguen existiendo, pero dejan de ser muros que cruzar fase a fase: ahora son anotaciones en el margen que aplicas con un click o ignoras.</p>
<h2>v2.7–v3.1: el último kilómetro (mayo)</h2>
<p>Las últimas semanas el proyecto se ha movido en el espacio entre &quot;esto funciona en mi máquina&quot; y &quot;esto funciona en directo delante de gente&quot;.</p>
<ul>
<li><strong>v2.7</strong> — ingesta de <strong>YouTube Live Chat</strong> como peticiones del público en directo. La audiencia escribe en YouTube, el motor lo lee y el agente decide si meterlo en la siguiente decisión.</li>
<li><strong>v2.7.2</strong> — feed de OBS, <em>waveform peaks</em> en el navegador, polling de YouTube más amable con la API.</li>
<li><strong>v2.7.3 / v2.7.4</strong> — reconexión robusta de WebSocket en vivo, disciplina del agente, observabilidad.</li>
<li><strong>v3.0</strong> — <em>precision beat matching</em> offline y <em>live</em> con paridad. Las transiciones se enganchan a <em>downbeats</em> reales (detectados con madmom) en lugar de aproximaciones.</li>
<li><strong>v3.0.1</strong> — un <code>critic_warning</code> cuando el <em>phase-lock</em> no encuentra el <em>downbeat</em> y cae al <em>linear fade</em>. Pequeño cambio, gran efecto en confianza: ahora sabes cuándo el sistema está improvisando.</li>
<li><strong>v3.1</strong> — <em>live beat matching</em> con paridad en el navegador via <code>playbackRate</code>. El tempo en el HTML5 audio del <em>frontend</em> coincide con el del motor offline. Lo que sale por el OBS suena igual que lo que sale por el render.</li>
</ul>
<p>Y un último detalle de la semana pasada que cambia la vida para quien viene nuevo al proyecto: un <strong>stack de Docker Compose</strong> con <em>hot reload</em> tanto para <em>backend</em> como para <em>frontend</em>. <code>docker compose up --build</code> y tienes todo corriendo, sin pelearte con <code>uv</code> ni con <code>npm</code>.</p>
<h2>Lo que aprendí construyendo esto</h2>
<p>Hay tres cosas que me llevo del recorrido, y que mantengo cuando empiezo proyectos nuevos.</p>
<p><strong>Los roles acotados ganan a los súper-agentes.</strong> Es tentador escribir un <em>system prompt</em> gigante y dejar que un único modelo &quot;lo haga todo&quot;. La experiencia con Apollo dice lo contrario: cuanto más estrecho es el rol — Janus solo valida, Momus solo critica, Themis solo analiza — más predecible y depurable es el resultado. La modularidad no es elegancia: es la única forma de saber en qué fase se rompió algo.</p>
<p><strong>El texto estructurado le come la tostada al JSON entre agentes.</strong> Pedirle a un LLM bloques con palabras centinela (<code>CONFIRMED</code>, <code>PROBLEMS</code>, <code>VERDICT</code>, <code>Status:</code>) y parsearlos línea a línea suena primitivo. Pero sobrevive a la prosa de más, a las comillas mal escapadas, a los modelos que cambian de proveedor. JSON parecía la respuesta correcta y, en producción, no lo era.</p>
<p><strong>Los humanos en <em>checkpoints</em> concretos, no como aprobación final.</strong> El valor del crítico no es enforzar el <em>fix</em>. Es señalar el problema. La decisión sobre qué arreglar — y qué asumir — es del usuario, y tiene que vivir <em>dentro</em> del <em>pipeline</em>, no después. Cuando moví los <em>checkpoints</em> de &quot;al final, una vez&quot; a &quot;después del Planner y después del Critic&quot;, la calidad de las sesiones subió de golpe.</p>
<hr />
<p>ApolloAgents es <strong>open source bajo MIT</strong>, está en <a href="https://github.com/pabloformoso/apollo-agents">github.com/pabloformoso/apollo-agents</a>, y todo lo que ves en <a href="https://www.youtube.com/watch?v=PdTd54Vl8Go">este canal de YouTube</a> ha sido generado por el sistema en alguna de sus versiones. Si lo pruebas — una <em>star</em> en el repo y, sobre todo, lo que encuentres roto en los <em>issues</em>, me harían el día.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/apolloagents-como-se-construye-un-dj-artificial-agente-a-agente/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">107</post-id>	</item>
		<item>
		<title>csk: un gestor de skills para Claude Code, hecho 100% con Claude Code</title>
		<link>https://pabloformoso.com/csk-un-gestor-de-skills-para-claude-code-hecho-100-con-claude-code/</link>
					<comments>https://pabloformoso.com/csk-un-gestor-de-skills-para-claude-code-hecho-100-con-claude-code/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Fri, 22 May 2026 14:36:19 +0000</pubDate>
				<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=98</guid>

					<description><![CDATA[Ayer publiqué csk, un gestor de skills para Claude Code. La parte recursiva: está hecho de principio a fin con Claude Code. Te cuento qué problema resuelve —skills personales sin esqueleto ni tejido conectivo— y cómo probarlo en cinco minutos.]]></description>
										<content:encoded><![CDATA[<h1>csk: un gestor de skills para Claude Code, hecho 100% con Claude Code</h1>
<p>Ayer publiqué la primera versión usable de un proyecto pequeño y un poco recursivo: <strong>csk</strong>, un gestor de <em>skills</em> para Claude Code. La parte recursiva es que no escribí ni una línea de código a mano. csk está hecho, de principio a fin, <em>con</em> Claude Code. Una herramienta para Claude Code, construida por Claude Code. Una serpiente mordiéndose la cola, pero una serpiente que compila.</p>
<p>Quiero contarte qué problema resuelve, porque seguramente lo tienes y no le has puesto nombre todavía, y dejarte el camino para probarlo en cinco minutos.</p>
<h2>El problema: skills sin esqueleto</h2>
<p>Si usas Claude Code, sabes que una <em>skill</em> es una carpeta con instrucciones que le enseña a hacer algo concreto: un flujo, un formato, una manía tuya. Claude Code tiene <a href="https://docs.claude.com/en/docs/claude-code/skills">dos formas de cargarlas</a>. Los <strong>plugins</strong> se distribuyen por un marketplace, se instalan con un comando y se actualizan solos. Y luego están las <strong>skills personales</strong>: carpetas sueltas en <code>~/.claude/skills/</code>.</p>
<p>Aquí está la grieta. Los plugins tienen una historia de distribución cuidada. Las skills personales no tienen <em>ninguna</em>. Si desarrollas una skill en su propio repositorio de git, el flujo es artesanal y un poco triste: clonar a mano, copiar o enlazar dentro de <code>~/.claude/skills/</code>, y acordarte —tú, con tu memoria de primate— de hacer <code>git pull</code> cada cierto tiempo. No hay manifiesto. No hay <em>lockfile</em>. No hay forma de declarar &quot;este es mi conjunto de skills&quot; y reproducirlo en otra máquina o pasárselo a un compañero.</p>
<p>Piénsalo en términos de biomecánica. Un plugin es una prótesis que viene con su servicio de ajuste: encaja, se calibra, se revisa. Una skill personal es una prótesis que llevas suelta en la mochila y te atas como puedes cada mañana. Funciona, sí. Pero no hay <em>tejido conectivo</em>: nada que sujete el conjunto, nada que garantice que el brazo de hoy es el mismo que el de ayer.</p>
<p>Y el efecto secundario es el peor de todos: la <strong>deriva</strong>. Trabajas en el portátil, en la torre de casa, en el de la oficina. Cada máquina acumula sus propias versiones, sus propios parches, sus propios olvidos. Al cabo de unos meses no tienes un entorno replicado tres veces: tienes tres subespecies distintas del mismo organismo, evolucionando por separado y en silencio. El día que una falla y otra no, no tienes ni idea de por qué.</p>
<h2>Qué es csk</h2>
<p>csk llena exactamente esa grieta. La idea es robarle el modelo mental a herramientas que ya funcionan: lo que <code>cargo</code> o <code>uv</code> son para las librerías, csk lo es para las skills. Tres piezas, y la metáfora se cae sola:</p>
<p><strong>El manifiesto (<code>skills.toml</code>)</strong> es el ADN. Tú lo editas. Declaras cada skill con una clave, una URL de git y, si quieres, una rama o un subdirectorio. Es la intención: &quot;este organismo debería tener estos órganos&quot;.</p>
<p><strong>El lockfile (<code>skills.lock</code>)</strong> es la expresión fijada de ese ADN. Lo escribe csk, no tú, y ancla cada skill a un <em>commit</em> exacto. Es la diferencia entre &quot;quiero un perro&quot; y &quot;quiero <em>este</em> perro, con este genoma, hasta el último par de bases&quot;.</p>
<p><strong><code>csk install</code></strong> es la clonación. En una máquina nueva, csk lee el lockfile y reconstruye el conjunto idéntico: mismas skills, mismos commits clavados. El mismo organismo, no un primo lejano.</p>
<p>Lo elegante es que csk no toca Claude Code para nada. Escribe en las mismas rutas de <code>~/.claude/skills/</code> que Claude ya lee. Claude Code no necesita enterarse de que csk existe. Cero acoplamiento.</p>
<h2>Pruébalo en cinco minutos</h2>
<p>csk es un único binario estático, escrito en Go. En macOS o Linux se instala así (en el <a href="https://github.com/pformoso-deus-ai/csk">README</a> tienes la versión para Windows con PowerShell):</p>
<pre><code class="language-bash">mkdir -p ~/.local/bin
OS=$(uname -s | tr '[:upper:]' '[:lower:]')
ARCH=$(uname -m); case "$ARCH" in x86_64|amd64) ARCH=x86_64;; aarch64|arm64) ARCH=arm64;; esac
VERSION=$(curl -sI https://github.com/pformoso-deus-ai/csk/releases/latest | awk -F/ '/^location:/ {print $NF}' | tr -d '[:cntrl:]')
curl -fsSL "https://github.com/pformoso-deus-ai/csk/releases/download/${VERSION}/csk_${VERSION#v}_${OS}_${ARCH}.tar.gz" | tar xz -C ~/.local/bin csk
chmod +x ~/.local/bin/csk</code></pre>
<p>A partir de ahí, el flujo del día a día:</p>
<pre><code class="language-bash">csk init                 # crea el manifiesto y el lockfile vacíos
csk search handoff       # busca en el registro público (Skill Central)
csk add handoff          # instala una skill por su nombre corto
csk list                 # ves qué tienes y en qué estado está cada cosa</code></pre>
<p>También puedes instalar directamente desde cualquier URL de git, sin pasar por el registro:</p>
<pre><code class="language-bash">csk add https://github.com/pformoso-deus-ai/handoff-claude-skill.git</code></pre>
<p>Y aquí está el momento que justifica todo el invento. Haces <em>commit</em> de tus dos ficheros —<code>skills.toml</code> y <code>skills.lock</code>— junto a tus dotfiles. En la siguiente máquina, después de clonarlos:</p>
<pre><code class="language-bash">csk install</code></pre>
<p>Mismo conjunto de skills, mismos commits, sin deriva. La diferencia entre recordar y <em>no tener que recordar</em>. Si prefieres un conjunto por proyecto en lugar de uno global, los mismos comandos dentro de la carpeta del proyecto crean un <code>.claude/skills.toml</code> local; csk detecta el ámbito solo.</p>
<p>Hay más en la caja —<code>csk update</code> para refrescar versiones, <code>csk adopt</code> para registrar una skill que ya tenías instalada a mano sin perder nada, <code>csk doctor</code> para diagnosticar la deriva antes de que duela, <code>csk upgrade</code> para que el propio binario se actualice—, pero con esos cuatro comandos ya tienes el 90% del valor.</p>
<h2>La parte recursiva</h2>
<p>Vuelvo al principio, porque es lo que más me interesa de este experimento. csk salió de una conversación: una especificación escrita junto a Claude Code, discutida, recortada, y luego implementada en Go por el propio Claude Code. Catorce commits, cuatro <em>releases</em>, de la idea a un binario que funciona en tres sistemas operativos. Yo hice de arquitecto y de crítico; el teclado lo llevó el modelo.</p>
<p>Y eso abre una puerta con un punto distópico que no me apetece esquivar. A medida que el agente se convierte en tu interfaz principal de trabajo, tus skills dejan de ser un detalle de configuración: son, literalmente, tu cuerpo aumentado. Son lo que sabes hacer <em>a través</em> de la máquina. Y ahora mismo ese cuerpo no tiene control de versiones. Cada portátil es un injerto distinto, cada actualización un parche sin registrar, y nadie —ni tú— sabe exactamente de qué está hecho tu propio entorno.</p>
<p>csk es, en el fondo, un intento modesto de ponerle un esqueleto a eso. Un manifiesto que diga &quot;esto es lo que soy&quot; y un lockfile que lo demuestre. Porque si vamos a delegar cada vez más de nuestra capacidad en estas herramientas, lo mínimo es saber —y poder reproducir— de qué están hechas.</p>
<p>El proyecto es open source, con licencia MIT, y está aquí: <a href="https://github.com/pformoso-deus-ai/csk">github.com/pformoso-deus-ai/csk</a>. Si lo pruebas, una <em>star</em> y, sobre todo, tu <em>feedback</em> en los issues me harían el día.</p>
<hr />
<p><em>Fuentes y enlaces: <a href="https://github.com/pformoso-deus-ai/csk">repositorio de csk en GitHub</a> · <a href="https://docs.claude.com/en/docs/claude-code/skills">documentación de skills de Claude Code</a></em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/csk-un-gestor-de-skills-para-claude-code-hecho-100-con-claude-code/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">98</post-id>	</item>
		<item>
		<title>Dos días, cuatro bugs, una paridad: la autopsia de nuestro benchmark médico</title>
		<link>https://pabloformoso.com/dos-dias-cuatro-bugs-una-paridad-la-autopsia-de-nuestro-benchmark-medico/</link>
					<comments>https://pabloformoso.com/dos-dias-cuatro-bugs-una-paridad-la-autopsia-de-nuestro-benchmark-medico/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Thu, 21 May 2026 05:45:43 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Engineering]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=93</guid>

					<description><![CDATA[Hace dos días publicamos un benchmark de nuestra IA médica para el Día Mundial de la EII. Un solo escenario sangraba: 0,510 puntos por debajo de un GPT-4o sin nada. Podríamos haberlo publicado igual. No lo hicimos. Esta es la autopsia de los cuatro bugs que encontramos, en serie, tapándose unos a otros.]]></description>
										<content:encoded><![CDATA[<p>Un cirujano con oficio te lo dirá sin dramatismo: lo peligroso casi nunca es la herida que ves. Es la que sangra por debajo, callada, mientras tú coses la de arriba y te felicitas por el trabajo bien hecho.</p>
<p>Hace dos días, el <strong>Día Mundial de la Enfermedad Inflamatoria Intestinal</strong>, publicamos un benchmark honesto de nuestro asistente de IA médica. Hoy te cuento por qué estuvimos a punto de publicarlo mal, y qué encontramos cuando decidimos abrir en canal el único número que no nos cuadraba.</p>
<p>Esto es un <em>post mortem</em>. Y como todo buen post mortem, empieza con un cuerpo sobre la mesa.</p>
<h2>El paciente que no encajaba</h2>
<p>El examen era sencillo de enunciar: 27 preguntas sobre EII extraídas de MIRAGE, un banco de pruebas para IA médica. Una mezcla de viñetas clínicas tipo examen de licencia (esas de «un paciente acude a consulta con&#8230;»), literatura biomédica de PubMedQA y un set curado de farmacología específica de la EII.</p>
<p>Para puntuar usamos <strong>RAGAS answer_correctness</strong>: una métrica de 0 a 1 en la que otro modelo actúa de juez y compara nuestra respuesta con la respuesta correcta de referencia. Y aquí va un detalle que importará luego: es una métrica de <em>precisión</em>. No premia escribir mucho ni demostrar que sabes. Premia decir lo correcto sin rellenar.</p>
<p>Casi todo iba razonablemente bien. Hasta que apareció un escenario que se nos quedó clavado.</p>
<p>Una mujer de 38 años, con una resección ileal previa por enfermedad de Crohn, llega con un cólico biliar. La respuesta correcta es <em>coledocolitiasis</em>: una piedra atascada en el conducto biliar. No es una pregunta tramposa; de hecho tiene una lógica biomecánica preciosa, porque quitarle a alguien una parte del íleon estropea la reabsorción de sales biliares y lo predispone justamente a fabricar cálculos. El cuerpo, otra vez, contando su propia historia.</p>
<p>Nuestro sistema sacó un <strong>0,382</strong>. Un GPT-4o <em>desnudo</em> —el modelo crudo, sin nuestro RAG, sin nuestra tubería de agentes, solo él— sacó un <strong>0,892</strong>. Una brecha de 0,510 puntos. En un solo escenario.</p>
<p>Conviene parar aquí, porque esto es incómodo. Habíamos construido toda una arquitectura alrededor del modelo —recuperación de documentos, orquestación, personas— y en esa pregunta el modelo a pelo nos barría. Habíamos puesto andamios y el andamio pesaba más que el edificio.</p>
<h2>La tentación de publicar igual</h2>
<p>Podríamos haber publicado el benchmark tal cual. Un escenario flojo entre 27 no hunde una media. Se redondea, se acompaña de una nota a pie de página y nadie pregunta.</p>
<p>No lo hicimos. Y no por orgullo, sino por una regla que es casi anatómica: <strong>un número que no sabes defender es un bulto que no has palpado</strong>. Puede no ser nada. O puede ser lo que te mate seis meses después, en producción, con un usuario real delante.</p>
<p>Así que abrimos. Dos días de análisis forense de causa raíz. Y lo que encontramos no fue un bug. Fueron cuatro. En serie. Y, como las capas de un tejido, cada uno tapaba al de debajo.</p>
<h2>Cuatro bugs, en serie, tapándose unos a otros</h2>
<p>Esta es la parte que merece detalle, porque el patrón es más interesante que cualquiera de los fallos por separado.</p>
<h3>Bug 1 — Mojibake en la zona de uso privado</h3>
<p>Una tubería RAG empieza por leer documentos. Nosotros le damos de comer un corpus médico en PDF, lo troceamos en fragmentos y guardamos cada fragmento como un vector —una huella numérica de su significado— para poder buscar por similitud.</p>
<p>Dos de esos PDF estaban envenenados. Su texto venía codificado en la <em>Private Use Area</em> de Unicode: un rincón del estándar deliberadamente vacío, pensado para que cada cual meta ahí sus propios símbolos. Una fuente con un <code>cmap</code> personalizado había mapeado las letras a esa zona. Para un humano abriendo el PDF, se leía perfecto. Para nuestro extractor de texto, era <em>mojibake</em>: ristras de caracteres basura sin ningún significado.</p>
<p>Lo venenoso no fue la basura en sí. Fue que nuestro <em>embedder</em> —el componente que convierte texto en vectores— no se quejó. Le diste galimatías y, tan contento, lo colocó en el espacio vectorial y empezó a puntuarlo como «parecido» a las preguntas. Imagina un sistema inmune que, en lugar de marcar un tejido extraño, lo abraza y lo integra. El cuerpo no detecta el problema; lo adopta.</p>
<p><strong>El arreglo:</strong> un decodificador heurístico que detecta el desplazamiento de la zona de uso privado y revierte el mapeo, con <em>docling</em> como red de seguridad cuando la heurística no llega.</p>
<h3>Bug 2 — El efecto distractor del RAG</h3>
<p>Arreglado el primer bug, esperábamos que la herida cerrara. No cerró. Y aquí apareció algo más sutil.</p>
<p>La búsqueda por similitud densa —comparar vectores— de vez en cuando devolvía un fragmento con una puntuación alta, un 0,75, que sin embargo no compartía <em>ni una sola palabra sustantiva</em> con la pregunta. El vector decía «esto es relevante». El texto, leído por un humano, no tenía nada que ver.</p>
<p>Es el equivalente a un reflejo mal calibrado: el estímulo no era el correcto, pero el arco reflejo se dispara igual. Y un fragmento irrelevante metido en el contexto no es neutro. Distrae al modelo. Le da material plausible para construir una respuesta elegante y equivocada.</p>
<p><strong>El arreglo:</strong> una compuerta de relevancia, activable por variable de entorno, que descarta el contexto cuando la puntuación de similitud <em>y</em> el solapamiento léxico caen por debajo de sus umbrales —o cuando el solapamiento baja de un suelo de veto, da igual lo alta que sea la puntuación del vector. Si las dos señales no se confirman, no entra.</p>
<h3>Bug 3 — La persona equivocada en la sala equivocada</h3>
<p>Este es mi favorito, porque no es un fallo de código. Es un fallo de <em>identidad</em>.</p>
<p>Nuestra persona por defecto se llama <strong>Matucha</strong>: una compañera para personas con enfermedad crónica. Está diseñada para hablar con un paciente real —con calidez, con cuidado, recordándole que consulte con su equipo médico—. Para esa misión, es exactamente lo que debe ser.</p>
<p>El problema es que Matucha también estaba respondiendo las viñetas tipo examen. Y a un tribunal de licencia médica le estaba contestando con preámbulos empáticos y avisos de «consulta a tu profesional sanitario», enterrando el diagnóstico bajo capas de amabilidad. La respuesta correcta estaba ahí dentro. Solo que sepultada.</p>
<p>Era el animal correcto en el hábitat equivocado. Un pez extraordinario al que habíamos pedido escalar un árbol.</p>
<p><strong>El arreglo:</strong> despacho según el modo. Las preguntas en tercera persona —»Una mujer de 38 años acude a consulta&#8230;»— se reconocen como registro académico y se enrutan por un canal clínico, directo y sin preámbulos. Las preguntas de un paciente de verdad siguen llegando a Matucha, intacta.</p>
<h3>Bug 4 — La verborrea que diluye</h3>
<p>Con el canal académico ya funcionando, quedaba un último goteo. El <em>prompt</em> académico producía respuestas de 8 o 9 frases, mientras que el GPT-4o desnudo despachaba en 4 o 5.</p>
<p>Y aquí vuelve el detalle del principio. RAGAS answer_correctness es una métrica de <strong>precisión</strong>. Cada frase de fisiopatología correcta pero irrelevante que añades no suma: <em>diluye</em>. Es como una analítica con demasiados marcadores pedidos «por si acaso» —cada valor de más no aporta señal, solo ruido que enmascara el dato que importa.</p>
<p><strong>El arreglo:</strong> apretar el prompt a 3 o 4 frases como máximo. Decir lo correcto, y callarse.</p>
<h2>El quinto problema no era un bug del producto</h2>
<p>Hay un quinto hallazgo que merece una mención aparte, porque es el más traicionero de todos.</p>
<p>Nuestro orquestador de evaluación tenía un <em>timeout</em> de 30 segundos. Y estaba cortando 8 de los 9 escenarios de tipo examen <em>antes</em> de que se pudieran medir. Es decir: durante parte del proceso estuvimos arreglando bugs sin poder ver siquiera el efecto de los arreglos, porque el banco de pruebas censuraba las respuestas antes de puntuarlas.</p>
<p>Lo importante: la experiencia del usuario real estuvo bien todo el tiempo. El producto respondía. Lo que estaba roto era el instrumento de medida, no el paciente. Y eso da escalofríos, porque es el error que más se parece a un termómetro estropeado: no te enferma, pero te hace tomar todas las decisiones a ciegas.</p>
<h2>Dónde quedamos</h2>
<p>Dos días. Ocho <em>pull requests</em>. La misma tanda del juez RAGAS sobre el mismo subconjunto de 27 escenarios de EII.</p>
<p>El resultado: <strong>0,310 de RAGAS answer_correctness para SynapseFlow, 0,310 para el GPT-4o desnudo</strong>. Paridad. Y dentro de esa paridad global, ganamos justo en los cubos donde la recuperación de documentos importa de verdad: <strong>+0,056 en farmacología de la EII</strong> y <strong>+0,049 en literatura de PubMedQA</strong>.</p>
<p>Quiero ser claro con lo que esto significa y con lo que no. No significa que seamos mejores. Significa que, <em>después</em> de depurar cuatro bugs en serie, una arquitectura RAG con agentes está a la altura del modelo crudo, y empieza a despuntar exactamente donde se supone que debe aportar: cuando hay que ir a buscar un dato a un documento. Esa es la posición honesta. Ni «estado del arte» ni superlativos. Paridad ganada a pulso.</p>
<p>¿Dónde seguimos por detrás? En 3 de las 9 viñetas tipo examen, donde nuestra respuesta académica era correcta pero estaba <em>formulada</em> de manera distinta a la de referencia. Sospechamos que es varianza del juez, no un fallo del producto. Lo estamos investigando, y lo diremos cuando lo sepamos.</p>
<h2>Lo que aprendimos</h2>
<p>Si te dedicas a construir IA médica con agentes, la lección se resume en una frase: <strong>las tuberías de agentes apilan modos de fallo</strong>.</p>
<p>Un único punto de answer_correctness fuera de sitio escondía cuatro bugs en serie, y cada uno enmascaraba al siguiente. Arreglas el mojibake y aparece el distractor. Arreglas el distractor y aparece la persona. Arreglas la persona y aparece la verborrea. Es la diferencia entre un organismo y una pieza suelta: en un sistema con muchas capas, ningún síntoma apunta limpiamente a una sola causa. Hay que disecar.</p>
<p>Y la disciplina forense de negarse a publicar un número que no puedes defender no es una formalidad. Es el juego entero.</p>
<p>El informe completo —con el detalle escenario a escenario, todos los JSON de la línea base y el rastro de auditoría de las 8 PR— está aquí: <a href="https://github.com/DEUS-AI/SynapseFlow/blob/main/docs/benchmarks/eje1-ibd-baseline.md" target="_blank" rel="noopener">github.com/DEUS-AI/SynapseFlow → docs/benchmarks/eje1-ibd-baseline.md</a>.</p>
<p>Lo siguiente: los mismos 27 escenarios contra KAG (Liang et al., 2024). Esa es la comparación que toda esta autopsia nos estaba comprando el derecho a hacer con credibilidad. La contaremos cuando tengamos los números. No antes.</p>
<hr>
<p><em>Próximo post: SynapseFlow contra KAG — la comparación que esta autopsia hizo posible.</em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/dos-dias-cuatro-bugs-una-paridad-la-autopsia-de-nuestro-benchmark-medico/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">93</post-id>	</item>
		<item>
		<title>La Guía Génica — El Cuarto Ídolo y la Salida del Laberinto</title>
		<link>https://pabloformoso.com/la-guia-genica-el-cuarto-idolo-y-la-salida-del-laberinto/</link>
					<comments>https://pabloformoso.com/la-guia-genica-el-cuarto-idolo-y-la-salida-del-laberinto/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Wed, 20 May 2026 20:43:56 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Aprendizaje]]></category>
		<category><![CDATA[Data]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[Inteligencia Hibrida]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=87</guid>

					<description><![CDATA[Los tres primeros ídolos de la augmentación atacan tu libertad. El cuarto —la Guía Génica— ataca tu conciencia: convierte rechazar el rediseño humano en una falta moral. Y luego, la salida del laberinto, de la mano de Teilhard de Chardin.]]></description>
										<content:encoded><![CDATA[<p>Hay trampas que se cierran de golpe y trampas que esperan.</p>
<p>La Venus atrapamoscas pertenece a las segundas. No persigue a nada. Despliega sus hojas, segrega un néctar dulce justo en el borde, y espera. El insecto entra por su propia voluntad, atraído por algo que parece un regalo. Solo cuando roza dos veces los pelillos sensibles del interior —cuando ya está dentro— la hoja se pliega. La planta nunca cazó nada. La presa se cazó a sí misma.</p>
<p>Los tres primeros ídolos de la augmentación funcionan como una trampa de golpe. Te convencen de que todo se puede diseñar, de que diseñar no cuesta nada, de que puedes fundirte con la máquina sin perder nada por el camino. Pero queda un cuarto ídolo, y este es de los que esperan. No te ataca la libertad. Te ataca la conciencia. Y te deja entrar tú solito, persiguiendo lo que parece el néctar más dulce de todos: la responsabilidad moral.</p>
<p>En la Parte 1 desmontamos los tres primeros: <strong>lo diseñable</strong> («todo es mejorable»), <strong>la neutralidad</strong> («mejorar no cuesta nada») y <strong>la fusión sin resto</strong> («podemos ganarlo todo sin perder nada»). Tres estructuras de pensamiento que se disfrazan de sentido común. Hoy nombramos el cuarto, el que cierra el circuito. Y luego —porque no todo es diagnóstico— buscamos la salida.</p>
<h2>Ídolo 4: La Guía Génica</h2>
<p>El filósofo Peter Sloterdijk encendió un incendio en 1999 con una conferencia que acabó publicada como <em>Normas para el parque humano</em>. Su idea, despojada de polémica, era esta: durante siglos el humanismo fue una tecnología de «domesticación» —educar, leer, civilizar—, pero esa tecnología está agotada. Lo que viene, decía, es la pregunta incómoda de la <strong>antropotécnica</strong>: la posibilidad de que la humanidad se convierta a sí misma en un proyecto de diseño consciente, también a nivel biológico.</p>
<p>El cuarto ídolo toma esa pregunta y la convierte en mandamiento. No dice solo que <em>podemos</em> guiar nuestra propia evolución. Dice que <em>debemos</em>. Que dejar la naturaleza humana en manos del azar —de la lotería genética, de la mutación ciega— es una forma de negligencia. Que si tienes el poder de evitar el sufrimiento de tus descendientes y no lo usas, eres cómplice de ese sufrimiento.</p>
<p>Y aquí está lo brillante —y lo perverso— de este ídolo: suena a virtud. Suena, de hecho, a la única postura decente posible. ¿No es egoísta negarse a mejorar a tus hijos? ¿No es cobarde esconderse detrás de la palabra «natural»?</p>
<p>Fíjate en el desplazamiento. Los tres primeros ídolos discutían lo que era <em>posible</em> y lo que <em>costaba</em>. El cuarto ya no discute eso. El cuarto te mira a los ojos y te pregunta qué clase de padre, qué clase de ciudadano, qué clase de especie quieres ser. Convierte la prudencia en pereza moral. Convierte el respeto por lo dado en abandono.</p>
<p>Pero el propio Sloterdijk avisaba del filo de esa navaja: cuando la naturaleza humana se convierte en un proyecto, los humanos se convierten en <strong>material de construcción</strong>. Y un material de construcción no se respeta: se selecciona, se descarta, se mejora según un plano. La línea entre la terapia génica que cura una enfermedad real y el «perfeccionamiento» de un rasgo que a alguien le parece deseable es mucho más borrosa de lo que nos gustaría. Y alguien tiene que trazar esa línea. Alguien —un comité, una corporación, un Estado, una moda— decide hacia dónde evoluciona la especie.</p>
<p>Esa es la pregunta que el cuarto ídolo entierra bajo su retórica de responsabilidad: <strong>¿quién sostiene el lápiz?</strong></p>
<h2>La trampa completa</h2>
<p>Mira los cuatro funcionando juntos, como cuatro paredes de una misma habitación sin puerta:</p>
<ol>
<li><strong>Lo diseñable:</strong> «Todo es mejorable.»</li>
<li><strong>La neutralidad:</strong> «Mejorar no tiene coste.»</li>
<li><strong>La fusión sin resto:</strong> «Puedes ganarlo todo sin perder nada.»</li>
<li><strong>La guía génica:</strong> «Y no solo <em>puedes</em>: <em>debes</em>.»</li>
</ol>
<p>Una vez que aceptas los cuatro supuestos, la augmentación deja de ser una opción. Se vuelve un imperativo. Rechazarla no es solo ineficiente: es inmoral. Es condenar a tus hijos a ser una «versión anterior» de humano mientras el resto del mundo actualiza el firmware de la especie.</p>
<p>Ese es el verdadero genio de la trampa. No ataca tu libertad de frente —eso lo verías venir—. Ataca tu sentido de la responsabilidad por la puerta de atrás, vestido de bondad. Y como la Venus atrapamoscas, espera a que seas tú quien cierre la hoja.</p>
<p>Pero toda trampa tiene una grieta. Y esta tiene una bastante grande.</p>
<h2>La grieta: confundir el mapa con el territorio</h2>
<p>Los cuatro ídolos comparten un error de fondo, y es un error de ingeniero: asumen que porque podemos <em>describir</em> algo, podemos <em>controlarlo</em>. Que si reducimos un ser humano a parámetros —memoria, atención, fuerza, resistencia—, lo dominamos.</p>
<p>Pero un organismo vivo no es una lista de parámetros. Es un sistema.</p>
<p>Pierre Teilhard de Chardin —jesuita, paleontólogo, una de las mentes más raras del siglo XX— pasó su vida estudiando cómo la vida se complejiza. Y vio algo que el ingeniero suele pasar por alto: la evolución no es un proceso de optimización dirigido. Es un proceso de <strong>emergencia</strong>. La complejidad no se calcula; surge. Aparece de la interacción de millones de elementos, del azar y la necesidad trabajando juntos, de encuentros que ninguna ecuación anticipó.</p>
<p>Es la diferencia entre un plano y un río. Puedes dibujar el cauce de un río sobre un papel con una regla. Pero el río real tiene turbulencias, remansos, fricción contra la roca, sedimentos que mañana cambiarán su curso. El río es un sistema vivo. El plano es una mentira útil. Y el cuarto ídolo te invita a gestionar el río humano como si fuera el plano.</p>
<h2>Por qué no somos módulos</h2>
<p>Aquí es donde la biomecánica nos da la lección más clara.</p>
<p>Imagina que decides «mejorar» un solo músculo de tu cuerpo: que crezca el doble, que sea el doble de fuerte. Suena a ganancia pura. Pero tu cuerpo no es una caja de piezas independientes. Es una <strong>cadena cinética</strong>. Ese músculo tira de tendones que no se han reforzado, sobre articulaciones que no se han recalibrado, dentro de una postura que el cerebro lleva décadas afinando. El «upgrade» no te hace más fuerte: te hace una lesión esperando a ocurrir.</p>
<p>Con la mente pasa exactamente igual, solo que no lo vemos porque no sangra.</p>
<p>La memoria no es una carpeta de archivos que puedas ampliar. Está tejida con la emoción, con la identidad, con el sentido del tiempo. El olvido no es un fallo del sistema: es lo que te permite perdonar, lo que evita que cada herida siga igual de fresca treinta años después. La inteligencia no es un procesador: emerge de un cuerpo que existió en un mundo peligroso, de la necesidad, del miedo, del límite. Aumentar un rasgo «aislado» sin entender de qué totalidad emerge puede fabricar monstruosidades con la misma facilidad que maravillas.</p>
<p>El error de los cuatro ídolos es creer que el ser humano es <strong>descomponible</strong>. Y no lo es. Todo está tejido con todo. Lo que parece una ganancia limpia en una dimensión casi siempre es una pérdida invisible en otra.</p>
<h2>La salida no es el rechazo</h2>
<p>Llegados aquí, mucha gente da un volantazo: si no puedo abrazar el diseño total, entonces hay que rechazar la tecnología, volver a la cueva, romper las máquinas.</p>
<p>No. Esa es una falsa salida —y, además, una bastante cobarde—.</p>
<p>Teilhard proponía algo más difícil y más interesante: no se trata de <em>dirigir</em> la evolución hacia un destino que hayamos elegido en una pizarra. Se trata de <strong>participar sabiamente</strong> en un proceso que nos supera. De traer conciencia, cuidado y humildad al desarrollo tecnológico, sin la fantasía de que podemos prever todas las consecuencias.</p>
<p>Es una postura de humildad, sí. Pero no de parálisis. Es <strong>cuidado inteligente</strong>. La pregunta deja de ser «¿podemos?» y pasa a ser «¿deberíamos?». Y «deberíamos» no se responde con la lógica del marketing —»más siempre es mejor»—, sino con la lógica más antigua de la medicina.</p>
<h2>El criterio: primero, no dañes</h2>
<p>El juramento hipocrático nos dio, hace dos mil quinientos años, la mejor brújula que tenemos para esto: <em>primum non nocere</em>. Primero, no dañes.</p>
<p>Es un criterio sorprendentemente práctico. Una intervención es legítima cuando trata una enfermedad genuina, cuando alivia un sufrimiento real, cuando restaura algo que se perdió. Se vuelve problemática cuando empieza a «mejorar» lo que no estaba roto, cuando confunde <em>diferente</em> con <em>defectuoso</em>, cuando mira una limitación humana y solo ve un bug pendiente de parche.</p>
<p>La terapia génica que cura una enfermedad degenerativa: legítima. El «perfeccionamiento» de la inteligencia en un embrión sano: problemático. La prótesis que devuelve la movilidad a quien la perdió: legítima. El implante que «optimiza» la experiencia sensorial de quien no tenía ningún problema: problemático.</p>
<p>¿Por qué la diferencia? Porque en los primeros casos reparamos una grieta. En los segundos, presumimos saber, mejor que millones de años de evolución, qué debería ser un humano.</p>
<h2>El retorno del misterio</h2>
<p>Quizá lo más revolucionario de nuestra época no sea abrirse del todo a la augmentación. Quizá sea, simplemente, resistir la idea de que todo tiene que ser diseñado, optimizado y mejorado.</p>
<p>Teilhard escribía sobre una «religión de la tierra»: una forma de habitarla con asombro en lugar de conquistarla a martillazos de ingeniería. Ver la vida no como un problema esperando solución, sino como un misterio esperando participación.</p>
<p>Los cuatro ídolos trabajan juntos para convencerte de que el misterio es ignorancia, de que la complejidad es un defecto, de que todo debe reducirse a código, a especificación, a control. Pero una vida vivida en plenitud necesita que algunas cosas sigan siendo misteriosas. Necesita aceptar que somos hijos de un proceso que no diseñamos, que cargamos un cuerpo cuya sabiduría supera nuestra comprensión, que participamos en una evolución que continuará sin nosotros y de formas que no podemos prever.</p>
<p>Y eso no es una limitación que haya que corregir. Es el suelo sobre el que se sostiene la libertad.</p>
<h2>El cierre</h2>
<p>Hemos recorrido cuatro ídolos. Lo diseñable nos dijo que todo se puede tocar. La neutralidad, que tocarlo no cuesta nada. La fusión sin resto, que podíamos fundirnos sin perdernos. Y la guía génica, el más íntimo de todos, nos dijo que negarnos a hacerlo era una falta moral.</p>
<p>Juntos construyen un laberinto sin puerta. Pero la puerta existe. No está en rechazar la tecnología —eso es otra cueva—. Está en cambiar nuestra relación con ella: entender que es una herramienta, no un destino. Que el futuro humano no lo decide lo que <em>podemos</em> hacer, sino lo que <em>elegimos</em> hacer con cuidado, con humildad y con amor.</p>
<p>El cuarto ídolo promete que seremos dioses si nos dejamos rediseñar. Pero quizá ya somos algo más extraño y más hermoso que un dios: somos materia que se volvió consciente de sí misma. Somos el universo mirándose a través de unos ojos. Y eso, simplemente eso, no necesita una actualización.</p>
<p>Necesita respeto.</p>
<p>La pregunta nunca fue «¿qué podemos hacer?».</p>
<p>La pregunta que importa, la que cierra esta serie y abre todo lo demás, es: <strong>¿qué clase de humanidad queremos ser?</strong></p>
<hr>
<p><em>Fuentes y lecturas: Peter Sloterdijk, <strong>Normas para el parque humano</strong> (Siruela, 2000); Pierre Teilhard de Chardin, <strong>El fenómeno humano</strong>; Michael Sandel, <strong>Contra la perfección</strong>; Jürgen Habermas, <strong>El futuro de la naturaleza humana</strong>.</em></p>
<p><em>Fin de la serie «Elegir la Pastilla Roja: El Angelismo Moderno».</em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/la-guia-genica-el-cuarto-idolo-y-la-salida-del-laberinto/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">87</post-id>	</item>
		<item>
		<title>Los Ídolos de la Augmentación — Lo Diseñable, la Falsa Neutralidad y la Captura</title>
		<link>https://pabloformoso.com/los-idolos-de-la-augmentacion-parte-1-lo-disenable-la-falsa-neutralidad-y-la-captura/</link>
					<comments>https://pabloformoso.com/los-idolos-de-la-augmentacion-parte-1-lo-disenable-la-falsa-neutralidad-y-la-captura/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Mon, 18 May 2026 16:22:03 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Aprendizaje]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[Inteligencia Hibrida]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=78</guid>

					<description><![CDATA[Hay un momento en el que dejas de caminar hacia algo y empiezas a arrodillarte ante ello. Así es como uno acaba ante los tres ídolos de la augmentación: Lo Diseñable como Inevitabilidad, el Aumento como Neutralidad, y la Fusión sin Resto.]]></description>
										<content:encoded><![CDATA[<p>Hay un momento —difícil de identificar exactamente cuándo ocurre— en el que dejas de caminar hacia algo y empiezas a arrodillarte ante ello.</p>
<p>No es un gesto dramático. No es una epifanía ni una conversión. Es más parecido a lo que le pasa a un árbol cuando sus raíces encuentran roca: empieza a crecer en la única dirección que el sustrato le permite, y con el tiempo ya no recuerda que alguna vez pudo crecer en otra. La postura se convierte en naturaleza. La roca, en horizonte.</p>
<p>Así es exactamente como uno acaba arrodillado ante los ídolos de la augmentación.</p>
<p>En el post anterior exploramos el <em>angelismo moderno</em>: esa convicción de que el cuerpo es un borrador defectuoso, un problema técnico que aguarda la mano del ingeniero. Pero una pregunta quedó flotando: ¿de dónde surge esa certeza? ¿Por qué estamos tan seguros de que diseñar es mejor que recibir, que más siempre es mejor, que toda limitación es una avería y toda capacidad, un parámetro a optimizar?</p>
<p>La respuesta está en tres ídolos. No son estatuas de piedra ni dioses olvidados. Son estructuras de pensamiento que se disfrazan de evidencia, de neutralidad, de sentido común. Y eso es precisamente lo que los hace peligrosos: no se anuncian como dogmas. Simplemente <em>están ahí</em>, como el aire, y sin darte cuenta ya respiras solo por ellos.</p>
<h2>Ídolo 1: Lo Diseñable como Inevitabilidad</h2>
<p>Imagina un río. Durante miles de años fluye según su naturaleza: con meandros, pausas, desbordamientos. Un día llega un ingeniero y dice: «Esto puede optimizarse. Rectificaremos el cauce, controlaremos el caudal, haremos que el agua llegue exactamente donde la necesitamos.»</p>
<p>Así funciona el primer ídolo: la convicción de que porque <em>podemos</em> diseñar algo, debe ser diseñado.</p>
<p>Michael Sandel, en <em>The Case Against Perfection</em>, identificó algo crucial: cuando elevamos el diseño a un imperativo moral, perdemos la capacidad de experimentar nuestras vidas como un regalo. Lo «dado» —ese sustrato de realidad que no elegimos— es lo que nos permite tener una relación de humildad con la existencia. Pero la mentalidad augmentacionista ve lo dado no como un regalo, sino como un borrador defectuoso que espera la pluma del ingeniero.</p>
<p>El problema es sutil pero devastador: si todo es diseñable, entonces nada tiene valor por sí mismo. Un cuerpo no es una maravilla biológica producto de millones de años de evolución; es una versión beta de lo que <em>realmente</em> podría ser. Una mente es un sistema operativo con bugs que necesita patching. Una capacidad humana es un feature que podría aumentarse en la próxima release.</p>
<p>Pero aquí es donde el ídolo juega sucio: no es que el diseño sea malo. Es que el diseño es <em>neutro</em>, ¿verdad? Eso nos lleva al segundo ídolo.</p>
<h2>Ídolo 2: Aumento como Neutralidad</h2>
<p>Este es el más peligroso porque es el que menos parece un ídolo.</p>
<p>Cuando hablamos de «aumentar» la cognición humana con inteligencia artificial, o de «mejorar» nuestras capacidades físicas con implantes, lo hacemos con un lenguaje que pretende ser neutro. Estamos simplemente <em>sumando</em> capacidades. Un plus, sin negativo asociado. ¿Qué podría haber de malo en tener más?</p>
<p>Jürgen Habermas lo vio con claridad en <em>The Future of Human Nature</em>: no existe tal cosa como una «intervención neutra» en el cuerpo o la mente. Toda modificación implica una apuesta metafísica sobre qué es lo valioso, qué vale la pena preservar y qué debe transformarse. Cuando aumentas la memoria de un ser humano, no estás simplemente sumándole una capacidad; estás diciendo que el olvido es un defecto. Que la finitud cognitiva es un problema. Que la experiencia de <em>no saber</em> algo es algo que debe eliminarse.</p>
<p>Y con eso, has eliminado la posibilidad de asombro, de aprendizaje como transformación, de la vulnerabilidad que nos hace humanos.</p>
<p>El ídolo funciona así: te convence de que estás haciendo matemáticas simples (más capacidad = mejor vida), cuando en realidad estás jugando con la gramática profunda de qué significa ser humano.</p>
<p>Heidegger lo llamaba <em>Gestell</em> —la configuración de la realidad como «recursos» susceptibles de optimización. En el Gestell, nada tiene valor en sí; todo es evaluado según su utilidad y su potencial de mejora. El cielo no es bello; es un «depósito de energía solar». Un río no es un lugar de contemplación; es un «generador hidroeléctrico en potencia». Y nosotros mismos, inevitablemente, empezamos a vernos de la misma forma: depósitos de potencial sin realizar, máquinas con bugs, sistemas que esperan actualización.</p>
<p>Bajo el Gestell, la augmentación no es una opción; es la única forma racional de relacionarse con la realidad. Y eso, precisamente, es lo que convierte a este ídolo en trampa.</p>
<h2>Ídolo 3: Fusión sin Resto</h2>
<p>El tercer ídolo es el más seductor porque promete la síntesis perfecta: la unión de lo humano y la máquina, la mente biológica y el poder artificial, el individuo y el colectivo aumentado.</p>
<p>«No habrá conflicto», nos dicen. «Seremos más nosotros mismos, solo que mejor.»</p>
<p>Pero aquí está el problema: toda síntesis genuina implica un «resto», algo que no puede ser completamente absorbido en la fusión. Cuando una gota de agua se mezcla con el océano, hay algo que se pierde. No es malo o bueno; es real.</p>
<p>En la fusión de la mente humana con sistemas de IA, ese resto es precisamente lo que hace que seamos humanos: la capacidad de equivocarnos, de resistir, de sorprendernos con nuestras propias limitaciones. Si la IA está <em>dentro</em> de tu cognición, optimizándola en tiempo real, entonces ese espacio de libertad desaparece. No porque la IA sea malvada, sino porque la lógica misma de la optimización es incompatible con la libertad.</p>
<p>Sandel lo expresó así: cuando hacemos todo <em>de acuerdo a diseño</em>, renunciamos a la experiencia de que las cosas nos suceden. Y con eso, renunciamos a la gratitud, la humildad, la sorpresa, la redención — los sentimientos que requieren que algo escape a nuestro control.</p>
<p>La promesa del tercer ídolo es que podemos tenerlo todo: poder y vulnerabilidad, capacidad y sorpresa, individuación y colectivo. Pero la realidad de la Gestell sugiere que eso es una mentira hermosa. Lo que promete ser «fusión sin resto» es, en el fondo, <strong>captura con resto invisible</strong>.</p>
<h2>El Patrón</h2>
<p>¿Ves el patrón? El primer ídolo te convence de que todo <em>puede</em> diseñarse. El segundo te convence de que todo <em>debe</em> diseñarse. El tercero te convence de que puedes diseñarlo sin consecuencias.</p>
<p>Juntos, cierran la trampa: no toda síntesis es comunión. Algunas son captura disfrazada de mejora.</p>
<p>En el próximo post exploraremos el cuarto ídolo —el que cierra el circuito— y la posibilidad de que exista una salida a esta lógica que no sea simplemente rechazar la tecnología, sino aprender a habitarla de otro modo.</p>
<p>Porque el punto no es detener la augmentación. Es entender que el cuerpo, la mente, la vida misma, no son problemas esperando solución. Son misterios esperando sabiduría.</p>
<hr>
<p><strong>Próximo post:</strong> La Guía Génica — El Cuarto Ídolo y la Salida del Laberinto</p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/los-idolos-de-la-augmentacion-parte-1-lo-disenable-la-falsa-neutralidad-y-la-captura/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">78</post-id>	</item>
		<item>
		<title>El Angelismo Moderno — Cuando el Cuerpo se Vuelve un Problema Técnico</title>
		<link>https://pabloformoso.com/el-angelismo-moderno-cuando-el-cuerpo-se-vuelve-un-problema-tecnico/</link>
					<comments>https://pabloformoso.com/el-angelismo-moderno-cuando-el-cuerpo-se-vuelve-un-problema-tecnico/#respond</comments>
		
		<dc:creator><![CDATA[Pablo Formoso]]></dc:creator>
		<pubDate>Mon, 18 May 2026 11:34:42 +0000</pubDate>
				<category><![CDATA[Inteligencia Artificial]]></category>
		<category><![CDATA[Tecnología y Desarrollo]]></category>
		<category><![CDATA[Futuro]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[Inteligencia Hibrida]]></category>
		<guid isPermaLink="false">https://pabloformoso.com/?p=59</guid>

					<description><![CDATA[Hay un momento en el que la lógica de la "augmentación humana" deja de parecer futurista y se convierte en el presente. Y en ese momento reconoces algo que tiene 80 años de antigüedad: estamos ante el angelismo de Maritain, un diagnóstico tan preciso sobre cómo tratamos el cuerpo humano como un problema técnico que duele leerlo.]]></description>
										<content:encoded><![CDATA[<p>Hay un momento en el que la lógica de la «augmentación humana» deja de parecer futurista y se convierte en el presente. Lo ves en las propuestas de neurotech que prometen inteligencia aumentada. En los planes de edición genética que buscan optimizar el genoma humano como si fuese un software con bugs. En la retórica del «human augmented workforce» que imagina un trabajador fusionado fluidamente con sistemas de IA, sin fricción, sin resto, puro rendimiento.</p>
<p>Y en ese momento reconoces algo: no estamos ante una novedad del siglo XXI. Lo que está pasando ahora tiene un nombre que existe hace ochenta años. Se llama <strong>angelismo</strong>. Y el diagnóstico que lo acompaña es tan preciso que duele.</p>
<h2>El Angelismo de Maritain</h2>
<p>Jacques Maritain, filósofo católico francés, acuñó el término a mediados del siglo XX como una crítica quirúrgica a Descartes. No era una crítica al cartesianismo como método, sino a su metafísica más profunda: la idea de que el ser humano es, en su esencia, <em>un ángel</em>.</p>
<p>Suena extraño, ¿verdad? Pero espera.</p>
<p>Un ángel, en la teología medieval, es <em>pura inteligencia</em>. No tiene cuerpo, no tiene extensión material, no tiene limitaciones biológicas. Existe en un estado de transparencia perfecta entre su voluntad y su conocimiento. Un ángel <em>es</em> lo que piensa. No hay mediación, no hay fricción, no hay carne que le ralentice.</p>
<p>Lo que Maritain vio en Descartes fue esto: la filosofía cartesiana trataba al ser humano <em>como si fuese un ángel</em>. Reducía lo humano a la res cogitans — la cosa pensante — y relegaba el cuerpo a la categoría de res extensa — la cosa extendida — como si fuese un mecanismo accidental, algo que el verdadero yo (la mente) solo ocupa ocasionalmente, como quien deja el coche en un aparcamiento.</p>
<p>Para Maritain, esto era un error metafísico profundo. El ser humano no es un ángel accidentalmente encarnado. Es un <em>animal racional</em> — una unidad indisociable de cuerpo y espíritu, materia y forma. El cuerpo no es un estorbo. Es parte constitutiva de lo que significa ser humano. Somos, literalmente, <em>de carne</em>.</p>
<p>Y de ahí viene todo lo demás.</p>
<h2>El Angelismo Hoy</h2>
<p>El diagnóstico de Maritain sobre Descartes es exacto. Pero lo inquietante es que describe perfectamente lo que está pasando ahora, más de tres siglos después.</p>
<p>Observa la retórica. Observa cómo el cuerpo humano se presenta en el discurso de la augmentación: No como algo que nos define. Sino como un <em>problema técnico</em>.</p>
<p>Es un problema que puede ser solucionado mediante intervención. La genética que «heredaste» es un bug. Tu capacidad cognitiva es un spec que puede ser upgradreado. Tu energía física, tu resistencia, tu atención — todo eso son funciones que pueden ser optimizadas. Tus límites biológicos son fricciones innecesarias en el camino hacia la eficiencia perfecta. Y la solución no es aprender a vivir en tu cuerpo. Es escapar de sus restricciones.</p>
<p>Eso es angelismo. Es la creencia de que tu verdadero yo — tu inteligencia, tu capacidad productiva, tu potencial — está accidentalmente atrapado en una materialidad defectuosa que debe ser reparada, aumentada, diseñada, corregida. Que tu esencia es pura funcionalidad y que todo lo que no acelere esa funcionalidad es un accidente lamentable.</p>
<p>El transhumanismo es angelismo. La edición genética de línea germinal es angelismo. El «human augmented» es angelismo. La IA como prótesis cognitiva que <em>fusiona</em> tu mente con máquinas — es angelismo. Y el síntoma más revelador es siempre el mismo:</p>
<blockquote><p>la creencia de que aceptar los propios límites es <em>derrota</em>.</p></blockquote>
<p style="text-align: center;"><img decoding="async" class="size-medium wp-image-62 aligncenter" src="https://pabloformoso.com/wp-content/uploads/2026/05/ai_6a0af416c7c810.25943442-300x300.png" alt="Fusión de lo orgánico y lo mecánico - ¿comunión o subordinación?" width="300" height="300" srcset="https://pabloformoso.com/wp-content/uploads/2026/05/ai_6a0af416c7c810.25943442-300x300.png 300w, https://pabloformoso.com/wp-content/uploads/2026/05/ai_6a0af416c7c810.25943442-150x150.png 150w, https://pabloformoso.com/wp-content/uploads/2026/05/ai_6a0af416c7c810.25943442-768x768.png 768w, https://pabloformoso.com/wp-content/uploads/2026/05/ai_6a0af416c7c810.25943442.png 1024w" sizes="(max-width: 300px) 100vw, 300px" /></p>
<h2>El Ídolo Central: Lo Diseñable</h2>
<p>Debajo de todo esto hay un ídolo. Es el ídolo más central, y merece ser nombrado claramente. Es el ídolo de <strong>lo diseñable como inevitabilidad</strong>. La creencia de que todo aquello que <em>puede</em> ser técnicamente intervenido <em>debe</em> poder serlo. Que la alternativa — aceptar algo como dado, recibir nuestras capacidades como un don en lugar de como un proyecto de ingeniería — es superstición. Es pasividad. Es conformismo.</p>
<p>Aquí es donde Michael Sandel, en <em>The Case Against Perfection</em>, ve la pérdida más honda. No es una pérdida de seguridad biológica. Es la pérdida de lo que él llama <em>giftedness</em> — la capacidad de recibir lo que somos como regalo, no como logro. Y cuando pierdes eso, pierdes algo que cuesta enormemente explicar hasta que lo ves desaparecer: pierdes la humildad, la gratitud, y lo más inquietante de todo, pierdes la capacidad de la solidaridad.</p>
<p>Porque si todo es diseño, entonces quien recibió menos no es un hermano con otra suerte. Es un defecto de fabricación.</p>
<p>Eso es lo que está en juego.</p>
<h2>La Tesis de lo Que Viene</h2>
<p>Este ídolo central — lo diseñable como inevitable — no está solo. Hay otros tres que lo acompañan, y juntos tejen una captura tan sofisticada que se presenta a sí misma como <em>elevación</em>. En los próximos posts vamos a nombrarlos. Vamos a ver cómo funcionan. Y vamos a hacer la pregunta que nadie hace en el discurso de la augmentación:</p>
<ul>
<li>¿Cuándo es una fusión comunión, y cuándo es captura?</li>
<li>Porque no toda síntesis es comunión. Algunas son captura disfrazada de elevación.</li>
</ul>
<p>Y eso es lo que el angelismo moderno — con su guía genética y su promesa de optimización sin límites — en realidad es: captura. Una bella, seductora, irresistible captura.</p>
<p>Pero captura, al fin.</p>
<hr />
<p><em>Próximo post: Los Ídolos de la Augmentación — Las tres ilusiones que cierran la trampa.</em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://pabloformoso.com/el-angelismo-moderno-cuando-el-cuerpo-se-vuelve-un-problema-tecnico/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">59</post-id>	</item>
	</channel>
</rss>
