26
junio
2026

🤖 IA Weekly Digest #1 — Semana 26, 2026

posted in IA Weekly 8.48 AM

🤖 IA Weekly Digest #1 — Semana 26

Compilado el 26 de junio de 2026

El edge AI se pone a prueba con datos duros, Microsoft consolida su apuesta agentic, y la comunidad local LLM sigue exprimiendo hardware de consumo. Lo mejor de la semana: números reales, no promesas — y un runtime que empieza a ejecutar código.

🔝 Lo más importante de la semana

1. Edge AI Showdown: Raspberry Pi 5 vs Hailo-8 vs Jetson Orin Nano

Qué ha pasado: Joyce Lin pone a prueba tres configuraciones de hardware para edge AI con un objetivo claro: inferencia en tiempo real sin nube. Ejecuta el mismo modelo YOLO en una Raspberry Pi 5 base (~$80), una Pi 5 con acelerador Hailo-8 (~$150 total) y una NVIDIA Jetson Orin Nano ($250). Los resultados son contundentes: la Pi 5 sola apenas logra 5 FPS con throttling a 85°C, mientras que con el Hailo-8 salta a 77 FPS consumiendo solo 5W, y la Jetson Orin Nano alcanza 157 FPS sostenidos con latencia inferior a 7 ms.

Por qué importa: Este video demuestra con números que los aceleradores dedicados (NPU) son el futuro del edge AI de bajo consumo. El Hailo-8 ($70 extra sobre la Pi) da un salto de 5 a 77 FPS — una relación rendimiento/precio y rendimiento/vatio excepcionales. La Jetson gana en potencia pero su configuración es un dolor incluso para desarrolladores (firmware no documentado).

Para quién importa: Quienes montan sistemas de visión artificial, seguridad doméstica con Frigate NVR, automatización industrial ligera, o simplemente quieren entender qué hardware elegir para IA en el borde.

đź”— VĂ­deo completo (Joyce Lin)

2. Probé 3 modelos de IA local — y el más pequeño ganó

Qué ha pasado: Joyce Lin compara Llama 3.1 8B, Qwen 2.5 7B y Gemma 3 en un Mac Mini con Ollama usando una metodología de filtros impecable: open-weight → tamaño ajustado al hardware → cuantización aceptable. El ganador en razonamiento lógico fue Qwen 2.5 7B, resolviendo correctamente un puzzle de jarras de agua donde Llama falló con confianza pero sin coherencia.

Por qué importa: Confirma que el rango de ~7B parámetros es el punto dulce para hardware consumer. La destilación funciona, el tamaño importa más que la marca, y Qwen 2.5 7B debería ser el modelo por defecto para quien empiece con IA local hoy.

Para quién importa: Quienes quieren montar IA local sin depender de APIs, evaluar modelos antes de comprar hardware, o entender el equilibrio entre calidad y velocidad.

đź”— VĂ­deo completo (Joyce Lin)

3. Microsoft Agent Framework 1.0 — La fusión Semantic Kernel + AutoGen

Qué ha pasado: Microsoft lanza la v1.0 de su Agent Framework, unificando Semantic Kernel y AutoGen en un solo SDK para producción. AutoGen fue deprecatedado en abril 2026, dejando muchos tutoriales obsoletos. El nuevo framework no es un rebrand: es una reescritura que toma lo mejor de ambos mundos con guardrails y orquestación multi-agente.

Por qué importa: Si montas agentes en .NET, esto es tu nuevo punto de partida. Microsoft mata Autogen pero hereda su comunidad y lo integra en un framework con soporte empresarial real. Es la señal de que los agentes IA pasan de experimento a producto en el ecosistema Microsoft.

Para quién importa: Desarrollores .NET, equipos enterprise montando agentes, y cualquiera que haya invertido tiempo en AutoGen y necesite migrar.

đź”— VĂ­deo explicativo (Parthav AI)

🧭 Radar rápido

  • Flue: Claude Code como motor programable — Better Stack libera Flue, un framework open-source que toma el agent harness de Claude Code y lo hace totalmente programable. Menos fricciĂłn, más control. đź”— VĂ­deo demo
  • GLM-5.2 con speculative decoding en 4Ă— DGX Spark (GB10) — Un usuario reconstruyĂł con ayuda de Claude los mods que faltaban en la receta pĂşblica. Resultado: ~9.4 tok/s. Speculative decoding ya no es solo para grandes clusters. đź”— Reddit
  • CUDA vs ROCm vs Intel: Âżpor quĂ© no remontan? — Hilo incĂłmodo en r/LocalLLaMA: si los LLMs son tan buenos programando, Âżpor quĂ© ROCm e Intel no alcanzan a CUDA? Respuesta: documentaciĂłn fragmentada, bugs silenciosos, y una NVIDIA que cobra premium por «simplemente funcionar». đź”— Reddit
  • Multi-Agent Team con OpenClaw en Mac Mini — Brian Casel compra un Mac Mini dedicado exclusivamente a OpenClaw y monta 4 agentes IA especializados para gestionar su negocio. ProducciĂłn real, no demo. đź”— VĂ­deo

🎯 Mi lectura de la semana

Esta semana la IA local deja de ser promesa y se mide en FPS, tokens por segundo y grados centígrados. Lo más interesante no es un anuncio corporativo sino una youtuber poniendo tres piezas de hardware en una mesa y diciéndote exactamente cuánto puedes esperar de cada una. El Hailo-8 a $70 extra dando 77 FPS es el tipo de dato que cambia decisiones de compra. Mientras tanto, Microsoft hace lo Microsoft: absorber lo que funciona (AutoGen), matarlo, y renacerlo con nombre nuevo y backing empresarial. La comunidad local LLM sigue siendo donde ocurre la ingeniería real — no en los press releases.

Deja un comentario