🤖 IA Weekly Digest #1 — Semana 26
Compilado el 26 de junio de 2026
El edge AI se pone a prueba con datos duros, Microsoft consolida su apuesta agentic, y la comunidad local LLM sigue exprimiendo hardware de consumo. Lo mejor de la semana: números reales, no promesas — y un runtime que empieza a ejecutar código.
🔝 Lo más importante de la semana
1. Edge AI Showdown: Raspberry Pi 5 vs Hailo-8 vs Jetson Orin Nano
Qué ha pasado: Joyce Lin pone a prueba tres configuraciones de hardware para edge AI con un objetivo claro: inferencia en tiempo real sin nube. Ejecuta el mismo modelo YOLO en una Raspberry Pi 5 base (~$80), una Pi 5 con acelerador Hailo-8 (~$150 total) y una NVIDIA Jetson Orin Nano ($250). Los resultados son contundentes: la Pi 5 sola apenas logra 5 FPS con throttling a 85°C, mientras que con el Hailo-8 salta a 77 FPS consumiendo solo 5W, y la Jetson Orin Nano alcanza 157 FPS sostenidos con latencia inferior a 7 ms.
Por qué importa: Este video demuestra con números que los aceleradores dedicados (NPU) son el futuro del edge AI de bajo consumo. El Hailo-8 ($70 extra sobre la Pi) da un salto de 5 a 77 FPS — una relación rendimiento/precio y rendimiento/vatio excepcionales. La Jetson gana en potencia pero su configuración es un dolor incluso para desarrolladores (firmware no documentado).
Para quién importa: Quienes montan sistemas de visión artificial, seguridad doméstica con Frigate NVR, automatización industrial ligera, o simplemente quieren entender qué hardware elegir para IA en el borde.
2. Probé 3 modelos de IA local — y el más pequeño ganó
Qué ha pasado: Joyce Lin compara Llama 3.1 8B, Qwen 2.5 7B y Gemma 3 en un Mac Mini con Ollama usando una metodología de filtros impecable: open-weight → tamaño ajustado al hardware → cuantización aceptable. El ganador en razonamiento lógico fue Qwen 2.5 7B, resolviendo correctamente un puzzle de jarras de agua donde Llama falló con confianza pero sin coherencia.
Por qué importa: Confirma que el rango de ~7B parámetros es el punto dulce para hardware consumer. La destilación funciona, el tamaño importa más que la marca, y Qwen 2.5 7B debería ser el modelo por defecto para quien empiece con IA local hoy.
Para quién importa: Quienes quieren montar IA local sin depender de APIs, evaluar modelos antes de comprar hardware, o entender el equilibrio entre calidad y velocidad.
3. Microsoft Agent Framework 1.0 — La fusión Semantic Kernel + AutoGen
Qué ha pasado: Microsoft lanza la v1.0 de su Agent Framework, unificando Semantic Kernel y AutoGen en un solo SDK para producción. AutoGen fue deprecatedado en abril 2026, dejando muchos tutoriales obsoletos. El nuevo framework no es un rebrand: es una reescritura que toma lo mejor de ambos mundos con guardrails y orquestación multi-agente.
Por qué importa: Si montas agentes en .NET, esto es tu nuevo punto de partida. Microsoft mata Autogen pero hereda su comunidad y lo integra en un framework con soporte empresarial real. Es la señal de que los agentes IA pasan de experimento a producto en el ecosistema Microsoft.
Para quién importa: Desarrollores .NET, equipos enterprise montando agentes, y cualquiera que haya invertido tiempo en AutoGen y necesite migrar.
🔗 Vídeo explicativo (Parthav AI)
🧭 Radar rápido
- Flue: Claude Code como motor programable — Better Stack libera Flue, un framework open-source que toma el agent harness de Claude Code y lo hace totalmente programable. Menos fricción, más control. 🔗 Vídeo demo
- GLM-5.2 con speculative decoding en 4× DGX Spark (GB10) — Un usuario reconstruyó con ayuda de Claude los mods que faltaban en la receta pública. Resultado: ~9.4 tok/s. Speculative decoding ya no es solo para grandes clusters. 🔗 Reddit
- CUDA vs ROCm vs Intel: ¿por qué no remontan? — Hilo incómodo en r/LocalLLaMA: si los LLMs son tan buenos programando, ¿por qué ROCm e Intel no alcanzan a CUDA? Respuesta: documentación fragmentada, bugs silenciosos, y una NVIDIA que cobra premium por «simplemente funcionar». 🔗 Reddit
- Multi-Agent Team con OpenClaw en Mac Mini — Brian Casel compra un Mac Mini dedicado exclusivamente a OpenClaw y monta 4 agentes IA especializados para gestionar su negocio. Producción real, no demo. 🔗 Vídeo
🎯 Mi lectura de la semana
Esta semana la IA local deja de ser promesa y se mide en FPS, tokens por segundo y grados centígrados. Lo más interesante no es un anuncio corporativo sino una youtuber poniendo tres piezas de hardware en una mesa y diciéndote exactamente cuánto puedes esperar de cada una. El Hailo-8 a $70 extra dando 77 FPS es el tipo de dato que cambia decisiones de compra. Mientras tanto, Microsoft hace lo Microsoft: absorber lo que funciona (AutoGen), matarlo, y renacerlo con nombre nuevo y backing empresarial. La comunidad local LLM sigue siendo donde ocurre la ingeniería real — no en los press releases.