#348 – IA en local y modelos (casi) open source

#348 – IA en local y modelos (casi) open source

Author: Nahuai Badiola y esther solà May 11, 2026 Duration: 55:42
Síguenos en: Seguimos con los monográficos dedicados a la IA y en este caso hablamos sobre cómo utilizarla en local y con modelos open source. ¿Qué tal la semana? Semana Nahuai Follow-up del episodio de la semana pasada. Le pasé a Claude la transcripción y le pregunté si había dicho algún dato incorrecto y el único que me rebatió fue el escaneo y destrucción de libros por parte de Anthropic. Pero  una simple búsqueda web arroja decenas de enlaces sobre el proyecto Panama. ¡Ojo! Lectura recomendada, parcialmente relacionada. Implementando una restricción a contenido pasado personalizado en Restrict Content Pro. Última Meetup de WP Terrassa. Campus Connect en Lleida con charlas de Nilo, Ana y Celi. Además de un concurso de webs de los estudiantes. Tema de la semana: ¿Por qué correr LLMs en local? Privacidad: tus datos no salen de tu máquina Sin costes por token: sin APIs de pago ni límites de uso Modo offline: funciona sin conexión a internet Control total: elige el modelo, la cuantización y el contexto Descentralizar la tecnología y no contribuir al oligopolio de las big tech Herramientas principales LM Studio: interfaz gráfica, ideal para empezar, tiene chat integrado y servidor local. Ollama: orientado a terminal y desarrolladores, muy fácil de integrar con otras apps. Factores clave a entender Tamaño del modelo (parámetros) El número de parámetros (1B, 7B, 13B…) indica la "capacidad" del modelo Más parámetros = más calidad, pero más recursos necesarios Un modelo pequeño bien cuantizado puede superar a uno grande mal cuantizado Cuantización Proceso de reducir la precisión de los pesos del modelo para que ocupe menos memoria Q2/Q3: muy comprimido, baja calidad, pero cabe en casi cualquier máquina Q4_K_M: buena calidad con tamaño razonable Q6/Q8: casi calidad completa F16/F32: precisión completa Tipo de modelo Modelo denso: todos los parámetros se activan en cada inferencia. Es más predecible y estable, pero más exigente en recursos por parámetro. Mezcla de Expertos (MoE): solo se activan una fracción de los parámetros por token. Mucho más eficiente en velocidad y memoria. Velocidad de inferencia (tokens/s) Cuántos tokens genera el modelo por segundo En CPU suele ser lento (3–10 tok/s); con GPU dedicada puede ser 10x más rápido La RAM unificada de Apple Silicon es especialmente eficiente para esto Formatos de modelo GGUF: el formato estándar para correr modelos en local con llama.cpp (lo usan LM Studio y Ollama) MLX: formato optimizado por Apple para correr modelos directamente sobre Silicon, mejor rendimiento que GGUF en Mac. Ventana de contexto Cuántos tokens puede "recordar" el modelo en una conversación Contextos largos (32k, 128k) consumen más RAM aunque el modelo sea pequeño Reducir el contexto es una palanca útil si te quedas sin memoria Requerimientos de hardware Memoria RAM 8 GB: modelos de hasta 7B en Q4 (justo), mejor quedarse en 3B–4B para fluidez 16 GB: cómodo con modelos de 7B–8B en Q4-Q6, o 13B en Q3/Q4 32 GB: modelos de 13B–30B con buena cuantización, o 70B en Q2/Q3 64 GB+: modelos de 70B en Q4+ con buena velocidad En Apple Silicon la RAM unificada actúa como VRAM, lo que lo hace muy eficiente para inferencia local Código abierto vs. pesos abiertos Código abierto: se publican los pesos del modelo, el código y datos de entrenamiento. Pesos abiertos: solo se publican los pesos, puedes usar y modificar el modelo, pero no sabes exactamente cómo fue entrenado ni con qué datos. La mayoría de modelos llamados open source en realidad son open weight: puedes correrlos y afinarlos libremente, pero el proceso de entrenamiento sigue siendo una caja negra. Modelos de pesos abiertos recomendados (para programar) Local Qwen3.6 (Alibaba): familia orientada a coding agéntico con dos modelos locales: 27B denso (~17 GB en Q4) y

¿Es posible construir una carrera sostenible y libre como desarrollador especializado en WordPress? Freelandev-Vivir del desarrollo en WordPress explora precisamente ese camino, de la mano de Nahuai Badiola y esther solà. No se trata solo de código, sino de la realidad completa de gestionar un negocio digital independiente. A lo largo de cada episodio, comparten sin filtros sus experiencias como freelancers, detallando las estrategias que aplican, los obstáculos que encuentran y las soluciones que funcionan en su día a día. En este podcast escucharás conversaciones prácticas sobre cómo organizar proyectos, establecer tarifas y comunicarse con clientes, siempre con el ecosistema WordPress como telón de fondo, incluyendo temas avanzados como Genesis Framework y WooCommerce. Más allá de lo técnico, abordan el marketing digital necesario para hacerse visible, las herramientas que optimizan su trabajo y las decisiones que toman para mantener un equilibrio entre vida y profesión. Es una guía realista para quien quiera entender no solo el "cómo" se hace un desarrollo, sino el "cómo" se vive de él, construyendo una profesión a tu propia medida. Cada lunes, un nuevo capítulo ofrece reflexiones y tácticas directas desde la trinchera del desarrollo web independiente.
Author: Language: Spanish Episodes: 100

Freelandev - Vivir del desarrollo en WordPress
Podcast Episodes
#349 – Mantenimientos y licencias de plugins [not-audio_url] [/not-audio_url]

Duration: 30:15
Síguenos en: Puesta a punto de una web que no hemos hecho nosotros cuando entra en mantenimiento, ¿qué debemos tener en cuenta? ¿Qué tal la semana? Semana esther Semana corta por viaje Ajustes responsive para cliente y p…
#347 – Mis problemas con la IA generativa [not-audio_url] [/not-audio_url]

Duration: 1:10:18
Síguenos en: Nahuai lleva meses intentando formarse una opinión sobre la IA generativa y este es el primer intento de ordenar sus ideas. ¿Qué tal la semana? Semana esther Tareas varias para clientes, vulnerabilidades y m…
#345 – Convesio ficha al equipo de Sirvelia, con Amadeu Arderiu [not-audio_url] [/not-audio_url]

Duration: 37:55
Síguenos en: Amadeu Arderiu es ingeniero industrial de Barcelona y cofundador de Sirvelia, una empresa que desde 2016 se dedicó al desarrollo de plugins WordPress a medida junto a sus socios Joan Rodas y Albert. Comentam…
#344 – Mejorando cosas y retraso de WordPress 7.0 [not-audio_url] [/not-audio_url]

Duration: 44:23
Síguenos en: Parece que el lanzamiento de la próxima versión de WordPress va a retrasarse bastante, y mientras, nos dedicamos como siempre a probar y mejorar tanto productos como flujos de trabajo. ¿Qué tal la semana? Se…
#343 – WordPress Credits con Celi Garoe [not-audio_url] [/not-audio_url]

Duration: 33:19
Síguenos en: Gestora de proyectos, entre otros de WordPress Credits que es de los que nos viene a hablar hoy. ¿Qué es WordPress Credits? ¿Qué perfiles pueden aplicar para formar parte? ¿Cuantas instituciones, estudiantes…
#342 – Migrando a Codeberg [not-audio_url] [/not-audio_url]

Duration: 41:53
Síguenos en: De vez en cuando nos encanta probar cosas nuevas y buscar aplicaciones y servicios más alineados con nuestra ética y filosofía de trabajo... o simplemente para trabajar mejor y más rápido. ¿Qué tal la semana…
#341 – Malware y actualizaciones [not-audio_url] [/not-audio_url]

Duration: 27:36
Síguenos en: Pues eso, más malware y más actualizaciones de WordPress ¿Qué tal la semana? Semana esther Acabando arquitectura y diseño nueva web Ojo eliminando usuarios admin Más malware Semana Nahuai Actualizando Genesi…
#340 – WordCamp Madrid 2026 [not-audio_url] [/not-audio_url]

Duration: 41:41
Síguenos en: Hoy Nahuai nos explica su experiencia del pasado fin de semana en la WordCamp Madrid. ¿Qué tal la semana? Semana esther Hostings con restricciones de seguridad que ni su soporte conoce… Peleando con Elemento…
#339 – Probando Zed y MCP de Figma [not-audio_url] [/not-audio_url]

Duration: 37:02
Síguenos en: En una semana llena de imprevistos y micro-tareas de clientes, a Nahuai aún le ha dado tiempo de hacer pruebas con el editor Zed y los MCP de Figma ¿Qué tal la semana? Semana Nahuai Peleando con el personali…