Question 1

¿Trabajás solo con Claude o multi-provider?

Accepted Answer

Multi-provider por default. Claude como modelo primario de reasoning, OpenAI para embeddings o voz, open-source vía Bedrock/Azure para workloads específicos. Diseño la integración con una abstracción así podés cambiar o sumar providers sin reescribir features.

Question 2

¿Podés encargarte del setup de prompt caching?

Accepted Answer

Sí — esta suele ser la primera optimización que corro en integraciones existentes. Identificar contenido de prefijo estable, estructurar mensajes para cache hits, y medir la cache hit rate. Una integración bien cacheada puede cortar facturas 40-70% sin cambio de calidad.

Question 3

¿Qué onda con RAG / retrieval-augmented generation?

Accepted Answer

Stack completo: ingestión de documentos, estrategia de chunking, pipelines de embedding (OpenAI o Cohere), búsqueda híbrida (BM25 + vector), reranking, filtros de freshness y el eval harness para medir si realmente está mejorando en el tiempo.

Question 4

¿Construís agentes?

Accepted Answer

Sí, pero con cuidado. Los agentes que funcionan en producción tienen loops acotados, criterios de éxito claros, checkpoints humano-in-the-loop donde corresponde y observabilidad seria. "Que el agente lo resuelva" rara vez se envía — scopeo la autonomía del agente según blast radius.

Question 5

¿Podés auditar una integración existente?

Accepted Answer

Absolutamente. Problemas comunes que encuentro: falta de caching, loops chatty de agentes, vulnerabilidades de prompt injection, sin budgets de costo por usuario, retrieval que pierde porque los chunks son muy chicos. Entrego una auditoría por escrito con fixes priorizados — vos decidís qué implementar.

Question 6

¿Conocés el Claude Agent SDK y los managed agents?

Accepted Answer

Sí. Claude Code como harness, el Agent SDK para agentes custom, managed agents para ejecución offloaded. Puedo construir, extender o migrar entre estos según qué encaje con tu infraestructura y equipo.

Integrá Claude en tu producto — por un ingeniero que envía features LLM a producción.

Prompt caching y disciplina de costos

Tool use y agentes que no se loopean

RAG que recupera los chunks correctos

Multi-provider sin lock-in

El stack LLM con el que trabajo

Cuándo Claude es el provider correcto

Preguntas frecuentes

¿Necesitás Claude en tu producto, hecho bien?