Multi-agent CFO office · Reference buildOficina del CFO multiagente · Build de referencia

AI Finance Engineering

A multi-agent CFO office: 8 specialist agents plus an independent Audit agent over a shared, auditable state, with two-tier maker-checker sign-off. The deterministic math is validated against real public filings: 17 of 17 figures tie to dLocal's (NASDAQ: DLO) reported results. Una oficina del CFO multiagente: 8 agentes especialistas más un agente de Auditoría independiente sobre un estado compartido y auditable, con sign-off maker-checker de dos niveles. La matemática determinista se valida contra reportes públicos reales: 17 de 17 cifras atan a los resultados reportados de dLocal (NASDAQ: DLO).

AI Finance Engineering demo: a multi-agent CFO office from ERP to board pack, with a 17 of 17 validation against dLocal's public filings.
Live demo: the multi-agent CFO office, from ERP to board pack.Demo en vivo: la oficina del CFO multiagente, del ERP al board pack.
TypeTipo
Reference buildBuild de referencia
RoleRol
Architect & buildArquitectura y build
Stack
Python · Anthropic API · MCP · pandas
ValidationValidación
17 / 17 vs dLocal (DLO)
01

How it runsCómo corre

How AI Finance Engineering runs: agents propose, humans sign in two levels, and no LLM touches the math. Así corre AI Finance Engineering: los agentes proponen, los humanos firman en dos niveles y ningún LLM toca la matemática.

The problemEl problema

Finance operations demand deterministic accuracy: numbers must be correct, auditable and governed. General-purpose AI can't reliably produce financial figures without oversight, so how do you prove an agentic finance system is actually trustworthy? Not with a demo, but with evidence a CFO and an auditor can check.Las operaciones financieras exigen precisión determinista: los números deben ser correctos, auditables y gobernados. La IA de propósito general no puede producir cifras financieras confiables sin supervisión, entonces, ¿cómo se demuestra que un sistema financiero agéntico es realmente confiable? No con una demo, sino con evidencia que un CFO y un auditor puedan verificar.

The approachEl enfoque

Two-level orchestration: a CFO orchestrator coordinates the month-end close, an order-to-cash control tower and a bounded self-improvement loop, with two agents acting as sub-orchestrators. Everything runs under unified governance: maker-checker sign-off, hard reporting gates and an append-only audit trail.Orquestación en dos niveles: un orquestador CFO coordina el cierre de mes, una torre de control order-to-cash y un loop acotado de auto-mejora, con dos agentes actuando como sub-orquestadores. Todo corre bajo gobernanza unificada: sign-off maker-checker, compuertas duras de reporting y auditoría append-only.

  • Eight specialist agents. Controller, Treasury, Administration covering AR/AP/Tax, Accounting & Reporting, FP&A, Strategic Finance and Internal Controls, plus an independent Audit agent.Ocho agentes especialistas. Controller, Treasury, Administración cubriendo AR/AP/Impuestos, Contabilidad y Reporting, FP&A, Finanzas Estratégicas y Controles Internos, más un agente de Auditoría independiente.
  • Two-tier maker-checker. Each domain expert signs off first; the CFO gives the final consolidated approval. The AI is never both the one that initiates and the one that signs.Maker-checker de dos niveles. Cada experto de dominio firma primero; el CFO da la aprobación consolidada final. La IA nunca es a la vez quien inicia y quien firma.
  • Vendor-neutral finance layer. A custom MCP (Model Context Protocol) connector exposes the finance layer of a multi-entity SaaS, 6 legal entities and 6 currencies, as callable tools. ERP sources are swappable: QuickBooks, NetSuite, SAP, Odoo, Zoho.Capa financiera vendor-neutral. Un conector MCP (Model Context Protocol) a medida expone la capa financiera de un SaaS multi-entidad, 6 entidades legales y 6 monedas, como herramientas invocables. Las fuentes ERP son intercambiables: QuickBooks, NetSuite, SAP, Odoo, Zoho.
  • Verified 3 independent ways. Reconciliation against real public filings, adversarial synthetic traps with seeded errors, and an independent external review.Verificado de 3 formas independientes. Conciliación contra reportes públicos reales, trampas sintéticas adversariales con errores sembrados y una revisión externa independiente.

ArchitectureArquitectura

  • Shared auditable state. All 8 specialist agents plus the independent Audit agent work over one shared state, with SHA256-hashed immutable snapshots and an append-only audit trail.Estado compartido y auditable. Los 8 agentes especialistas más el agente de Auditoría independiente trabajan sobre un estado compartido, con snapshots inmutables con hash SHA256 y auditoría append-only.
  • MCP finance tools. Consolidated P&L, balance sheet, AR aging, cash position and multi-currency consolidation at period-close FX, all exposed as callable tools.Herramientas financieras MCP. P&L consolidado, balance, AR aging, posición de caja y consolidación multi-moneda al FX de cierre, todo expuesto como herramientas invocables.
  • Headline validation. Deterministic statement-level math reconciled to dLocal's (NASDAQ: DLO) reported FY2024/FY2025 consolidated results (IFRS, USD): 17 of 17 figures tie, 17 PASS, 0 FAIL, no LLM involvement in the math.Validación central. Matemática determinista a nivel de estados conciliada con los resultados consolidados reportados de dLocal (NASDAQ: DLO) para FY2024/FY2025 (IFRS, USD): 17 de 17 cifras atan, 17 PASS, 0 FAIL, sin intervención del LLM en la matemática.
  • Eval harness. 33/33 passing: Numbers 22/22, Extraction 9/9, Grounding 2/2, with a non-zero exit on any failure.Harness de evaluación. 33/33 aprobados: Números 22/22, Extracción 9/9, Grounding 2/2, con salida distinta de cero ante cualquier falla.
  • O2C control tower. 25 controls, 15 hard and 10 soft, exercised over 15 synthetic datasets with around 30 seeded errors each; hard gates block reporting on control failures.Torre de control O2C. 25 controles, 15 duros y 10 blandos, ejercitados sobre 15 datasets sintéticos con alrededor de 30 errores sembrados cada uno; las compuertas duras bloquean el reporting ante fallas de control.
  • Bounded self-improvement. Parameter calibration only, champion/challenger, never formula rewrites.Auto-mejora acotada. Solo calibración de parámetros, champion/challenger, nunca reescritura de fórmulas.

Verified outcomeResultado verificado

17 of 17 figures tie to dLocal's (NASDAQ: DLO) public filings, 17 PASS, 0 FAIL, with no LLM involvement in the math.17 de 17 cifras atan a los reportes públicos de dLocal (NASDAQ: DLO), 17 PASS, 0 FAIL, sin intervención del LLM en la matemática.

Deterministic statement-level math reconciled to reported FY2024/FY2025 consolidated numbers (IFRS, USD), plus a 33/33 eval harness and 25 controls exercised against seeded errors.Matemática determinista a nivel de estados conciliada con los números consolidados reportados FY2024/FY2025 (IFRS, USD), más un harness de evaluación 33/33 y 25 controles ejercitados contra errores sembrados.

Have a process like this one?¿Tenés un proceso como este?

A close that drags, a control tower nobody trusts, reporting that needs defending. Tell us where it hurts and we'll tell you honestly whether agents will pay off. Un cierre que se estira, una torre de control en la que nadie confía, un reporting que hay que defender. Contanos dónde duele y te diremos con honestidad si los agentes van a rendir.