ncodelab.

Proces

Jak pracujemy, po kolei.

Cztery fazy. Każda kończy się czymś, na co można popatrzeć. Bez trzymiesięcznego discovery i deliverabli w PowerPoincie.

  1. 01

    Discovery

    Tydzień 1

    Spotykamy się z operatorem (osobą, której pracę agent zmienia) i wybieramy jeden workflow z mierzalnym potencjałem. Wynik: jednostronicowy brief z metryką, którą ruszymy, zakresem i stałą ceną.

  2. 02

    Projekt

    Tydzień 2

    Piszemy zbiór ewaluacyjny zanim napiszemy pierwszy prompt. 30–100 przykładów z realnych przypadków, ocenionych przez Twój zespół. Wynik: harness ewaluacyjny i score docelowy.

  3. 03

    Deploy

    Tygodnie 3–5

    Budujemy agenta przeciwko zbiorowi ewaluacyjnemu, integrujemy go w Twoim stacku i stawiamy za feature flagiem. Wynik: deploy produkcyjny z obserwowalnością, dashboardami kosztów i kill switchem.

  4. 04

    Iteracja

    Na bieżąco

    Cotygodniowy review metryki, cotygodniowe poprawki. Zostajemy, aż liczby się ustabilizują — albo aż nie będziemy Ci już potrzebni. Wynik: system, nie zależność.

Zasady, których nie zginamy

  • Eval-driven. Jeśli czegoś nie zmierzymy, nie wypuścimy.
  • Odwracalność. Każda zmiana cofalna w pięć minut.
  • Obserwowalność. Instrumentujemy przed deployem, nie po.
  • Własność. Po Twojej stronie jest człowiek, który odpowiada za workflow. Jesteśmy dodatkiem, nie magiczną skrzynką.
  • Uczciwość. Jeśli LLM to złe narzędzie — powiemy to.