Proces

Jak pracujemy, po kolei.

Cztery fazy. Każda kończy się czymś, na co można popatrzeć. Bez trzymiesięcznego discovery i deliverabli w PowerPoincie.

01
Discovery
Tydzień 1
Spotykamy się z operatorem (osobą, której pracę agent zmienia) i wybieramy jeden workflow z mierzalnym potencjałem. Wynik: jednostronicowy brief z metryką, którą ruszymy, zakresem i stałą ceną.
02
Projekt
Tydzień 2
Piszemy zbiór ewaluacyjny zanim napiszemy pierwszy prompt. 30–100 przykładów z realnych przypadków, ocenionych przez Twój zespół. Wynik: harness ewaluacyjny i score docelowy.
03
Deploy
Tygodnie 3–5
Budujemy agenta przeciwko zbiorowi ewaluacyjnemu, integrujemy go w Twoim stacku i stawiamy za feature flagiem. Wynik: deploy produkcyjny z obserwowalnością, dashboardami kosztów i kill switchem.
04
Iteracja
Na bieżąco
Cotygodniowy review metryki, cotygodniowe poprawki. Zostajemy, aż liczby się ustabilizują — albo aż nie będziemy Ci już potrzebni. Wynik: system, nie zależność.

Zasady, których nie zginamy

Eval-driven. Jeśli czegoś nie zmierzymy, nie wypuścimy.
Odwracalność. Każda zmiana cofalna w pięć minut.
Obserwowalność. Instrumentujemy przed deployem, nie po.
Własność. Po Twojej stronie jest człowiek, który odpowiada za workflow. Jesteśmy dodatkiem, nie magiczną skrzynką.
Uczciwość. Jeśli LLM to złe narzędzie — powiemy to.