Proces
Jak pracujemy, po kolei.
Cztery fazy. Każda kończy się czymś, na co można popatrzeć. Bez trzymiesięcznego discovery i deliverabli w PowerPoincie.
- 01
Discovery
Tydzień 1
Spotykamy się z operatorem (osobą, której pracę agent zmienia) i wybieramy jeden workflow z mierzalnym potencjałem. Wynik: jednostronicowy brief z metryką, którą ruszymy, zakresem i stałą ceną.
- 02
Projekt
Tydzień 2
Piszemy zbiór ewaluacyjny zanim napiszemy pierwszy prompt. 30–100 przykładów z realnych przypadków, ocenionych przez Twój zespół. Wynik: harness ewaluacyjny i score docelowy.
- 03
Deploy
Tygodnie 3–5
Budujemy agenta przeciwko zbiorowi ewaluacyjnemu, integrujemy go w Twoim stacku i stawiamy za feature flagiem. Wynik: deploy produkcyjny z obserwowalnością, dashboardami kosztów i kill switchem.
- 04
Iteracja
Na bieżąco
Cotygodniowy review metryki, cotygodniowe poprawki. Zostajemy, aż liczby się ustabilizują — albo aż nie będziemy Ci już potrzebni. Wynik: system, nie zależność.
Zasady, których nie zginamy
- Eval-driven. Jeśli czegoś nie zmierzymy, nie wypuścimy.
- Odwracalność. Każda zmiana cofalna w pięć minut.
- Obserwowalność. Instrumentujemy przed deployem, nie po.
- Własność. Po Twojej stronie jest człowiek, który odpowiada za workflow. Jesteśmy dodatkiem, nie magiczną skrzynką.
- Uczciwość. Jeśli LLM to złe narzędzie — powiemy to.