Eval to produkt.
Jeśli nie umiesz zmierzyć 'lepiej', nie dojdziesz tam. Wszystko, co budujemy, zaczyna się od zbioru ewaluacyjnego, kończy score'em i jest poprawiane przeciwko ewalowi w czasie.
O nas
ncodelab to jednoosobowe studio automatyzacji AI (na razie), z bazą w Warszawie, pracujące z zespołami z Europy i USA.
Większość agencyjnej pracy z AI w 2026 to teatr: dema, które wow-ują zarząd i padają na produkcji, pipeline'y RAG halucynujące cytaty, agenci, którzy świetnie wyglądają na Twitterze i nawalają we wtorek. Założyliśmy ncodelab, żeby robić tę nieefektowną połowę pracy — ewaluację, obserwowalność, integrację, iterację — bo to ta połowa decyduje, czy system w ogóle dostarczy wartość.
Jeśli nie umiesz zmierzyć 'lepiej', nie dojdziesz tam. Wszystko, co budujemy, zaczyna się od zbioru ewaluacyjnego, kończy score'em i jest poprawiane przeciwko ewalowi w czasie.
Używamy modeli, promptów i narzędzi, o których słyszałeś. Nowość to zobowiązanie, gdy coś musi działać bez nadzoru o 3 w nocy.
Jeden workflow, jeden agent, jedna metryka. Potem kolejne. Wielkie projekty AI tak zwykle umierają.
Aktualnie: Tomasz Chmielarz — inżynier, dziesięć lat w produktach, były tech lead. Dobieramy współpracowników do projektu zamiast budować generyczną ławkę agencyjną.