U modelů se často řeší hlavně výkon. Anthropic ale pravidelně publikuje systémové karty, které přidávají druhou polovinu obrazu: schopnosti, rizika, limity a rozhodnutí okolo nasazení.

Proč na tom záleží

Když modely umí déle plánovat, programovat a pracovat s nástroji, firmy potřebují vědět víc než jen to, že model je schopný. Potřebují znát limity, ochranná pravidla a způsob testování.

Na co se ptát

Ptejte se na logování, přístup k datům, vypnutí rizikových funkcí, schvalování akcí a testování hraničních scénářů.