U modelů se často řeší hlavně výkon. Anthropic ale pravidelně publikuje systémové karty, které přidávají druhou polovinu obrazu: schopnosti, rizika, limity a rozhodnutí okolo nasazení.
Proč na tom záleží
Když modely umí déle plánovat, programovat a pracovat s nástroji, firmy potřebují vědět víc než jen to, že model je schopný. Potřebují znát limity, ochranná pravidla a způsob testování.
Na co se ptát
Ptejte se na logování, přístup k datům, vypnutí rizikových funkcí, schvalování akcí a testování hraničních scénářů.