Eval
评估看板
跑所有 dataset 的 case,看路由 / 合规 / 内容质量回归
0数据集·0用例总数·0历史运行
如何添加你自己的测试集
调 POST /api/v1/eval/datasets 即可注入私有 dataset;private dataset 仅当前租户可见。每次 Run 会写入 EvalRun,可用于回归对比。
跑所有 dataset 的 case,看路由 / 合规 / 内容质量回归
如何添加你自己的测试集
调 POST /api/v1/eval/datasets 即可注入私有 dataset;private dataset 仅当前租户可见。每次 Run 会写入 EvalRun,可用于回归对比。