LLM 大海捞针测试

Needle-in-a-Haystack 召回率测试工具
01 — 生成测试集
02 — 评估结果
03 — 历史记录与图表
# 时间 模型 模式 上下文长度 插针数 准确率 正确 缺失 幻觉 答错 编辑距离 操作