量级要求: 50w
语言要求:中英文均可,只要纯文本试题,如果题目包含图片,则不需要
质检要求(相关质检模型请查看需求后附件内容):
- 正确性要求:题目和答案严格对应,确保问题可用性和答案正确性。分批交付,每批次抽检500题且正确率要达到99%;
题目类型要求:根据逻辑题分类模型 ,交付数据必须全部分类为逻辑推理类型
考点类型要求:需按照逻辑题考点分类 模型筛选并按照要求比例提供对应数据。
难度要求:根据逻辑题难度分类模型 筛选,共计四档:0,1,2,3,交付难度必须全部落在2,3档
相似题去重要求:根据提供minihash工具,提交题集需经过0.5 相似度的筛查;
质检执行流程
1)题型分类:题目是逻辑题 ->2)考点分类:对交付题型的考点多样性有要求-> 3)难度分类:难度需要在2、3档 → 4)去重:相似题过滤
交付数据查重
需支持数据查重,成品数据交付查重需在接到中选通知后3个自然日提供全量题干MD5和原始题干。如需通过模型筛选需提供交付计划。
交付说明:
格式为jsonl格式,必填字段如下:
| 字段名 | 内容 |
|---|---|
| q_id | 题号 |
| category | 逻辑题型分类(需填入题目分类模型执行后的分类信息) |
| category_sub | 二级分类名,中文文本,与题库例题对齐(需填入题目分类模型执行后的二级分类信息) |
| task_cls | 考点分类(需填入考点分类模型执行后的信息) |
| info | 字符串,填写供应商内部标定难度分类信息及其他信息。 |
| level | 题目难度等级(需填入题目难度分类模型执行后的难度信息) |
| question | 题目内容 |
| answer | 答案 |
| explanation | 解析 |
交付要求:我方会根据数据质量调整最终交付数量。
版权: 提供完整的授权链路说明
交付要求 :成品数据需在查重后7个自然日内交付,如需根据本单需求二次加工,请在试标时备注交付计划及其他情况说明。
执行流程
