数学竞赛难题采买需求

类型: 高中、大学数学竞赛题,只要中文题

采买量级: 5万道

需求及验收标准:

题型及比例

覆盖非选择题和选择题,量级比例为:80%:20%。非选择题是填空、解答题为主。不需要证明题,如数据为开源数据,请提前说明。

字段要求

题目(必填)、答案(必填)、解析(必填) 、题型(必填)、R1做错次数(必填,放入static info字段。字段名R1-error),其他字段按照文档要求提供。

只要纯文本试题,如果题目包含图片,则不需要

格式 :jsonl,字段要求参考附件。

查重

需支持数据查重,成品数据交付查重需在接到中选通知后3个自然日提供全量题干MD5和原始题干。如需通过模型筛选需提供交付计划。

质量

质量必须达标,提供的题干、答案、解析必须正确。不能有大量水印、无用html标签、语句不通顺、题目不完整、答案、解析缺失、latex公式错误、包含图片、题目和答案没有拆分等情况,题目和答案不能是大模型生成数据。

7. 题目难度及质检要求:

a. 难度必须是高中、大学对应的市级别、全国级别数学竞赛、奥林匹克竞赛、IMO等竞赛难题,竞赛真题、模拟题、练习题都可以。

b. 具体:需要供应商每道题调用4次DeepSeekR1-0528(更换抓取超参,一组超参按照官方默认参数配置,另外三组可以修改温度,上下波动0.1),然后和参考答案做正确性检验,去除R1 4次全做对的题。注意:调用R1-0528设置的最大输出长度要设置为64K

质检通过标准:

分批交付,每批次抽样不少于500条,正确率需要>=95%,备注:质量和难度都达标才算正确

版权:

提供完整的授权链路说明

交付要求

成品数据需在查重后7个自然日内交付,如需根据本单需求二次加工,请在试标时备注交付计划及其他情况说明。

执行流程