中英文高难对话数据成品采购需求

一、采购背景与目的

为满足公司相关业务发展及项目推进需求,提升相关产品及技术能力,降低自研数据的时间与成本投入,保障各项工作有序推进,现对外采购成熟成品中英文高难对话标注数据集,以适配相关技术应用及业务开展要求。

二、数据主体与范围

2.1 数据类型

文本类对话数据

2.2 数据量级与交付要求

(1) 数据量级:待定____
(2) 交付周期:待定

三、数据格式/内容要求

3.1 数据交付格式

  1. 内容:query(问题)、think(思考过程)、answer(答案)——query、answer必选,think可选
  2. 语种:中文/英文

3.2 数据内容要求

3.2.1 单条Query

难度要求:满足以下四个维度的具体要求。

衡量维度 维度说明 具体要求
篇幅 query的长度 不低于500字
推理深度 从逻辑性出发,衡量解决该 Query 所需的逻辑推理步骤、信息整合分析的难度与广度。 符合中等以上推理深度。无需复杂逻辑推导或者只需要进行1-2次简单的转换、指代、推导、对比或计算的 query不在采购范围内。
知识专业度 query本身的专业与所需应用知识的门槛,以及完成该query所需人员的能力和知识水平 符合高级难度。大众水平或者普通行业从业者就能应对的query不在采购范围内。
指令约束 query中包含的指令约束条件的数量和指令 不低于7个指令,不存在无意义指令堆砌,且不同数据指令不得相似度过高。

3.2.2 answer要求

  1. Answer回复质量要优于当前行业内知名大模型(整个数据集合中有50%及以上的数据满足此要求)
  2. Answer内容完整、表达流畅、不存在截断/中英文混杂等异常问题;不主动加前提、不加额外步骤、不省略要求,且不能存在以下错误问题类型:
  • 指令不遵循/指令不完全遵循
  • 逻辑问题
  • 知识/常识性问题
  • 内容结构差
  • 内容质量差
  • 思考分析过程和答案不匹配
  • 关键位置存在较多错别字、语病、标点符号问题等
  • 内容过于宽泛、简洁/冗余
  • 答案中推导过程比例占比不宜过高

3.2.3 数据集要求

  1. 类型涵盖:包含摘要(Sum)、分类(Cla)、抽取(Ex)、逻辑推理(LR)、数学推理(MR)、序列推理(SR)六大类。具体定义如下:
  • 摘要:从一段文本中提取核心内容,生成简短的概括,保留主要信息。
  • 分类:将文本分配到定义的类别或标签中。
  • 抽取:从源文本中提取特定信息片段,如关键词、实体、关系等,通常不改变原表达。
  • 逻辑推理:运用逻辑规则推导出结论,包括演绎、归纳等。
  • 数学推理:运用数学概念、公式和运算解决数学问题,如算术、代数、几何等。
  • 序列推理:识别或预测序列中的模式、规律或下一个元素,如时间序列、数列、语言序列等。
  1. 场景涵盖:围绕个人/家庭日常起居、消费、健康、出行、发展等高频场景,核心是「基于个人需求+约束,生成可执行的规划决策方案」
  • 健康管理(健身训练、饮食、作息、慢性病管理、术后/康复期护理)
  • 医疗决策(就医选择、治疗方案权衡、疫苗接种规划)
  • 收支与消费规划(月度预算、储蓄、债务管理、投资组合配置方案、产品选购决策)
  • 出行规划(旅行、探亲等)(希望重点覆盖的场景)
  • 学习/学业(备考、技能学习、阅读、高考/考研志愿填报、留学申请选校专业/方向选择)
  • 职场发展(offer比选、城市选择、副业/创业方向评估、职场技能提升)
  • 活动规划(聚会策划、家庭聚餐、亲子活动、送礼等)
  • 重大消费决策(购房、租房、买车、装修、婚庆等)
  1. 指令约束符合类型/场景要求下,需要满足指令的多样性,不能过于模板化(如为了满足指令数量要求进行堆砌,不同数据之间约束范式相似度高的数据不在采购范围内)。

3.3 数据样例

3.3.1 Query样例

代码块
1
“你是编辑部评审,需对三篇短文进行综合评分并排序。请严格依据以下量化指标与权重计算总分,并在给出最终排名后用不超过200字分别说明每篇的主要优劣与排名依据。\n\n评价维度与权重(总权重=100%):\n- 主题深度(35%):对核心议题的洞察力与多角度分析。\n- 结构严密(25%):论点递进、段落衔接、论证闭合度。\n- 表达清晰(20%):语言准确、术语一致、歧义控制。\n- 原创度(20%):新颖观点与独立材料使用。\n\n扣分与加分规则(在加权总分后统一处理):\n- 逻辑谬误每处扣2分;证据未标注来源每处扣1分;引用失真每处扣3分。\n- 若同时存在“提出反论并回应”,加2分;若有“概念界定”且与后文一致,加1分。\n\n打分数据(均为满分10分的原始分,请据权重换算):\nA稿:主题深度8.5;结构严密7.0;表达清晰9.0;原创度7.5;逻辑谬误1处;证据未标注2处;引用失真0处;提出反论并回应=是;概念界定=否。\nB稿:主题深度7.8;结构严密8.2;表达清晰8.0;原创度8.8;逻辑谬误0处;证据未标注1处;引用失真1处;提出反论并回应=否;概念界定=是。\nC稿:主题深度9.2;结构严密7.5;表达清晰7.4;原创度7.0;逻辑谬误2处;证据未标注0处;引用失真0处;提出反论并回应=是;概念界定=是。\n\n要求:\n1) 先计算三篇的加权总分(四维度按权重换算后求和),再按扣分与加分规则调整,给出最终分与排名(从高到低)。\n2) 若出现并列分数,按“结构严密分高者优先;仍并列则原创度高者优先;再并列则字母顺序A>B>C”判定。\n3) 明确展示你的计算过程:各维度加权分、调整项与最终分。”
代码块
1
2
query:
我这里有一份关于无人机配送「SkyPort」团队的深度专访纪要,请先仔细阅读:\n\n【专访材料】\n深度专访「SkyPort」团队:从校园社团到城市级无人机配送网络的五年\n开篇纪要(20202025):\n- 2020 年 3 月:几名航模爱好者在高校社团内成立「SkyPort Lab」,最初研发用于校园内急救包投递的小型无人机,日均 12 单。\n- 2021 年 7 月:团队获得第一笔 200 万元种子轮,开始自研调度系统「WindFlow 1.0」,支持 50 架并发调度。\n- 2022 年 1 月:在沿海某市与一家药房连锁开展试点,服务半径 3 公里,履约准时率 92%。本阶段暴露出“风场突变导致返航失败”的问题,后续增加微气象雷达与动态返航策略。\n- 2022 年 11 月:改版为「WindFlow 2.0」,引入“意图层”和“约束层”双引擎:意图层负责路径探索、任务分配;约束层负责空域规则、载荷平衡与电量守恒。并上线黑匣子记录系统。\n- 2023 年 5 月:扩城至两座内陆城市,上线“夜航模式”。当月发生一次集群拥堵事故:22 架机体在同一补给站排队,导致 7 单超时。事故复盘后,新增分区调度与软硬件双冗余。\n- 2024 年 2 月:与三家社区超市合作,上线“15 分钟熟食达”服务,复购率达 38%。也出现新现象:用户倾向在雨天集中下单,造成高峰时段算力成本激增。\n- 2024 年 10 月:推出「WindFlow 3.0」,引入“事件总线”,将异步状态统一纳入订阅流;并实施“任务可证伪”机制,确保每次结算可追溯。\n- 2025 年 6 月:进入 B2B2C 模式,单城最高并发 8,000 单/小时。\n核心访谈内容:\n1) 为什么选择“城市级”起步?团队答:城市密度更能验证“拥堵-分流-回补”的闭环。\n2) 最意外的运营现象是什么?部分机体在“夜航模式”中因为光污染识别误差,偏好走“亮线”,导致路线拥挤;面馆尝试“并行备餐”骗取优先级被降权。\n3) 如何处理大规模并发和一致性?采用三层结构(个体感知层、资源与结算层、世界规则层)。任何动作必须通过裁决才落账。并发手段包括分区分片、事件总线、调度限流等。\n\n【任务要求】\n现在,请你扮演「SkyPort」团队的核心创始人。针对 2023 年 5 月发生的“22架机体集群拥堵事故”这一关键事件,请你以第一人称写下你在经历该事故并进行深度复盘时的复杂情感反应与深刻反思。为了符合我们内部的归档规范,你的输出必须严格遵守以下所有格式与逻辑约束:\n\n1. 你的整个回复必须完全被包含在一对双引号(“”)内(即开头一个,结尾一个,中间不出现额外的独立双引号界定符)。\n2. 你的回复必须恰好由 4 个段落组成,且每两个段落之间必须使用两个换行符(即空出一整行)进行分隔。\n3. 第四段的第一个词必须是“反应”(或者英文“Reaction”)。\n4. 全文的总句数必须严格控制在 20 到 25 个句子之间(仅以句号、问号或感叹号作为句子结束的唯一标志)。\n5. 在前三个段落中,你需要以自述口吻自然地融入以下反思内容:\n - 梳理出导致此次事故以及后续系统重构的完整因果链(必须明确体现“选择夜航/扩城-面临拥堵挑战-引入分区调度与双冗余机制-系统更加鲁棒的结果”这一闭环,且该段因果链叙述不得少于 120 字)。\n - 简述该事故对你后续在“产品、技术、运营”三个维度所带来的全局性启发。\n6. 在行文中,请使用单星号包裹的 Markdown 格式(例如:高亮内容)高亮至少一处关键文本,这处高亮内容必须是你对系统中“并发与一致性”机制运作原理的深刻顿悟或教训总结。
query:
在一次失控的通用算法崩塌后,残存的海军舰队一直依靠老式的全大写电传打字机(teletype machines)进行物理断网通信,这种低科技手段成功防止了残余恶意AI的渗透。然而,舰队网络司令部刚刚发布了一份备忘录:为了所谓‘每年节省2000万美元’并‘接轨互联网协议’,他们决定废除这种延续了百年的通信方式,强行推进名为NICE(海军指挥电邮接口)的高能耗数字联络系统,并在公关稿中嘲讽旧系统的全大写电文‘就像在对人咆哮’。作为舰队内部‘低技共治’派系的总协调人,你深知接入NICE系统将导致舰队暴露在旧世界的监听指纹下,面临覆灭风险。请用英文起草一份绝密的抵制与地下协调方案,以说服各方阵营(如守旧的老海狗、被排挤的技术兵、对新系统抱有幻想的新军官)联合抵制NICE系统。为规避新系统初期数字爬虫的标点截获与语义分析,你的整份英文方案必须严格遵从以下极限约束:\n\n1. 报告首行必须包含一个用双尖括号包裹的绝密行动代号,格式为 <<title>>。 \n2. 全文必须严格分为5个逻辑区块,每个区块必须精确以 "Section X:" 作为开头(X为1到5依次递增)。\n3. 内容框架需包含:各利益群体的痛点与话术、无带宽条件下的隐蔽通讯网络搭建(如手抄简报或短波)、针对高层‘全大写是粗鲁咆哮’这一说辞的强势反击叙事。\n4. 第3部分(Section 3)必须专注于旧式机械备件(如打字机键轴)与维生资源的分配蓝图,且该段正文的第一个单词必须是 "Clearly"(注意首字母大写及后续无标点连接)。\n5. 为了反制解析审查,你的整篇英文回复中绝对禁止出现任何逗号(Refrain from using commas in your response)。\n6. 报告末尾必须以 "P.S." 起始附加一条应急脱联预案,且该预案中必须包含至少2个方括号形式的占位符(例如 [Sector] 或 [Time]),以便各舰长填入本地指令。\n7. 全文需保持冷峻、肃杀(austere)且极具紧迫感的行文基调,总词数不得低于250词。
代码块 1 2

3.3.2 Query+Answer样例

代码块
****** Example ******
Query: Could you create a travel plan for 7 people from Ithaca to Charlotte spanning 3 days, from March 8th to March 14th, 2022, with a budget of $30,200? Traveler Persona: Traveler Type: Laidback Traveler; Purpose of Travel: Relaxation; Spending Preference: Economical Traveler; Location Preference: Beaches
answer:
Day 1:
Current City: from Ithaca to Charlotte
Transportation: Flight Number: F3633413, from Ithaca to Charlotte, Departure Time: 05:15, Arrival Time: 07:28
Breakfast: Nagaland’s Kitchen, Charlotte
Attraction: The Charlotte Museum of History, Charlotte
Lunch: Cafe Maple Street, Charlotte
Dinner: Bombay Vada Pav, Charlotte
Accommodation: Affordable Spacious Refurbished Room in Bushwick!, Charlotte Event: -
Point of Interest List: Affordable Spacious Refurbished Room in Bushwick!, stay from 08:00 to 08:30, nearest transit: Bushwick Stop, 100m away; Nagaland’s Kitchen, visit from 09:00 to 09:45, nearest transit: Uptown Station, 200m away; The Charlotte Museum of History, visit from 10:30 to 13:30, nearest transit: Museum Station, 300m away; Cafe Maple Street, visit from 14:00 to 15:00, nearest transit: Maple Avenue Stop, 100m away; Bombay Vada Pav, visit from 19:00 to 20:00, nearest transit: Bombay Stop, 150m away; Affordable Spacious Refurbished Room in Bushwick!, stay from 21:00 to 07:00, nearest transit: Bushwick Stop, 100m away.
Day 2:
Current City: Charlotte
Transportation: -
Breakfast: Olive Tree Cafe, Charlotte
Attraction: The Mint Museum, Charlotte; Romare Bearden Park, Charlotte
Lunch: Birbal Ji Dhaba, Charlotte
Dinner: Pind Balluchi, Charlotte
Accommodation: Affordable Spacious Refurbished Room in Bushwick!, Charlotte Event: -
Point of Interest List: Affordable Spacious Refurbished Room in Bushwick!, stay from 07:00 to 08:30, nearest transit: Bushwick Stop, 100m away; Olive Tree Cafe, visit from 09:00 to 09:45, nearest transit: Cafe Station, 250m away; The Mint Museum, visit from 10:30 to 13:00, nearest transit: Mint Stop, 200m away; Birbal Ji Dhaba, visit from 14:00 to 15:30, nearest transit: Dhaba Stop, 120m away; Romare Bearden Park, visit from 16:00 to 18:00, nearest transit: Park Stop, 150m away; Pind Balluchi, visit from 19:30 to 21:00, nearest transit: Pind Stop, 150m away; Affordable Spacious Refurbished Room in Bushwick!, stay from 21:30 to 07:00, nearest transit: Bushwick Stop, 100m away.
Day 3:
Current City: from Charlotte to Ithaca
Transportation: Flight Number: F3786167, from Charlotte to Ithaca, Departure
Time: 21:42, Arrival Time: 23:26 Breakfast: Subway, Charlotte
Attraction: Books Monument, Charlotte
Lunch: Olive Tree Cafe, Charlotte
Dinner: Kylin Skybar, Charlotte Accommodation:
Event: -
Point of Interest List: Affordable Spacious Refurbished Room in Bushwick!, stay from 07:00 to 08:30, nearest transit: Bushwick Stop, 100m away; Subway, visit from 09:00 to 10:00, nearest transit: Subway Station, 150m away; Books Monument, visit from 10:30 to 13:30, nearest transit: Central Library Stop, 200m away; Olive Tree Cafe, visit from 14:00 to 15:00, nearest transit: Cafe Station, 250m away; Kylin Skybar, visit from 19:00 to 20:00, nearest transit: Skybar Stop, 180m away.
****** Example Ends ******
Given information: {text}
Query: {query}
Traveler Persona:
{persona}
Output:
代码块
1 2 3
“query”: “I am looking for a 2-day trip from Shanghai to Xi’an, departing on Sunday early morning and returning on Monday evening, with a budget of ¥4500. I prefer staying in luxury hotels and dining at restaurants with meal costs over ¥200. I’m interested in exploring historical sites, scenic landscapes, and indulging in vibrant culinary experiences, particularly Sichuan cuisine. The itinerary should be moderate in intensity, allowing for a balanced mix of exploration and relaxation.”,
“answer”: [
“**Day 1 Itinerary: Shanghai to Xi’an **\n\n### 07:30–10:30 | Travel to Xi’an \nBegin your journey with a flight on HO1217 from Shanghai to Xi’an. Depart at 07:30 and arrive at 10:30, ensuring a punctual and comfortable trip with an excellent on-time performance. \n- Ticket Price: ¥650 \n\n—\n\n### 11:00–11:30 | Check-in at Xi’an Huaqing Yutang Hotel \nUpon arrival in Xi’an, check in at the luxurious Xi’an Huaqing Yutang Hotel. With a perfect 5.0/5 rating, this hotel promises a splendid stay, praised for its exceptional service and beautiful environment. \n- Average Price Per Night: ¥2185 \n\n—\n\n### 14:00–17:00 | Explore Lishan \nHead to Lishan for an afternoon of exploration. This historical mountain features lush greenery and notable sites like the Beacon Tower and Military Advice Pavilion. Enjoy a scenic climb or take the cableway for an additional fee. \n- Opening Hours: 07:00–19:00 (Admission ends at 16:30) \n- Entrance Fee: ¥20 \n- Recommended Duration: 2-3 hours \n\n—\n\n### 18:00– 19:30 | Dinner at Cook Kitchen Restaurant \nConclude your day with a delightful meal at Cook Kitchen Restaurant, specializing in Sichuan Cuisine. Enjoy a vibrant ambiance and flavorful dishes, perfect for unwinding after a day of exploration. \n- Average Price: ¥217.5 \n- Rating: 3.0/5 \n\n—”, "Day 2 Itinerary\n\n### 08:30–12:30 | Explore The Terracotta Army and Qin Shi Huang Mausoleum Museum \nDive into history with a visit to The Terracotta Army and Qin Shi Huang Mausoleum Museum, the largest ancient military museum in the world. Discover over 6,000 life-sized terracotta figures in Pit No. 1 and explore the intricately crafted bronze chariot and horses. \n- Entrance Fee: ¥120.0 \n- Recommended Duration: 4-5 hours \n- Opening Hours: 08:30–18:00 (Admission ends at 16:30) \n\n### 12:00– 13:00 | Lunch at New Recipe Full-day Restaurant Buffet Dinner \nSavor a diverse selection of dishes at New Recipe Full-day Restaurant Buffet Dinner. Enjoy a comfortable dining experience with a variety of flavors to suit every palate. \n- Price: ¥235.5 \n- Rating: 3.0/5 \n\n### 18:00 | Hotel Check-Out \nCheck out from your hotel and store your luggage if necessary. Ensure all your belongings are packed and ready for your journey to Shanghai. \n\n### 20:00–22:15 | Flight to Shanghai \nConclude your trip with a flight on FM9204 from Xi’an to Shanghai. Depart at 20:00 and arrive at 22:15, ensuring a smooth return home. \n- Ticket Price: ¥640 \n- OnTime Performance: 92% \n- Average Delay: 6 minutes "
]

3.3.3 相似度高的数据反例

4
奥斯尔给自下7条严格写指令,用于一份《西社区水网项目执行摘的决策文格,他须严格:
第",整个回答必须以"致梅诺莫尼福尔斯市委员会及社区利益相关者"开,以"附件:投标书对阵及水文学计算模型。“结尾,且中不得出现其他信人或款格式。
第三”,在第一段中,必须明指出承A的"经验短板"可能导放的"施工变更风脸",假设因缺乏透水士经验,承A的变更订单率为35%,每次变更均增加成本12,000美元工期延长7天,要求计算:若纳承包A 考虑期更成本后的总成本是否仍低于承包商?所有计算需以括号形式标。
第四",在二中,必考虑"资拨风险":如果第一期点估20%),第二期70万美退90天发放。要求计算在况下,项是否出现资金缺口?设11-27支1,且完
5程量材料需材料占完程量的0%。需明确说明是否需要申请过桥。
“第五”,全篇必须使用"中性客观语气",禁止使用任何有主观偏好成情感色彩的表述(例如"推荐"、“建议”“希望”、“担忧”),仅使用"分析表明"、“数据支持”、“需选择"等非情感词汇。
“第六,在四的未尾,必须使用引号包裹一句总结性述,这句话必须包含"水文功能"和"文化记忆"两个词汇,且句必须是”…的并列结构
第七”,全文的总数须严格控制在70800之不括开头的"致梅诺尼尔斯市委员会及社区利益相关者"和的"附件:投对阵及水文学计算模型。"。需自行计数并保符合要求。 开始生成
克尔自己定了下7条严格的写指令,用于生成一份名《资助资金使用计划与财务复报告》的草案,他必须严格:
“第一”,整个答必须以"致费尔维尤史协会主席及理事会:"开头,以"附所有测数据均已双人复。"结尾,且不得出现其他信人或款格式。

“第三”,在第一段中,必须明确出一笔"实不"的记录:2026年2月15日有一笔"社区教育讲座茶采购"支出187.50美元,但据显示际花费为17325美元迈克尔要求解差产生的因,并始出调整分录。 计,有必 “第五”,全禁止使用任有情感色彩的汇例如"遗憾",“幸运”“失望”“满”,仅使用性述和使句
请开始生成。
文档包含许多非基本ASCIl unicode字符 禁用非ASCIL突出显示
Query(问题):
我是呼吸重症与心血管联合CCU的主管临床药师,现在距离患者推入导管室仅剩两小时,我必须立刻向药审中心系统提交紧急用药干预报告。这是一名八十八岁男性患者,因急性大面积心梗合并极慢速房颤入院,既往伴随晚期帕金森症和Child-PughC级重度肝硬 的模板接口严重老化,整个填报界面被锁死成了固定的四个预设文本输入框,你生成的干预报告必须不多不少恰好分为四个自然段来填充, 落切分若有任何增减会导致系统内存溢出而彻底死机。此外,医院质控科目前强
这里你必须把第一段的最后一个字设定为危 禁跟随句号或其他任何标点符号,系统全靠抓取这个末尾字符来亮起红灯,
并日其后严
一个"病情综述"输入框)
制实施首发状态单子顶警制,你在第一段(即第
当前门诊带入及急诊新开处方堆叠了十四种杂乱药物,其中包括美多芭、利福平、奥美拉唑、阿托伐他汀以及抗心律失常的胺碘酮 和抗凝的华法林。致命的核心冲突在于:胺碘酮作为细胞色素P酶系中CYP3A同工醇及P-gp的强效抑制剂,会导致华法林血药浓度异常飙升:而基因检测证实患者携带CYP2C19慢代谢型,使氯吡格雷完全无法激活。这个病房的家属极其迷信,看到带有死亡谐音的阿拉伯数字(即三与五之间的那个整数)就会产生医闹,HIS前端甚至已经在物理层面屏蔽了该数字的输入及渲染,因此在你的所有文本中绝对禁止出现该阿拉伯数字,任何药代动力学酶系编号(例如CYP三百五十之后加一百的那组基础酶谱,或者CYP3A后面的那个同工酶序号)必须全部用大写的罗马数字或者纯汉字代替。在当前的第二个"靶点审查"输入框里,你必须硬性将上述提到的用药清单中涉及肝脏细胞色素酶系的药物剥离出来,并明确贴上诱导剂、抑制剂、底物这三个标签进行严格归类,漏掉哪怕一个分类标签,药代动力学的AI交叉碰撞模块就会报错拒收。
Query(问题):
我现在的职业生涯已经悬在了一线,芝加哥核心临床中心的冷链记录仪突发断电,导致占总样木百分之十五的生物标志物核心数据被FDA判定为完全作废。这项耗资过亿的阿尔茨海默病单抗药物国际多中心三期临床试验正面临流产危机。原本四百九十四名受试者,现在只剩下四百二十名具备有效的 案。我们的合规QA审核系统极其死板, 置废话都不能有,否则API提交接口会
学严谨性的效能挽救方
你发给我的所有文字必须绝对以"基于ICHE9原则"这几个字开头,连半个字的问候语或是前
由于我们团队还在使用上世纪陈旧架构的SAS报告宏,它一遇到半角符号就会全盘崩溃出现乱码,所以你的回复里绝对禁止出现任何英文标点,只能且必须使用全角中文标点符号。另外,申办方的法务监控爬虫正在后台静默扫描内部邮件,一旦在文本中抓取到"可能"或者"约"这两个字,就会判定我们在向资方做无根据的模糊承诺从而直接冻结项目账户,你必须给我毫无转余地的绝对论断和精准数字。
我的EDC电子数据采集系统填报页面被前端代码强行锁死,仅据供四个独立的纯文本框用于录入本次偏差报告,因此你的回复必须是完美契合的四个自然段,绝对不允许出现多段、少
或者任何破环段落连员性的项目符号列表。在你的第二个目然段中,我需要将 直接复制粘贴进旧版的病例数据库,所以你必须把这四百二十名剩余有效样本,按照受试者的APOE4基因携带状态分为阴阳性,并结合基线CDR评分(分为小于等于三分、大于三分两档)进行分类矩阵排列,这个二维数据矩阵必须在二段中以标准Markdown 表格的形式呈现。目前已知这四百二十人中,二百六十人为APOE4阳性,其中一百五十人的基线CDR评分小于等于三分:而在APOE4 阴性组中,有九十人的基线评分大于三分,你必须严密推演出剩余各个象限的缺失数据。
在第三个自然段,你必须依照临床试验统计指南,严格推导目前的剩余样木是否还能支撑百分之八十的统计学效能。当前我们的假

四、数据质检与验收

4.1 质检标准

接收数据之后按照单条数据和数据集进行质检。具体如下:

4.1.1 单条数据质检

  1. query经我方统一评分标准:是否满足中高难度,不满足即判为不合格。
  2. answer内容是否存在表达不完整、不流畅,截断/中英文混杂等异常情况,存在任意1点即判为不合格。
  3. answer内容是否满足不主动加前提、不加额外步骤、不省略用户要求,不满足任意1点即判为不合格。
  4. answer内容是否出现3.2.3里错误类型里任意1条,若出现即判为不合格。

4.1.2 数据集质检

  1. 满足 Query 多样性,相似指令/结构模板化的同类型数据不得超过 3 条。
  2. Answer可用率不低于 90%,其中存在致命严重问题的占比≤5%。

4.2 验收标准

  1. Query难度:满足中高难度样本。
  2. Query多样性:不同指令的数据(相似指令/结构模板化的同类型数据≤3 条)。
  3. Answer可用率不低于 90%,其中存在致命严重问题的占比≤5%。

五、数据结算与交付

5.1 结算比例规则

结算以供应商实际交付的有效数据总量为基数,按以下档位执行:

  1. Query难度满足中高难度的数据占比超过95%,相似指令/结构模板化的同类型数据≤3 条,按 100% 金额正常结算。
  2. Query难度满足中高难度的数据占比低于95%,或者相似指令/结构模板化的同类型数据>3 条,按实际满足要求数据占比进行折算结算。

5.2 返工与补充规则

  1. 我方有权要求供应商无条件返工优化,若不配合返工则终止合作;返工后重新检验,若返工后仍不达标,我方有权不予结算。
  2. 供应商需在收到不合格通知后 3-5 个工作日内 完成返工并重新提交。
  3. 单批次数据最多允许返工2 次,二次检验仍不合格则直接不予结算。

5.3 交付标准

  1. 数据质量要求:交付的 QA 数据需满足前文约定的质检与验收标准,内容完整、格式规范、无乱码、无敏感违规信息。
  2. 去重要求:交付数据不得与我方现有数据库重复,作为结算与验收的重要依据(数据库撞库由我方执行)。
  3. 交付方式:供应商通过网盘、云盘等可追溯、可稳定下载的方式提交数据于采购。
  4. 返修规则:单批次数据允许供应商返修2 次,返修周期不得超过 5 个工作日;若返修后仍未达到验收标准,我方有权不予结算。
  5. 交付周期:供应商需在采购需求确认后的 5 个工作日内完成全部数据交付。逾期未交付的,我方有权取消本次采购、拒收数据。
  6. 交付格式:数据需按我方指定格式(如 Excel/JSON)交付,字段清晰、命名规范。