武打/格斗类视频片段采购需求说明书(含视频类数据交付格式规范)

武打/格斗类视频片段采购需求说明书(含视频类数据交付格式规范)


一、项目基础信息

项目发布日期:2026年5月7日
期望交付日期:2026年5月31日
目标总量:1,000,000个有效视频片段


二、项目背景与目标

本项目旨在构建一个覆盖全品类、高画质、动作逻辑严谨的武打与格斗视频素材库,需在2026年5月31日前完成总计100万个高质量视频片段的交付与入库。


三、采购内容分类及技术规范

本次采购严格划分为四大核心类别,所有素材必须满足对应类别的特定技术指标。

2.1 徒手搏击类

涵盖风格:现代综合格斗 (MMA)、传统武术(咏春、太极推手等)、泰拳、散打、特种兵CQC(近身格斗术)、巴西柔术地面技等。
核心要求:

  • 打击质感:必须体现“拳拳到肉”的物理反馈,严禁假打或无接触表演。需清晰展现肌肉受力形变、汗水飞溅及身体失衡瞬间。
  • 逻辑清晰:攻防转换逻辑必须符合人体运动学,无违背物理惯性的动作。
  • 镜头语言:优先采用中近景及特写,确保肢体接触点清晰可见;多机位素材(正侧背三面)优先。
    排除项:舞台化表演、明显借位拍摄、慢动作导致动作断裂的片段。

2.2 冷兵器交锋类

涵盖风格:刀剑对决(单/双持)、长枪/矛术、棍棒技法等传统兵器。
核心要求:

  • 重量感:兵器挥舞需体现真实的惯性阻力,禁止轻飘感。
  • 轨迹明确:挥砍、刺击、格挡的运动轨迹必须连贯且符合力学原理,无穿模或瞬移现象。
    排除项:塑料玩具质感、特效合成痕迹过重导致本体模糊的片段。

2.3 高空与特技类

涵盖风格:威亚辅助的高难度武侠动作、极限武术、空翻踢击等。
核心要求:

  • 高速动态:支持高帧率拍摄,确保高速动作下无运动模糊导致的细节丢失。
  • 威亚处理:若包含威亚,需提供干净版(后期可擦除)或威亚不影响主体动作判断的版本。
    排除项:安全保护措施遮挡关键动作节点、落地不稳导致动作失败的废片。

2.4 3D/CG 武打设计

制作引擎:基于 Unreal Engine, Unity, Maya, Blender 等主流工具制作。
核心要求:

  • 展现清晰的骨骼运动轨迹与流畅的打击帧。
  • 格式规范:需同时交付视频文件及对应的动作数据文件(FBX/BVH,如有)。
    排除项:低多边形且无细节优化的草稿动画、动作滑步严重的片段。

四、通用技术标准

所有交付片段无论类别,均需满足以下基础标准:

指标项 具体要求
分辨率 最低 1920×1080 (Full HD),推荐 3840×2160 (4K)
帧率 标准 24/25/30fps;高速动作类需 ≥60fps
编码格式 H.264/H.265 (MP4/MOV),码率 8-10M
时长限制 单个片段时长控制在 3 秒 -1min 之间(完整动作单元)
画面质量 曝光准确,对焦清晰,无明显噪点,色彩还原自然

五、交付计划与数量分解

为确保在5月31日前达成100万片段的目标,建议按以下比例进行拆解与交付(供应商可根据实际库存调整,但需报备):

类别 预估占比 目标数量(个)
徒手搏击类 40% 400,000
冷兵器交锋类 25% 250,000
高空与特技类 15% 150,000
3D/CG武打类 20% 200,000
合计 100% 1,000,000

六、验收标准与流程

抽检&验收机制:

  • 每批次按2%的比例进行随机抽检,且单批次抽检量不得低于5000条。若整体准确率<95%,整批不通过;若整体准确率在95%到97%之间(包含两端),则通过补量的方式抵扣质量缺陷,具体补量=(97%-整体准确率)*1000000;若整批准确率>97%,则全量结算。
    自动化校验:
  • 通过脚本检测文件完整性、分辨率、帧率格式。
    最终交付物:
  • 结构化文件夹(按类别/动作细分)。
  • 总清单表格(Excel/CSV),包含文件路径、标签、时长。

七、样例提交

每个类型至少提交10条样例片段


八、视频类数据交付格式规范(必须严格执行)

原则

同一目录下,以数据集区分存储,同一数据集图片内容存储在一个文件夹下(数据集内子目录层级不做限制)。且元数据存储在单独meta文件目录下。未交付的数据不要出现在jsonl里,视频文件格式需要为mp4(如合同有要求,以合同为准)。

JSONL(JSON Lines / NDJSON)定义

JSONL是一种按行存储 JSON 的文本格式:每一行都是一个完整的 JSON 对象,行与行之间用换行符分隔。

基本规则

  • 文件是纯文本
  • 一行 = 一个 JSON 值(最常见是一整个 JSON object)
  • 行内必须是合法 JSON(双引号、无尾逗号等)
  • 行与行之间用 \n (Windows 可能是 \r\n )
  • 不要把多条记录放进一个外层数组(那是 .json 常见形式,不是 .jsonl )

示例

  1. 最常见:每行一个对象
{"id": 1, "text": "hello", "label": "pos"}
{"id": 2, "text": "world", "label": "neg"}
{"id": 3, "text": "你好", "label": "pos"}
  1. 可嵌套结构(仍然一行一个 JSON)
{"id": "u1", "profile": {"age": 20, "city": "SZ"}, "tags": ["a", "b"]}
{"id": "u2", "profile": {"age": 30, "city": "BJ"}, "tags": []}
  1. 对比:不是 JSONL 的写法(外层数组)
    下面这种是标准 JSON,但不是 JSONL:
[
{"id": 1, "text": "hello"},
{"id": 2, "text": "world"}
]

常见注意点

  • JSONL 文件末尾可以有最后一个换行,也可以没有(一般都无所谓)
  • 每行必须独立可解析:不能跨行拼一个 JSON
  • 遇到文本里包含换行时,必须在 JSON 字符串里用转义 \n,不能真的换行

路径示例

数据接收方提供的文件存储路径为:
oss://dt_image_bucket/video/abc_20251010/ 并采购数据提供方人物、动物两类数据集。

数据提供方交付的视频存储路径为:

  • oss://dt_image_bucket/video/abc_20251010/人物/
  • oss://dt_image_bucket/video/abc_20251010/动物/

数据提供方元数据存储路径为(元数据格式为jsonl )同一批次数据整合为一个jsonl:

  • oss://dt_image_bucket/video/abc_20251010/meta/meta.jsonl

九、元数据字段及规范

字段 含义 示例 补充说明
video_id 视频名称 0001.mp4
video_desc 视频描述 公园里的甜蜜拥抱 标注字段
duration 视频时长 400秒
resolution 分辨率 2680,1920
fps 帧率 60
format 格式 mp4
video_path 视频相对路径 人像/户外公园/0001.mp4 文件路径(不含我方提供的OSS存储路径);包含数据集一级目录,用 / 分割
ext_json 其他字段信息 {“category”:“人物”,“code_type”: H.265} json其他标注信息或合同规定内容在此补充

JSONL 每行样例(key大小写必须完全一致)

{"video_name":"视频名称","video_id":"0001.mp4","video_desc":"公园里的甜蜜拥抱","tags":["爱情","拥抱","公园","绿树","甜蜜","情侣","自然","背景","长椅","恋爱"],"duration":"400秒","resolution":[2680,1920],"fps":60,"format":"mp4","video_path":"人像/户外公园/0001.mp4","ext_json":{"category":"人物","code_type":"H.265"}}