需要数字人视频数据

greg · 2025 年4 月 15 日 10:13

要求：
2.1 需要演讲类或有说话内容的视频（字幕和水印都不能有）
网爬或线下采集均可，网爬需提供对应url，线下采集要求授权。
注：采集方向参考国内外模特面试视频，电影中人物自述视频，面试综艺视频等。单人最多重复10次，但是要确保音频内容不一样，衣服或者场景至少有一个不一样。
2.2 视频要求
采集分辨率不低于1080P，时长不低于5秒，要求包含视频和音频信息，视频和音频时间戳对齐
2.3 采集人员要求
（1）每个视频仅采集一个人物
（2）外貌条件好
（3）人体成像清晰，人脸分辨率不低于300*300
2.4运镜要求
镜头稳定，无模糊&抖动，无需大范围运镜
2.5 背景要求
背景简单优先，如纯色（例如绿幕），或者背景纹理简单
2.6 噪声要求
无水印、字幕等干扰项
2.7采集准确率要求
符合采集要求的视频数据占比不低于98%。
音频文件必须要和视频时间戳对齐，不能出现偏离。
视频和音频均不能包含广告、涉黄、涉政、涉恐、枪支、毒品等违规内容。
需求总量：50万条