要求:
2.1 需要演讲类或有说话内容的视频(字幕和水印都不能有)
网爬或线下采集均可,网爬需提供对应url,线下采集要求授权。
注:采集方向参考国内外模特面试视频,电影中人物自述视频,面试综艺视频等。单人最多重复10次,但是要确保音频内容不一样,衣服或者场景至少有一个不一样。
2.2 视频要求
采集分辨率不低于1080P,时长不低于5秒,要求包含视频和音频信息,视频和音频时间戳对齐
2.3 采集人员要求
(1)每个视频仅采集一个人物
(2)外貌条件好
(3)人体成像清晰,人脸分辨率不低于300*300
2.4运镜要求
镜头稳定,无模糊&抖动,无需大范围运镜
2.5 背景要求
背景简单优先,如纯色(例如绿幕),或者背景纹理简单
2.6 噪声要求
无水印、字幕等干扰项
2.7采集准确率要求
符合采集要求的视频数据占比不低于98%。
音频文件必须要和视频时间戳对齐,不能出现偏离。
视频和音频均不能包含广告、涉黄、涉政、涉恐、枪支、毒品等违规内容。
需求总量:50万条