3月14日,南都记者获悉,OpenAI首席技术官Mira Murati称该公司文生视频模型Sora计划年内发布,但还需“等到几个月后”,提示词政策将不允许生成公众人物影像。一周前,Sora项目研究负责人Tim Brooks刚刚指出,Sora不会很快发布,仍是“科研项目”。而针对大众关心的训练数据,Mira Murati则表示“不会作详细介绍”。
南都此前报道,当地时间2月15日,OpenAI官网发布文生视频模型Sora,能根据文字指令创建逼真而富有想象力的场景,生成长达60秒的视频,引发业内热议。
当地时间3月13日,OpenAI首席技术官Mira Murati在采访中称,该公司文生视频模型Sora计划年内发布,但还需“等到几个月后”。
这与当地时间3月8日Sora项目研究负责人Tim Brooks的说法略有出入。他在一档博客节目中提到,Sora目前仍是一个“科研项目”,不会很快发布,团队“目前没有关于何时将其转化为产品的时间表”。
两人都提到Sora目前生成视频“缺少声音”的问题。Mira Murati表示,团队正在着力解决音频问题,最终将整合音频技术,让场景更加真实。她同时指出,在2024年这个全球“选举大年”内,为规避不实信息问题,Sora的提示词政策将不允许生成公众人物影像。
此外,Sora所使用的训练数据来源问题也受到大众关心,OpenAI并非第一次陷入该类争议。南都此前报道,当地时间2023年12月27日,美国《纽约时报》对OpenAI和微软提起诉讼,指控这两家企业未经授权使用该媒体数以百万计文章训练ChatGPT等AI聊天机器人。
“该案或将带来对美国现有版权法的重大变革,”国际关系学院知识产权与科技安全研究中心主任郝敏曾向南都记者分析道,与此同时,美国作为一个判例法国家,该案的判决结果对后续AI行业的同类性质产品——如文生视频模型Sora——的治理也会带来“逻辑沿用”。
对该问题,Mira Murati表示“不会详细介绍所使用的数据,但它们都是公开可用或具备使用许可的数据”。她称,不确定是否使用了来自油管、脸书等社交平台的视频,但证实了Sora使用了来自图片库网站Shutterstock的内容。
据了解,此前,OpenAI曾就图像生成模型DALL-E训练与Shutterstock建立了合作伙伴关系,可使用Shutterstock庞大的图像、视频、音乐和元数据库来训练其模型。
采写:南都见习记者 肖玥