最近,YouTube频道WVFRM Podcast在其节目中邀请了OpenAI旗下文生视频模型Sora的核心团队成员进行访谈。
这三位负责人包括Bill Peebles、Tim Brooks和Aditya Ramesh,他们都是Sora项目的负责人。在访谈中,他们谈到了Sora何时可供用户使用的问题。他们表示,目前Sora仍处于获取反馈阶段,还没有成为一个完整的产品,因此短期内不会向公众开放。
负责人们还表示,他们目前没有确切的时间表来确定何时将Sora变成一个完整的产品。他们正在积极获取反馈,以确定如何改进Sora,但具体的改进方式还没有确定。
在谈到Sora的工作原理时,负责人们表示,Sora通过分析大量视频数据并学习生成逼真的视频。它的工作方法融合了GPT等大型语言模型和DALL-E等扩散模型的技术,其架构类似于介于这两者之间,更像是GPT的架构,但训练方式类似于DALL-E。
关于Sora的训练数据来源问题,负责人们表示不能透露太多细节,只是说明它是基于公开可用的数据和OpenAI授权数据的组合进行训练的。
此前的报道称,Sora能够根据文本快速生成相对高质量的视频,但业内人士认为,目前这类AI工具仍存在局限性,无法完全取代人类创作者的工作。
电影概念艺术家和插画师Reid Southen表示:“很多人说好莱坞完了,但我并不这么认为。好莱坞的制作流程非常复杂,这些视频也存在很多问题,尤其是时间一致性和额外肢体等瑕疵。”
本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/16054