马斯克进入人工智能视频领域,收购初创公司,四位创始人耗时13个月打造类似Sora的创新模型

马斯克也要打造自己的视频生成模型了??


就在最近,xAI收购了一家视频生成初创公司,这家仅4个人的公司过去两年打造出了Hotshot这款产品。



马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


据公告介绍,Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。


一看这架势,网友们纷纷想起了老马在今年1月的一场直播活动中掷下的豪言:


预计将在几个月内发布Grok视频模型


而且就在Hotshot联创&CEO公布上述消息之后,老马也第一时间跑来卖关子:


酷炫视频AI即将到来!


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


期待值被拉满的同时,众人也齐刷刷表达了对Hotshot团队的祝贺:


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


那么,这是一家怎样的团队呢?为什么它能被马斯克“看上”?


答案这就揭晓——


4人团两年打造“Sora”


概括而言,Hotshot之所以能入老马的眼,原因显然在于两方面:


一是“小团队也有大能量”,据悉Hotshot团队一共只有4个人,但他们在13个月里连续训练出了3个视频生成模型,且获得了一定程度的用户关注;二是虽然成立不久,但投资者中不乏Reddit联合创始人Alexis Ohanian等大佬


从Hotshot官网公布的信息来看,这个4人小团队在两年时间里成功打造出了“Sora”模型。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


4人中有两位是联合创始人。


联创&CEO Aakash Sastry(右边),和另一位联创&CTO John Mullan(左边)早在2012年就相识了。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


认识之前,前者正在构建一个视频聊天应用,后者正在尝试打造视觉通讯应用(visual communication apps)。


不过,在看到Aakash Sastry的视频聊天应用失败之后(本以为是很酷的想法,结果可能因为理念超前,大家很害怕视频通话),两人一致意识到:


我们需要创造一个让人们在网上表达自己的同时,也感到舒适和自由的环境。


于是,Hotshot逐渐诞生了。


2017年,两人共同成立了一家公司——Natural Synthetics(Hotshot背后公司),开始构建各种不同的社交应用。


到了2023年1月,他们正式在iOS应用商店发布了Hotshot。


不过需要注意,Hotshot一开始并不是做AI视频生成,而是图片生成


基于开源的图片生成模型Stable Diffusion,Hotshot为用户免费提供个人、朋友甚至是名人的图片。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

△两位创始人在Hotshot应用中创建的图片


直到后来逐渐被视频生成吸引,因此他们又开始训练视频生成模型。


和之前类似,一开始他们也打算基于开源模型构建,不过后面意识到:1)基础模型需要大幅改进;2)为了自由构建引人入胜的用户体验,需要对底层模型拥有控制权。


于是,他们正式决定自研视频模型


在过去的13个月里,他们训练了3个不同的视频模型:


  • 第一个Hotshot-XL:耗时3个月开发,每秒生成8帧视频,开源后至今每月约有2万名新的开发者和艺术家使用;


  • 第二个Hotshot Act-One:耗时5个月开发,生成3秒8fps的视频,基于2亿个公开视频训练而成;


  • 第三个Hotshot:耗时4个月开发,生成最长10秒的720p视频,限文生视频。


按照Hotshot发布时的说法,在各种提示评估中,70%的情况下用户更喜欢Hotshot的结果,而不是其他开源文生视频模型。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


另外,从CEO Aakash Sastry公布的消息来看,Hotshot的投资者包括Stripe前高管Lachy Groom、Reddit联合创始人Alexis Ohanian以及SV Angel在内的风险投资机构。


至于具体融资次数和规模,Hotshot尚未公开披露,而且也不清楚整个Hotshot团队是否会集体加入xAI


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


马斯克想开发自己的视频生成模型?


事实上,早在今年1月,马斯克在一场直播活动中就透露了自研视频生成模型的想法:


(指路原推文视频15:02)


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


对于自家的Grok模型一直没有视频生成功能这事儿,老马本人和用户都不太满意。


而要解决这个问题,通常来说有两条路可走:


要么直接接入其他家模型,要么自研。


从Grok之前的一些倾向来看,他们主要选择第一种方案,比如其Grok-2的文生图功能,就是通过与此前备受瞩目的Flux深度融合实现。


然而现在,老马明显转向了。


为了和OpenAI、谷歌等展开长期竞争,xAI最终也是走上了自研之路,开始通过收购进一步布局。


不过不管怎样,对于我们普通用户来说,期待Grok的视频生成功能就完事了!


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型



参考链接:

[1]https://x.com/aakashsastry/status/1901668601364689338

[2]https://hotshot.co/




发表评论