var cid = "1611948".toString();
var czPay = localStorage.getItem('czpay');
if(czPay != null){
if(czPay.indexOf(cid)!=-1){
var pids = czPay.split(',')
for(let i=0;i
仅在2024年3月一个月,就有三个华人创立的 AI 视频生成创企获得了融资,而且融资额都过了千万美金。1、3月7日,总部位于英国伦敦的Haiper宣布产品上线,并已经完成1380万美金融资。Haiper 由两位曾供职于 Google 旗下 DeepMind 团队的华人工程师建立,提供免费的视频生成功能,最长可以生成2秒的高清视频,和最长4秒的标清视频。2、3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的 A1轮融资,而其视频生成产品 Pixverse 已在海外上线,生成视频的时长为4秒,2月份的网站流量已经达到120万。3、3月24日,据 The Information 报道,去年下半年,凭借让霉霉说中文视频火起来的 AI 数字人产品 HeyGen 正在进行一轮6000万美元的融资,由曾经投资过 Uber 和 Snap 的知名 VC Benchmark 领投,完成此次融资后,HeyGen 的总估值将达到4.4亿美元。再加上之前估值已达2-3亿美金的 Pika Labs。由华人建立的创企们纷纷入局 AI 视频赛道。而其实,“AI 视频融资热潮里华人密度尤其大”这个命题可以拆开去看,一个是 AI 视频的融资热,另一个是创业者里面的华人密度。微查宝不赚钱、还烧钱,AI 视频为什么京淘盒还会融资热,又为什么是3月份?AI 这一波的创业潮,给已经有点冷清的市场注入了活力。但一圈看下来,除了大模型驱动的 Chatbot,基本上就没有新的产品形态了,AI 只是在“赋能”各个领域,文字、图片、视频。a16z Top50AI 产品中的视频生成(蓝)和视频编辑产品(红)而在上述几个领域中,AI 视频生成产品的用户接受度最低。在 a16z 刚刚发布的2023下半年 Top50AI 产品榜单中,上榜的5款 AI 视频产品中,只有 runway 一款是以视频生成为核心功能的,其他都是刚需属性更强的视频编辑产品。runway 的流量走势图(23.9-24.2)而就算 runway 也在2023年12月网站流量达到峰值后,出现了明显下滑。这说明 AI 生成视频没市场吗,显然不是。按照赋能逻辑,AI 在某个领域落地,其潜在机会和规模,应该参考其服务的赛道。显然,视频的市场规模不小,简单粗暴点,就互联网头部的产品来看,视频产品,也比图片和文字产品“值钱”。而当前这种流量的下滑,是因为产品确实拉胯。截至2023年年底的 AI 视频生成产品|图片来源:a16z根据 a16z 的统计,绝大多数产品都只能生成5秒钟以内的视频,而像 Kaiber 和 Deforum 虽然可以生成十几秒的视频,但只限于动画风格。,时长00:52Runway、Pika、Pixverse 的对比视频 | 视频来源:微博而虽然,像 Runway、Pika,和后续切入市场的 Pixverse 生成的视频看上去很真实,也很酷炫。但是短短几秒钟时间+简单的镜头移动,对于绝大多数用户来说,除了体验一下之外,很难有使用场景。即便和一些创作者交流下来,他们也很难把这些 AI 产品融入工作流里面。在新鲜感过去后,访问量下滑也属合理。就网上的信息和与 AI 视频产品创始人的对话内容来看,大家普遍认为,目前的 AI 视频生成大概在 GPT-2时代,也就是说,有一定技术突破,但是视频生成的时长和质量,还没有到能够落地应用和商业化的程度。市面上几款常见模型的推理运算量估算,注:横坐标是输出内容的量,纵坐标是所需运算量,采用对数形式作图 | 图片来源:知乎没落地,更别提商业化了,但硬币的另一面,“烧钱”却是实打实的。从成本来看,Sora 的算力需求就比 GPT-4高出了好几个数量级。有网友根据 Sora 的公开数据做出了保守估算,训练 Sora 需要1.4万张 NVIDIA H100GPU 运行一个月,光这些芯片的价值就高达4.4亿美金......其他产品虽然可能不像 Sora 一样走“大力出奇迹”的路径,但是算力成本远超其他类别 AI 模型是肯定的。即便如此,赚不了钱、又烧钱的AI视频赛道仍受到了资本们的特别关注,2024年仅过了3个多月就有多达7款产品获得融资,总融资额达到2.18亿美金。背后的原因,也刚好如上所述。有市场、但供给都不太行,有心气的 VC 们还是愿意搏一把的,而3月份资本的密集出手,还多亏于 Sora 这样头部产品带来的“清晰信号”。具体来看的话,有市场,不只是上面说的 AI 落地到的视频赛道规模更大,还有 AI 视频模型更接近于 AGI 的一层逻辑。而很多从业者认为,AGI 如果真正实现,则很多细分领域的应用层机会就消失了,也就是谁先做出来,可能会形成比较强的流量聚集效应,从风险投资的角度,资本肯定愿意搏一下,也就出现了 AI 视频融资热。视频生成任务流程示意图,注:AI 在生成视频的过程中,一是要生成视频画面,这涉及 AI 视觉领域;二是需要理解并遵守 Prompt,这涉及自然语言处理;三是要保持视频的一致性、连贯性、合理性,这要求 AI 理解视频中的元素如何随时间变化及现实世界的物理规律,这考验 AI 综合学习及理解能力。此外,目前 Pika、Sora 等产品已经可以加入了声音生成的功能,AI 还需要保证画面、音频和文本描述的协调性。|图片由 ChatGPT 生成而这个热潮出现在3月份,则是因为技术路径相较于之前清晰了不少。技术路径收敛,AI 视频生成已走过了从0到1的探索阶段刷活跃2024年 AI 视频生成产品融资情况|数据来源:AI产品榜(aicpb.com),红色为创始人为华人的AI视频产品AI 这一波的融资,其实集中出现在3月前后,这与 Sora 这样通过摸索技术路径、实现了远高于之前同类产品的惊艳效果强关联。根据对前谷歌 VideoPoet 项目负责人蒋路的一篇采访,AI 视频生成有两个主要的技术路径 Diffusion 和 Transformer,前者是 AI 生图的主要技术路径,而后者则是 GPT 等大语言模型(LLM)的主要技术路径。在 Sora 出现前,在视频生成赛道中,两者被认为是泾渭分明的两条路径。90% 的研究者都在进行 Diffusion 路径的研究,但也有少量的研究者在做 Transformer 路径的研究,但基本上逃不出这两个方向。应用宝下载ipadSora 的技术示意图|图片来源:知乎而 Sora 的出现则让技术路线基本确定。Sora 是 Diffusion-Transformer 模型,等于把上述两种技术路径整合起来了。其中 Diffusion 的作用是细化和完善视频画面,而 Transformer 则用来处理和解析复杂的文本输入,并控制视频的逻辑连贯性。通过这种技术架构,Sora 可以按图像帧的时间序列来处理视频画面,就像 ChatGPT 按文字逻辑顺序处理文本一样。有创业者说,看过 Sora 的论文后发现,原来泾渭分明的两种路线完成了交汇。而 Pixverse 的创始人王长虎则说:“Sora 让我们坚定了前进的方向。”由于 AI 视频赛道目前的技术路径已经日趋清晰,免去了选错技术路径带来满盘皆输的风险。VC 虽然考虑收益,但更关注风险。又为什么是华人?AI 视频产品华人创业者的履历|信息来源:谷歌、领英看几位创始人的履历,在创业之前就专注于 AI 或视觉相关技术,都有海外名校学习或国际化大厂供职的经验,拥有开阔的国际视野。除了这两项“基础素质”,作为华人的他们对视频赛道,也有着自己的理解。在上一波互联网创业大潮中,视频,尤其是短视频赛道,是中国互联网企业优势所在,TikTok 已经成长为全球主流媒体之一,引得 Google、Meta 等社交巨头们竞相模仿。谷歌刷下载随着短视频占据了人们越来越多的注意力,互联网变现的2个印钞机也随之转动,广告和电商。根据2023年的数据,字节的广告收入折合553亿美元,排在国内主要互联网企业的第一位,总营收1200亿美元,排名第三。而在电商方面,2023年抖音电商的 GMV 在2.3万亿人民币左右(折合3220亿美元),在国内大概排在第四,海外的 TikTok Shop 有200亿美元。苹果ipad应用商店作为华人,对于此要更敏感一些。纵观几款三月份获得融资的几款华人 AI 视频产品,虽然发展阶段不太相同,但是都针对短视频相关的广告营销和电商生态进行了探索。Haiper 与京东合作的海报,合作宣布时间|图片来源:HaiperHaiper 的产品于3月7日上线,而在产品还未正式上线时,Haiper 就开始了应用场景的探索。首先,在1月24日,Haiper 宣布与伦敦艺术大学时装学院展开合作,用 AI 的能力将时装草图转化为动态视频,在成衣制成之前预览上身效果。而在2月9日 Haiper 宣布和京东展开合作,探索电商方向的应用场景。作为一款新生产品,Haiper 已经在为技术找应用场景了。而对视频、尤其是短视频商业化路径更清晰的认知,让 AI 视频赛道华人创业者们的发展路径看起来更接地气。以其中融资金额最高的 HeyGen 为例。HeyGen0-100W ARR数据和主要成就|图片来源:HeyGenHeyGen 在众多“形而上学”的视频模型创业公司里面,商业化能力是非常强的。收入数据来看,从2022年7月底上线算起,ARR 从0到100万美金,仅用时178天,而最近一次融资放出的消息,HeyGen2024年2月的预期 ARR 已经达到2000万美元了。回头去看,HeyGen 除了迭代技术之外,在场景上的探索也非常积极和接地气。HeyGen生成的AI演讲者|图片来源:HeyGen拼多多放单HeyGen 的主要功能是 AI 数字人生成和视频翻译,服务的是 AI 演讲视频场景。在上线之前,HeyGen 首先在线上协作平台 Fiverr 上提供演讲者视频制作服务来验证市场需求,在这个平台上,HeyGen 提供的数字人演讲服务比真人服务价格降低了90%,交付时间从1天缩短为了10分钟。通过这样的方式,HeyGen 找到了为服务买单的群体,电商卖家和内容创作者那样的小 B 用户。YouTuber 小薇Official channel教电商卖家如何使用HeyGen的视频|图片来源:GoogleHeyGen SaaS服务的合作伙伴|图片来源:SaaS genius而后,HeyGen 应该是想进一步去探索场景,锚定在企业宣传、内部管理和培训等能够用到 AI 视频的地方,来获取大客户。在2022年底,HeyGen 开始建立大客户团队,根据官网显示,Salesforce、amazon、NVIDIA 现都与 HeyGen 达成了合作。在验证需求并有小范围内传播后,而后才有我们看到的 HeyGen 在社媒上曝光(“让霉霉说中文”),进一步再引发媒体曝光,打响知名度。,时长00:51HeyGen 产品介绍视频的案例|视频来源:HeyGen官网在发展的过程中,HeyGen 将各项技术(Avatar、声音、视频翻译)设计成一个个模块,然后组合应用到不同场景里,而场景的探索也偏多样化,例如一些个性化的外联视频、教育类会用到比较多的相关视频、商品展示和宣传视频等等。“URL to UGC”功能海报(左),笔者生成的产品推广视频截图(右)|图片来源:X,HeyGen但从第一开始的市场验证到后期的场景探索,电商和推广也都被作为重点探索领域。例如,HeyGen 在4月17日推出了基于商品页面生成商品介绍视频的功能。用户只需上传一个商品或 App 的网站链接,HeyGen 就可以基于页面上的文字和图片,自行生成幻灯片和对应的视频脚本,在用户确认后,生成产品介绍视频,进一步简化工作流程。HeyGen 订阅页面,注:免费版 HeyGen只能生成1个视频,基本无法满足使用需求你还知道,华人创业者们在哪些 AI 相关赛道更活跃吗?欢迎大家在评论区和我们互动,我们也会视情况继续发布相关选题。
安智宝是主打效果的安卓应用推广平台。通过安智宝,用户可以通过自助方式 进行应用推广。作为效果性的推广平台,安智宝利用云技术智能的进行渠道匹 配,对渠道的高效利用,节约用户的每一分钱。用户可以精确的控制应用投放 每天的投放量、渠道质量(留存率等),做到覆盖广、活跃度高、控制精准。
Transformer要变Kansformer?用...
Llama 3细节公布!AI产品总监站...
是谁杀死了谷歌搜索?
萨姆·奥特曼带火Airchat,硅谷...
美国酝酿AI「登月计划」,陶哲...
Google Chrome突破性更新:一键...
独家|抖音猛攻产业带:最高返...
强大到不敢给普通人用!史诗级...
赚够2000万、买上海豪宅,李佳...
AI驱动增长的时代,广告投放有...
一两万的AIPC,只是噱头?
「AI选美大赛」能卷出多元审美吗?
月薪5000管46个群?不如用AI合...
“猫狗拼”等电商平台重仓短剧,...
“1元图书直播”泛滥,短视频电商...
视频号做团购,摸着抖音过河
李想还不进直播间?
激进式押注AI手机的厂商一大堆...
AI入侵播客圈!比真人配音还逼...
字节发布视觉基础模型ViTamin,...
Copyright © 2016 - 2020 anzhibao.com . All Right Reserved.
安智宝 版权所有