微信扫描关注我们

2021 年数据空间的最新格局解读

在数据、机器学习和人工智能领域,今年是炙手可热的一年。

就在你认为它不可能再爆炸性增长的时候,数据/人工智能领域刚刚发生了:公司创建的快速步伐、令人兴奋的新产品和项目的发布、大量的风险投资融资、独角兽创建、IPO 等。

这也是多条线索和故事交织在一起的一年。

一个故事是生态系统的成熟,市场领导者达到了大规模并加大了对全球市场主导地位的雄心,特别是通过越来越广泛的产品供应。其中一些公司,例如 Snowflake,一直在公开市场上蓬勃发展(参见我们的MAD 上市公司指数),而其他一些公司(Databricks、Dataiku、Datarobot 等)已经筹集了非常大的资金(或者就 Databricks 而言) , 巨大的轮次估值达到数十亿美元,并正在敲响 IPO 的大门(请参阅我们的新兴 MAD 公司指数——这两个指数都将很快更新)。

但另一方面,今年也见证了新一代数据和机器学习初创公司的迅速崛起。  无论是几年前还是几个月前成立,许多公司都在过去一年左右经历了突飞猛进的增长。正如我们将要讨论的,部分原因是狂热的风投融资环境,更根本的是,部分原因是市场的拐点。

去年,关于人工智能未来应用(自动驾驶汽车等)的引人注目的讨论较少,因此人工智能炒作也少了一些。无论如何,数据和机器学习/人工智能驱动的应用程序公司继续蓬勃发展,尤其是那些专注于企业用例的公司。同时,很多动作已经发生在幕后的数据和ML基础设施方面,与整个新的类别(数据可观察性,反向ETL,指标商店等)出现和/或显着加速。

为了跟踪这种演变,这是我们的第八个年度景观和数据和 AI 生态系统的“联盟状态”——今年与我的 FirstMark 同事John Wu合着。(对于任何感兴趣的人,这里是之前的版本:2012 年、2014 年、2016 年、2017 年、2018 年、2019 年(第一部分和第二部分)和2020 年。)

对于那些多年来一直评论该图表有多疯狂的人,您会喜欢我们的新首字母缩略词——机器学习、人工智能和数据 (MAD)——这现在正式成为 MAD 版图!

多年来,我们了解到这些帖子的阅读人群非常广泛,因此我们试图为每个人提供一些信息——希望对大多数人来说是有趣且平易近人的宏观观点;然后是对数据基础设施和 ML/AI 趋势的更详细的概述,供更熟悉该行业的人使用。 

这个(长!)帖子的组织如下:

  • 宏观观点:理解生态系统的复杂性

  • 融资、IPO 和并购 

  • 2021 年的风景——对于那些不想向下滚动的人,这是高分辨率的风景图片

  • 数据基础设施的主要趋势

  • 分析和企业 AI 的主要趋势


宏观视角:理解生态系统的复杂性

让我们从市场的高层次视图开始。随着该领域的公司数量逐年增加,不可避免的问题是:为什么会发生这种情况?还能坚持多久?行业会经历一波整合浪潮吗?

倒带:大趋势

以前版本的读者会知道,我们一直看好数据/人工智能生态系统。

正如我们在前几年所说,基本趋势是每家公司都不仅成为一家软件公司,而且还成为一家数据公司。  

从历史上看,今天仍然在许多组织中,数据意味着存储在关系数据库中的交易数据,也许还有一些仪表板,用于对最近几个月发生的业务进行基本分析。   

但公司现在正朝着一个数据和人工智能嵌入无数内部流程和外部应用程序的世界迈进,用于分析和运营目的。这是智能、自动化企业时代的开始——实时提供公司指标,自动处理抵押贷款申请,人工智能聊天机器人提供 24/7 全天候客户支持,预测客户流失,实时检测网络威胁,供应链自动适应需求波动等。  

这种基本的进化已经在基础技术被搭载的巨大进步-特别是数据基础设施之间的共生关系,一方面,和机器学习和人工智能另一方。 

这两个地区都有自己独立的历史和选区,但在过去几年中越来越紧密地运作。第一波创新浪潮是2010 年代初的“大数据”时代,创新的重点是构建技术以利用每天产生的海量数据。然后,事实证明,如果你将大数据应用于一些已有十年历史的人工智能算法(深度学习),你会得到惊人的结果,这引发了当前围绕人工智能的整个兴奋浪潮。反过来,人工智能成为数据基础设施发展的主要驱动力:如果我们可以用人工智能构建所有这些应用程序,那么我们将需要更好的数据基础设施——等等。

快进到 2021 年,术语本身(大数据、人工智能等)经历了炒作周期的起起落落,今天你听到了很多关于自动化的对话,但从根本上说,这都是同一个大趋势。 

微信图片_20211101090352.jpg

大解锁

当今数据/人工智能领域的许多加速都可以追溯到过去几年云数据仓库(以及它们的 Lakehouse 表兄弟,稍后会详细介绍)的兴起。

具有讽刺意味的是,数据仓库解决了数据基础设施中最基本的、普通但也是最基本的需求之一:您将所有数据存储在哪里?存储和处理位于数据/人工智能“需求层次结构”的底部——参见 Monica Rogati 的著名博客文章——意思是,在你可以做任何更高级的东西(如分析和人工智能)之前,你需要具备什么。

你会认为,在整个大数据革命 15 多年后,这个需求很久以前就已经解决了,但事实并非如此。

回想起来,Hadoop最初的成功对这个领域来说有点虚伪——OG大数据技术 Hadoop 确实试图解决存储和处理层。它在传达可以从海量数据中提取真正价值的想法方面确实发挥了非常重要的作用,但其整体技术复杂性最终限制了其对一小部分公司的适用性,并且从未真正实现过市场渗透率即使是几十年前的旧数据仓库(例如 Vertica)。

今天,云数据仓库(Snowflake、Amazon Redshift 和 Google BigQuery)和 Lakehouses (Databricks) 提供了以一种有用的方式存储大量数据的能力,而不是完全成本过高,并且不需要大量技术人员维持。换句话说,经过这么多年,现在终于可以存储和处理大数据了。

这是一件大事,并且已被证明是数据/人工智能领域其余部分的重大解锁,原因有几个。

首先,数据仓库的兴起不仅大大增加了其类别的市场规模,而且还大大增加了整个数据和人工智能生态系统的市场规模。由于它们的易用性和基于消费的定价(即付即用),数据仓库成为每家公司成为数据公司的门户。无论您是全球 2000 强公司还是处于早期阶段的初创公司,您现在都可以轻松开始构建核心数据基础架构。(即使 FirstMark 是一家管理着数十亿人和 20 名团队成员的风险投资公司,也有自己的 Snowflake 实例)。

其次,数据仓库已经开启了围绕它们的工具和公司的整个生态系统:ETL、ELT、反向 ETL、以仓库为中心的数据质量工具、指标存储、增强分析等。许多人将这个生态系统称为“现代数据堆栈”(我们在2020 年版图中讨论过)。许多创始人将现代数据堆栈的出现视为启动新初创公司的机会,因此去年许多狂热的风险投资活动都集中在现代数据堆栈公司上也就不足为奇了。早期趋势(并在定义概念中发挥关键作用)的初创公司现在正在扩大规模,包括 DBT Labs,一家为分析工程师提供转换工具的供应商(请参阅我们的与 DBT Labs 首席执行官 Tristan Handy 和 Prefect 首席执行官 Jeremiah Lowin和 Fivetran(一家将数据流式传输到数据仓库的自动化数据集成解决方案提供商)的炉边交谈(请参阅我们与 Fivetran 首席执行官 George Fraser 的炉边交谈)最近筹集了大量资金(参见融资部分)。

第三,因为它们解决了基本的存储层,数据仓库解放了公司,可以开始专注于在数据需求层次中出现更高的高价值项目。既然您已经存储了数据,就可以更轻松地专注于其他事情,例如实时处理、增强分析或机器学习。这反过来又增加了对各种其他数据和人工智能工具和平台的市场需求。一个飞轮被创建,其中更以客户需求创建一个从数据和ML基础设施公司更多的创新。 

由于它们对空间有如此直接和间接的影响,数据仓库是整个数据行业的重要风向标——随着它们的增长,其余空间也随之增长。 

对于数据和 AI 行业来说,好消息是数据仓库和Lakehouse正在快速、大规模地增长。例如,Snowflake 在最近的第二季度业绩中显示了 103% 的同比增长,令人难以置信的净收入保留率为 169%(这意味着随着时间的推移,现有客户越来越多地使用和支付 Snowflake)。Snowflake的目标是到 2028 年实现10B 美元的收入。他们很有可能更快实现目标。有趣的是,采用基于消费的定价,即只有在产品完全部署后收入才开始流动,该公司当前的客户吸引力可能远远超过其最近的收入数字。 

这当然可能只是大数据仓库发展的开始。一些观察家认为,随着时间的推移,数据仓库和Lakehouse可以达到 100% 的市场渗透率(也就是说,每个相关公司都有一个),这对于以前的数据技术(如 Vertica 等传统数据仓库)来说是前所未有的(部署起来过于昂贵和繁琐)和 Hadoop(过于实验性和技术性)。

虽然这并不意味着每个数据仓库供应商、每个数据初创公司,甚至细分市场都会成功,但从方向上看,这对整个数据/人工智能行业来说是一个非常好的兆头。

泰坦尼克号冲击:Snowflake vs Databricks 

Snowflake最近一直是数据空间的典型代表。他们在 2020 年 9 月的IPO 是有史以来最大的软件 IPO(我们当时在我们的Quick S-1 Teardown: Snowflake 中对此进行了介绍)。在撰写本文时,经过一些起起落落,它是一家市值 95B 美元的上市公司。

然而,Databricks 现在正在成为主要的行业竞争对手。8 月 31 日,该公司宣布了一轮大规模的 1.6B 美元融资,估值为 38B 美元,距离 2021 年 2 月宣布的 1B 美元融资仅数月之遥(估值仅为 28B 美元)。

直到最近,Snowflake 和 Databricks 还处于相当不同的市场细分市场(事实上,它们一度是亲密的合作伙伴)。

Snowflake 作为云数据仓库,主要是一个数据库,用于存储和处理大量结构化数据——也就是说,可以整齐地放入行和列的数据。从历史上看,它已被用于通过插入商业智能(BI) 工具,使公司能够回答有关过去和当前绩效的问题(“我们上个季度增长最快的地区是哪一个?”)。与其他数据库一样,它利用SQL,这是一种非常流行且易于访问的查询语言,使其可供全球数百万潜在用户使用。

Databricks 来自数据世界的另一个角落。它于 2013 年开始商业化 Spark,这是一个开源框架,用于处理大量一般非结构化数据(任何类型的文本、音频、视频等)。Spark 用户使用该框架来构建和处理所谓的“数据湖”,他们可以在其中转储几乎任何类型的数据,而无需担心结构或组织。数据湖的主要用途是训练ML/AI应用程序,使公司能够回答有关未来的问题(“哪些客户最有可能在下个季度购买?”,即预测分析)。为了帮助客户处理他们的数据湖,Databricks 创建了 Delta,为了帮助他们处理 ML/AI,它创建了 ML Flow。有关那次旅程的全部故事,请参阅我的与 Databricks 首席执行官 Ali Ghodsi 的炉边谈话。

然而,最近,这两家公司已经相互融合。 

Databricks 开始向其数据湖添加数据仓库功能,使数据分析师能够运行标准 SQL 查询,并添加 Tableau 或 Microsoft Power BI 等商业智能工具。结果就是 Databricks 所说的“Lakehouse”——一个平台,旨在结合数据仓库和数据湖的优点。 

随着Databricks 使其数据湖看起来更像数据仓库,Snowflake 一直在使其数据仓库看起来更像数据湖。它于 2020 年 11 月宣布支持非结构化数据,例如音频、视频、pdf、图像数据,并在几天前推出预览版。

在Databricks 将 BI 添加到其 AI 功能的地方,Snowflake 正在将 AI 添加到其 BI 兼容性中。Snowflake 一直与顶级企业 AI 平台建立密切的合作伙伴关系。Snowflake投资 Dataiku,并将其评为年度数据科学合作伙伴。它还投资了 ML 平台竞争对手 DataRobot。

最终,Snowflake 和 Databricks 都希望成为所有事物数据的中心:一个存储所有数据的存储库,无论是结构化的还是非结构化的,并运行所有分析,无论是历史(商业智能)还是预测(数据科学、ML/AI)。

当然,不乏具有类似愿景的其他竞争对手。该云hyperscalers特别是拥有自己的数据仓库,以及用于商务智能和人工智能等诸多功能的分析工具全套,除了大规模。例如,收听有关  GCP 数据和分析功能的数据工程播客的这一精彩片段。

Snowflake 和 Databricks 都与云供应商建立了非常有趣的关系,既是朋友也是敌人。众所周知,在扩展到其他云平台之前,Snowflake 在 AWS(尽管 AWS 的竞争产品 Redshift)的支持下成长了多年。Databricks 与 Microsoft Azure 建立了牢固的合作伙伴关系,现在吹捧其多云功能以帮助客户避免云供应商锁定。多年来,直到今天,在某种程度上,批评者都强调,Snowflake 和 Databricks 的商业模式都有效地转售了云供应商的底层计算,这使得它们的毛利率受超大规模企业做出的任何定价决策的支配。  

观看云提供商和数据巨头之间的舞蹈将是未来五年的决定性故事。

捆绑、分拆、整合?

鉴于 Snowflake 和 Databricks 的兴起,一些行业观察家在问这是否是行业期待已久的整合浪潮的开始:随着大公司将越来越多的功能捆绑到他们的平台中,并逐渐使较小的初创公司变得无关紧要,功能整合,和/或公司合并,因为大公司购买较小的公司或将它们赶出业务。

当然,随着行业领导者的雄心壮志,数据和人工智能领域正在发生功能整合。正如刚才所讨论的,Snowflake 和 Databricks 以及云超大规模者显然就是这种情况。

但其他人也有大计划——随着他们的成长,公司想要捆绑更多或更多的功能——没有人想成为一家单一产品的公司。

例如,2021 年 6 月刚刚上市的流式数据平台 Confluent,想要超越其众所周知的实时数据用例,“统一处理动态数据和静态数据”(参见我们的快速 S-1 拆解:融合)。

再举一个例子,Dataiku* 本身涵盖了数十家专业数据和 AI 基础设施初创公司提供的所有功能,从数据准备到机器学习、DataOps、MLOps、可视化、AI 可解释性等,所有这些都捆绑在一个平台中,重点关注关于民主化和协作(请参阅我们与 Dataiku 首席执行官 Florian Douetteau 的炉边谈话)。  

可以说,“现代数据堆栈”的兴起是功能整合的另一个例子。从本质上讲,它是一组公司(主要是初创公司)之间事实上的联盟,作为一个组,它在功能上涵盖了从提取到数据仓库再到商业智能的数据旅程的所有不同阶段——总体目标是为市场提供一套相互整合的连贯解决方案。  

对于这些技术的用户来说,这种捆绑和融合的趋势是健康的,许多人会张开双臂欢迎它。随着它的成熟,是时候让数据行业超越其巨大的技术鸿沟:交易与分析、批处理与实时、BI 与人工智能。   

这些有点人为的分歧在数据生态系统的历史和技术限制中都有很深的根源。每个细分市场都有自己的挑战和演变,导致不同的技术堆栈和不同的供应商。这给这些技术的用户带来了很多复杂性。工程师们不得不将工具和解决方案的套件组合在一起,并维护复杂的系统,这些系统通常最终看起来像 Rube Goldberg 机器。  

随着他们不断扩大规模,我们预计行业领导者会加快捆绑工作,并继续推动诸如“统一数据分析”之类的信息。这对全球 2000 强公司来说尤其是个好消息,它们一直是更大的捆绑数据和人工智能平台的主要目标客户。这些公司既可以从部署现代数据基础设施和 ML/AI 中获得巨大收益,同时也可以更有限地访问顶级数据和内部构建或组装数据基础设施所需的 ML 工程人才(因为这些人才往往总体而言更喜欢在大型科技公司或有前途的初创公司工作)。

然而,尽管 Snowflake 和 Databricks 希望成为所有数据和 AI 的单一供应商,我们相信公司将继续与多个供应商、平台和工具合作,以最适合他们需求的组合。  

关键原因:创新的步伐在空间中太爆炸性,以至于事物无法长时间保持静止。创始人推出新的初创公司,大型科技公司创建内部数据/人工智能工具,然后将它们开源,对于每一种成熟的技术或产品,似乎每周都会出现一种新的技术或产品。即使是数据仓库领域,可能是目前数据生态系统中最成熟的部分,也有像 Firebolt 这样的新进入者,承诺具有非常优越的性能。  

虽然大型捆绑平台以全球 2000 家企业为核心客户群,但有一个完整的科技公司生态系统,包括初创公司和大型科技公司,它们是所有新工具和技术的狂热消费者,为它们背后的初创公司提供了一个很好的初始市场. 这些公司确实可以访问正确的数据和 ML 工程人才,并且他们愿意并且能够整合同类最佳的新工具来提供最定制的解决方案。 

与此同时,正如大数据仓库和数据湖供应商正在推动他们的客户将所有东西集中在他们的平台之上一样,数据网格等新框架出现了,它提倡去中心化的方法,不同的团队负责他们自己的数据产品。尽管存在许多细微差别,但其中一个含义是要摆脱公司将所有数据转移到一个大型中央存储库的世界。如果它成立,数据网格可能会对架构和整体供应商格局产生重大影响(本文稍后将详细介绍数据网格)。 

除了职能整合之外,目前还不清楚在不久的将来会发生多少企业整合 (M&A)。 

我们可能会看到一些非常大的、价值数十亿美元的收购,因为大型企业渴望在这个快速增长的市场上大赌注,以继续建立他们的捆绑平台。然而,当前市场科技公司的高估值可能会继续让许多潜在的收购者望而却步。例如,大家最喜欢的行业谣言是微软想收购 Databricks。然而,由于该公司可以在公开市场上获得 $100B 或更高的估值,即使是微软也可能负担不起。

整个市场上也有购买小型初创公司的强烈愿望,尤其是在后期初创公司不断筹集资金并且手头有大量现金的情况下。然而,风险资本家也有兴趣继续为这些较小的初创公司提供资金。如今,有前途的数据和人工智能初创公司无法筹集到下一轮融资的情况很少见。因此,如今完成的并购交易相对较少,因为许多创始人和他们的风险投资人希望继续翻下一张牌,而不是与其他公司联手,并且拥有这样做的财务资源。 

让我们进一步深入探讨融资和退出趋势。

融资、IPO、并购:疯狂的市场

任何关注创业市场的人都知道,那里很疯狂。  

根据CB Insights 的数据,风险投资以前所未有的速度部署, 在 2021 年第二季度全球同比增长157%至 $156B 。更高的估值导致仅在 2021 年上半年就创建了 136 家新成立的独角兽,IPO 窗口已经敞开,公共融资(IPO、DL、SPAC)在2021 年 1 月 1 日至 6 月 1 日期间与 2020 年同期相比。 

在这种市场势头的大背景下,数据和 ML/AI再次成为去年的热门投资类别。 

公开市场

不久前,在公开市场上市的“纯玩”数据/人工智能公司几乎没有。 

然而,在数据/人工智能领域IPO表现强劲的一年之后,该名单正在迅速增长。我们启动了一个公开市场指数,以帮助跟踪这一不断增长的上市公司类别的表现——请参阅我们的MAD 上市公司指数(即将更新)。

在 IPO 方面,特别值得注意的是UiPath,一家 RPA 和人工智能自动化公司,以及Confluent,一家专注于实时流数据的数据基础设施公司(有关我们的分析,请参阅我们的 Confluent S-1 拆解)。其他值得注意的 IPO 是C3.ai,一个人工智能平台(参见我们的C3 S-1 拆解)和Couchbase,一个非 SQL 数据库。

几家垂直人工智能公司也有值得注意的 IPO:   SentinelOne,一个自主的人工智能端点安全平台;  TuSimple,一家自动驾驶卡车开发商;Zymergen,一家生物制造公司;Recursion,一家人工智能驱动的药物发现公司;和Darktrace,“世界领先的网络安全人工智能”公司。

与此同时,现有的公共数据/人工智能公司继续表现强劲。  

虽然他们都没有创下历史新高,但Snowflake是一家强大的 95B 美元市值公司,而且,尽管存在争议,但在撰写本文时,Palantir是一家市值 55B 美元的公司。  

Datadog 和 MongoDB 都处于历史最高水平。  Datadog现在是一家市值 45B 美元的公司(对投资者来说是一个重要的教训)。  MongoDB是一家价值 33B 美元的公司,受到其云产品 Atlas 快速增长的推动。查看我们与 MongoDB 首席执行官 Dev Ittycheria 的炉边谈话。

总的来说,作为一个整体,数据和机器学习/人工智能公司的表现大大优于大盘。它们继续获得高溢价——在市值与收入倍数最高的前 10 家公司中,其中 4 家(包括前 2 家)是数据/人工智能公司。 

微信图片_20211101090359.jpg

资料来源:Jamin Ball,Clouded Judgement,2021 年 9 月 24 日

在 IPO 区域有一系列令人兴奋的公司,包括 Databricks、Celonis(参见我与 Celonis 首席执行官 Alexander Rinke 的炉边谈话)、Datarobot 和 Dataiku*。(请参阅我们的*新兴* MAD 指数,即将更新)。

去年公开市场的另一个显着特征是SPAC作为传统 IPO 流程的替代方案的兴起。事实证明,SPAC是人工智能市场中更“前沿技术”部分(自动驾驶汽车、生物技术等)的一种非常有益的工具,一些已经宣布或完成 SPAC(和 de-SPAC)交易的公司包括 Ginkgo Bioworks(设计新型生物以生产有用材料和物质的公司,在撰写本文时现在是一家价值 240 亿美元的上市公司)、自动驾驶汽车公司 Aurora 和 Embark,以及 Babylon Health。  

私人市场

风险投资市场的泡沫是另一篇博文的话题(只是宏观经济和低利率的结果?还是我们真正进入互联网部署阶段的反映?)。但可以说,在风险投资市场整体蓬勃发展的背景下,投资者对数据/人工智能初创公司表现出了极大的热情。  

根据 CB Insights 的数据,在 2021 年上半年,投资者已向 AI 初创公司投入了 38B 美元,超过了 2020 年 36B 美元的全部金额,还有半年的时间。这是由 50 多笔 1 亿美元以上的大型融资推动的,这也是一个新高。今年上半年,有 42 家人工智能公司达到了独角兽估值,而 2020 年全年只有 11 家。

2020-2021 VC市场不可回避的一个特点是跨界基金的崛起,如Tiger Global、Coatue、Altimeter、Dragoneer或D1,以及软银或Insight等其他大型基金。虽然这些基金一直活跃在互联网和软件领域,但数据和机器学习/人工智能显然是一个关键的投资主题。   

例如,Tiger Global 似乎喜欢数据/人工智能公司。就在过去的 12 个月里,纽约对冲基金对出现在我们领域的许多公司进行了大笔检查,例如:Deep Vision、Databricks、Dataiku*、Datarobot、Imply、Prefect、Gong、PathAI、Ada *、Vast Data、Scale AI、Redis Labs、6sense、TigerGraph、UiPath、Cockroach Labs*、Hyperscience* 等。

这种特殊的融资环境对创始人来说大多是个好消息。许多数据/人工智能公司发现自己成为先发制人和竞标战的对象,赋予创始人完全控制其筹款过程的权力。随着风险投资公司竞相投资,轮次规模和估值急剧上升。就在几年前,A 轮融资规模曾经在 800 万美元至 1200 万美元之间。它们现在通常在 1500 万美元到 2000 万美元之间。过去在 2500 万美元至 4500 万美元(投前)范围内的 A 轮估值现在通常达到 8000 万美元至 1.2 亿美元——这在几年前还被认为是 B 轮的绝佳估值。 

另一方面,资本的泛滥导致就业市场越来越紧张,许多资金雄厚的初创公司之间对数据、机器学习和人工智能人才的竞争激烈,相应的薪酬膨胀。

另一个缺点:随着风险投资积极投资于数据堆栈上下的新兴行业,通常押注于现有商业牵引力的未来增长,一些类别从新生到拥挤的速度非常快——反向 ETL、数据质量、数据目录、数据注释和 MLOps .   

无论如何,自从我们上次出现以来,数量空前的数据/人工智能公司成为独角兽,那些已经是独角兽的公司变得更加有价值,有几个十角兽(Databricks,Celonis)

一些值得注意的独角兽型融资(按时间倒序排列):ETL 公司 Fivetran 以 5.6B 美元的估值筹集了 5.65 亿美元;数据集成公司 Matillion 以 1.5B 美元的估值筹集了 150 美元;图数据库提供商 Neo4j 以超过 2B 美元的估值筹集了 3.25 亿美元;数据湖库提供商 Databricks 以 38B 美元的估值筹集了 1.6B 美元;协作型企业 AI 平台 Dataiku* 以 4.6B 美元的估值筹集了 4 亿美元;DBT Labs (fka Fishtown Analytics),一家开源分析工程工具提供商,筹集了 1.5 亿美元的 C 轮融资;Datarobot,一个企业人工智能平台,以 6B 美元的估值筹集了 3 亿美元;Celonis 是一家流程采矿公司,以 11B 美元的估值筹集了 1B 美元的 D 系列;人工智能重型防御技术公司 Anduril 以 4.6B 美元的估值筹集了 4.5 亿美元的资金;用于销售团队分析和指导的人工智能平台龚以 7.25B 美元的估值筹集了 2.5 亿美元;Alation,一家数据发现和治理公司:1.1 亿美元 D 轮融资,估值为 1.2B 美元;人工智能聊天机器人公司 Ada* 以 1.2B 美元的估值筹集了 1.3 亿美元的 C 轮融资;Signifyd,一家基于 AI 的欺诈保护软件公司,以 134 美元的估值筹集了 2.05 亿美元;Redis Labs,一个实时数据平台:3.1 亿美元的 G 系列,估值为 2B 美元;Sift,一家以人工智能为先的欺诈预防公司,以超过 1B 美元的估值筹集了 5000 万美元;Tractable,一家 AI 优先的保险公司,以 10 亿美元的估值筹集了 6000 万美元;SambaNova Systems 是一家专业的 AI 半导体和计算平台,以 50 亿美元的估值筹集了 6.76 亿美元;Scale AI,一家数据注释公司,以 7B 美元的估值筹集了 3.25 亿美元;

网络安全 AI 公司Vectra以 1.2B 美元的估值筹集了 1.3 亿美元;  Shift Technology是一家为保险公司打造的人工智能优先软件公司,筹集了 2.2 亿美元;Dataminr,实时AI风险检测平台募集$ 475M; 欺诈检测公司Feedzai:融资 2亿美元,估值超过 1B 美元;Cockroach Labs * 是一家云原生 SQL 数据库提供商,以 2B 美元的估值筹集了 1.6 亿美元;Starburst Data是一个基于 SQL 的数据查询引擎,以 1.2B 美元的估值筹集了 1 亿美元的资金;K Health是一家以 AI 为先的移动虚拟医疗保健提供商:以 1.5B 美元的估值筹集了 132 美元;人工智能芯片制造商 Graphcore 融资:2.22 亿美元;福特,欺诈检测软件公司:1.25 亿美元,估值为 1.3B 美元 

收购

如上所述,鉴于市场火爆,MAD 领域的收购一直很强劲,但并没有像人们猜测的那样飙升。生态系统中前所未有的大量现金流动是双向的:越来越多的公司拥有强大的资产负债表来潜在地收购其他公司,但许多潜在的“目标”也有机会获得现金,无论是在私人/风险投资市场还是在公共市场,而且更少可能想要被收购。

当然,已经有几次非常大的收购:Nuance,一家公共语音和文本识别公司(特别关注医疗保健)正在被微软以近 20B 美元的价格收购(这使其成为微软有史以来第二大收购领英);Blue Yonder是一家面向零售、制造和物流客户的 AI 优先供应链软件公司,被松下以高达 8.5B 美元的价格收购;Segment是一个客户数据平台,被 Twilio 以 3.2B 美元的价格收购;Kustomer是一种使企业能够有效管理所有跨渠道客户交互的 CRM,被 Facebook 以 10 亿美元收购;和涡轮增压,一家“人工智能驱动的应用程序资源管理”公司,被 IBM 以 1.5B 到 2B 美元的价格收购。 

还有一些私募股权公司对上市公司的私有化收购:Cloudera,一个前飞扬的数据平台,被 Clayton Dubilier & Rice 和 KKR 收购,或许 Hadoop 时代正式结束;和了Talend,数据集成供应商,被布拉沃托马私有化。

出现在此 MAD 早期版本中的其他一些值得注意的公司收购:ZoomInfo 收购了Chorus.ai和Everstring;DataRobot 收购Algorithmia;Cloudera 收购了Cazena,Relativity 收购了Text IQ *;Datadog 收购了 Sqreen 和Timber *;SmartEye 收购了Affectiva;Facebook 收购了库斯托默;ServiceNow 收购了Element AI;Vista Equity Partners 收购了Gainsight;AVEVA 收购了OSIsoft;并且,美国运通收购了Kabbage。