文|脑极体


(相关资料图)

大家是不是对 GPT、对话式 AI、生成式 AI 之类的话题,已经有点审美疲劳了?

写这篇文章之前,我有点犹豫,究竟还要不要接着讨论 GPT 了。最终决定写,是觉得个人用户、开发者,以及正在紧锣密鼓训大模型的 AI 公司和云厂商,还是有必要提前琢磨一下这个事情——大模型能力要从云入端,究竟什么时候做、怎么做?

AIGC 热潮带来 Web 复兴,但大众更爱移动端

我们看到,大多数基于大模型的 AIGC 应用,都选择了 Web 端接入。

微软第一时间推出了带有对话(Chat)功能的必应(Bing),更新了 Edge 浏览器,嵌入到 Microsoft 365 应用中。国内,高校机构推出的 MOSS(复旦大学)、SegGPT(智源),企业推出的文心一言(yiyan.baidu.com)、通义千问(tongyi.aliyun.com),都要从官网入口访问。

图像和视频类的生成式 AI,比如 Midjourney、Stable Diffusion、DALLE2,以及视频平台 Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。

有业内人士认为,生成式 AI 带来了 Web 的复兴。

当然 , 市面上也有通过小程序、App 等访问的 AIGC 产品,大多通过调用基础模型的 API 来提供服务。

但受限于网络传输、算力等,领先的技术能力都不得不打折扣,比如只能生成很短的一句话文本,手机 app 的作图效果一般,加载速度很慢经常排队掉线卡顿……

这是因为大模型的大量计算,还是要通过云服务来完成,Web 页面的承载能力比较大,加载速度快,还不用考虑流量损耗。

所以,想体验大模型强大的能力,目前还是以 PC Web 端 + 云服务更佳。

但是,大模型的商业化潜力,还是在移动端。

大家可能都记得,去年底 AI 作图就火爆过,意间 AI 绘画、YUAN 初等多款具有 AI 作图功能的移动端小程序,用户量和付费激增。意间 AI 绘画的官方数据显示,上线不到两个月,用户量增长了 117 万人。

大部分人也都更希望,便捷、低门槛地体验 AIGC。要使用 GPT-4、New bing、DALLE 等应用,注册、登录、付费的一系列操作,都非常麻烦,劝退了不少人。

国内的大模型应用,移动端也明显很受期待。比如就有人抓住了 " 官方没有 app" 这个 " 时间差 ",造出了 " 文心一言 " 盗版 App,吓得百度赶紧出来声明:凡是在 App Store 和各种应用商店看到的 " 文心一言 "App 都是假的,凡是 " 文心一言 " 收费下载、付费会员都是骗子!

显而易见,场景化、轻量化的移动端应用,用户又喜欢,又能付费赚到钱,如果官方不搞,投机客 / 骗子都要来搞。

无论是从用户体验的角度,还是大模型服务普及化的需要,以及回收训练成本的商业化考量,移动端应用都是一块不能轻言放弃的阵地。

既然如此,为什么各大基础模型服务商,就是不早点抓住这个机会呢?我们什么时候才能用上和 Web 版一样强大的移动 AI 应用呢?

千呼万唤不出来,基础模型服务商在想啥?

基础大模型的服务商,比如 OpenAI、谷歌、百度、阿里以及各类研究院所,就是不去吃移动端应用这块蛋糕。

除了大家都知道的移动端侧计算能力限制之外,还有其他考量:

1. 产品。基础模型往往技术和能力比较超前,产品化不是最优先考虑的,尤其移动端应用要适配各种系统、机型、配置,更不可能投入太大的人力、物力。

OpenAI 的联合创始人 Sam Altman 就说过,ChatGPT 是一个糟糕的产品,只是这个产品蕴含着很大价值,所以人们愿意忍受。觉得 Web 不好用?那你先忍忍吧。

2. 用户。别看全民热议生成式 AI,但真正坚持使用并愿意付费的,还是一小撮早期客户,包括技术狂热者和专业人士,比如程序员、插画师。

他们大多会将生成式 AI 当作生产力工具,用于研究、编程、办公、设计、游戏制作、软件开发等,还要跟其他专业软件相结合来使用,比如生成图片之后再通过 Photoshop 增强,还是要用到 PC、一体机等设备,PC Web 端比移动 App 有更强的可编辑性,更能满足这部分群体的需求。

3. 商业化。目前基础大模型的商业模式,以 API 为主,需要一定的开发经验,更适合极客和开发者,深度开发集成部署等工作,很少会通过移动端来完成,所以模型服务商自然也就没有紧锣密鼓去适配移动端的动力。

大模型千帆竞渡,移动端是商业化必争之地

既然如此,为什么还要做移动端呢?一个很表层的答案是:大众需要。

能够真正引发全民体验热潮的,还是那些能够通过社交软件分享、小程序、App 等形式,低成本快速触达的能力,不需要什么 " 智能涌现 ",更在乎有趣、好玩。

往深了说,大模型技术被视为 " 新工业革命 " 的引擎,要发挥效应,必须将技术能力更好地集成到产品和服务中去。此时,移动端能够提供至少三重价值:

第一,规模落地。

中国互联网络信息中心发布第 51 次《中国互联网络发展状况统计报告》中,我国 10.67 亿网民,使用手机上网的比例为 99.8%,移动端用户已经远远超过了 PC 端的用户,要提升生成式 AI 的应用范围,移动端应用必不可少。

第二,商业潜力。

高科技行业的主流市场,是由 " 实用主义者 " 组成的,相比技术的前沿性、炫酷感,他们更看重技术解决方案的可靠、稳定、性价比、配套服务等。移动端的广泛普及度、即时访问、便捷低成本的优势,可以让 AI 以更短的路径触达用户,在移动端应用 AI 技术是大势所趋。

开发者眼中的 AIGC 应用是这样的:

(OpenAI 发布会演示的编程能力)

大众眼中的 AIGC 应用是这样的:

(某 GPT 类应用平台截图)

第三,市场壁垒。

大模型的商业化路径之一,是走向产业,走向 ToB,将大模型能力封装为 AI 解决方案,参与到千行百业的数字化、智能化进程中。

如今头部科技公司、云厂商都在炼大模型,很多直接对标 GPT-3.5,没有显著的差异化价值,很难与业界领先水平拉开差距。

云厂商要打开 ToB 市场,移动端应用工具与能力是非常有吸引力的。近年来,不仅消费类、服务型企业,在不断加强移动端侧的布局和产品能力,一些传统的企业和机构,比如工业制造、政务银行等,无论是在内部生产管理中移动化,也推出了更多移动应用来更好地服务终端用户。如果直接在云上端到端用好大模型,比如训练开发环节直接调用云端的大模型和 AI 算力资源,完成后,一键分发到智能手机等终端上,可以大大减少工作量。

互联网的演进之路,已经说明,无论 To B 还是 To C 行业,都在追求越来越集约精简的终端硬件、越来越低门槛的交互入口、越来越轻盈的软件应用。

所以说,大模型从云入端,是模型服务商实现商业化的必争之地。

从云入端,一条天路

高瞻远瞩如 OpenAI 和 DeepMind,照样有商业化的要求。赚钱嘛,不寒掺。可是,大模型由云入端,这个钱还真没那么好赚。非不为也,实不能也。

云计算、AI 能力要进入移动终端设备,所面对的是一条天路:

首先,一些大型的生成式 AI 应用,运行环境在云上,要经过网络传输,而移动端的设备能力、网络环境,是很多样且不稳定的,比如从 5G 蜂窝网络转移到室内宽带,或者在高架桥、地铁等特殊环境,都有可能让生成过程中断或失败,影响到端侧体验。

其次,生成式 AI 应用的计算量比较大,在端侧加载渲染运行时,比如智能手机 CPU 会有比较高的负载,出现卡顿、发热、电量损耗等情况,如果让 AI 改一篇文档画一张图就咔咔掉电,当然不能接受。

此外,把 AI 深度集成到业务中,必须通过云计算,而云端开发环境和端侧是不同的操作系统。这意味着,开发者要进行二次开发或迭代开发,完成之后才能进行不同终端下的触达,同事要考虑不同终端的兼容性,这就提升了 AI 云应用的风险成本、人力成本、时间成本。要保证集成之后的应用效果,需要云平台有一整套完整的产品服务和工具来支撑快速搭建、验证、部署分发。

另外,云侧和端侧的架构不同,也导致算力割裂,云端一体的 AI 应用开发要充分结合端侧算力和云上算力,一部分应用场景搭建在端,一部分搭建在云,这就给云厂商带来了比较大的技术难题:如何提供稳定一致的底层环境?

天路难行亦需行。大家都知道,云计算靠基础设施 IaaS 层是很难赚到钱的,云厂商炼大模型,本质上是希望提升软件的先进性,进而调动 SaaS 服务的商业价值。

要让个人用户和企业,都得到简单、易用、低门槛的大模型能力,云厂商不仅要训练基础模型,还需要在产业链上游,就解决 AI 应用从云到端的一系列技术难题,为开发者和产业用户提供移动 AI 开发能力,才能让大模型在端侧爆发。

各种形态的大模型应用百花齐放,这个新技术才能真正迎来商业化的奇点。

推荐内容