昆仑万维「天工」大模型开启内测，我们跟它聊了聊理想

国产 ChatGPT，能再迎一次惊喜吗？

来源 |AI 蓝媒汇

(资料图)

ID:lanmeih001

作者 | 伊柒

编辑 | 魏晓

" 每隔一段时间，就会有一个革命性的产品出现，然后改变一切。"

这是 2007 年 1 月 9 日，乔布斯在一次手机发布会上的开场白。手机名叫 iPhone，它改变了通讯、娱乐和移动互联网。之后，iPhone 或是和 iPhone 类似的手机，出现每个人的手中。

2022 年 11 月 30 日，由 OpenAI 研发的 ChatGPT 问世。

在最初的描述中，ChatGPT 被称为 " 聊天机器人程序 "，但人们发现这个 AI 能做的不只是 "Chat" ——之后的几个月，人们陆陆续续将它接入各种场景：答疑、编程、绘画、翻译、文本创作、广告设计、头脑风暴……然后震惊于 AIGC 的想象力、创造力和生产效率。从聊天到创作，或许在 2023 年之后，没有任何一个行业有理由完全排除 AIGC。

此时此刻，恰如彼时彼刻。

但也有不同——这一次，国内 AI 行业的跟进远比过去及时。百度、商汤等几位 AI 课代表很快推出了类似 ChatGPT 国产 AI 大模型，外界的质疑声中渐渐听到了掌声。

2023 年 4 月，昆仑万维「天工」3.5 大语言模型发布，并启动邀请测试。AI 蓝媒汇（ID：lanmeih001）的蓝媒君第一时间对话了「天工」大模型。

对话的内容，都和 " 理想 " 有关：

AI 大模型没说自己的理想，但它鼓励蓝媒君坚持理想—— " 记得不要因为挫伤自尊心而放弃。"

昆仑万维的理想—— " 目前版本我们对标的主要是 OpenAI 的 ChatGPT。未来让它尽快达到 GPT4 的能力。"

国产 ChatGPT，能再迎一次惊喜吗？

第一个实现 " 智能涌现 " 的国产大模型

在和「天工」大模型的对话中，蓝媒君预设了一个场景：中学老师与学生对话，目的是确定学生的兴趣。

对话过程如下。

蓝媒君确实曾和体育场里面的小朋友聊过这个问题，当时小朋友的回答是 " 喜欢跑步 "、" 觉得好玩 "。尽管在一开始就预设了问答模式，但「天工」大模型在实际对话中并没有完全遵循 " 每答必问 " 的结构——或许是算法判定蓝媒君 " 喜欢踢足球 " 这个话题已经讨论充分，可以作为 " 你的兴趣是什么 " 的答案。

蓝媒君提出了第二个兴趣，看书。

从这里可以看出，「天工」大模型依然延续着刚才关于 " 确定兴趣 " 的这个话题，并遵循了问答结构。

对话继续，蓝媒君的爱好很多。

「天工」大模型所给出的反馈始终直白，像是两位小朋友最日常的对话：你喜欢科学，那你会怎么做？

以上文本在成年人看来略显简单，但一问一答确实符合需求——「天工」的回答做到了逻辑通顺、推进沟通。而这种简单通顺，或许正是人们需要的。

或许整场对话难言十分惊喜，但至少从对话逻辑和内容上，「天工」基本做到了连贯通顺、符合人类逻辑。

在谈到大模型的逻辑推理时，昆仑万维称，「天工」目前的记忆力大约可支持 20 轮次以上的交互式问答，文本容量也在万字以上。

" 在 AI 领域，进行自主学习并完成逻辑推理等任务的能力，被称为‘涌现’能力。" 而根据昆仑万维 CEO 方汉的介绍，「天工」大模型是目前 " 国内第一个实现智能涌现 " 的国产大语言模型。

这是一个在相对简单的系统中，由量变产生质变，最终产生复杂的行为或特性的过程。

而根据官方提供的测试数据，基于千亿基座模型和千亿排序模型，「天工」大模型生成内容已经能够在某知识社区的问答中，获得 KOL 级的赞同和回应。

但「天工」偶尔也有失误的时候。

在另一份关于数学题的测试中，天宫大模型准确算出了一道鸡兔同笼题目，但却被另一道来自中学数学课本的一元一次方程困住，并最终得出了一个错误的计算结果。