返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 对话智谱AI CEO张鹏:我们不…
 深入探索人工智能数学基础的…
 “失语者”可用意念发声 AI+…
 中国银行2024校园招聘条件
 比亚迪看上了智能机器人赛道…
 放弃华为百万年薪创业“天才…
 「天才少年」稚晖君获比亚迪…
 2024年中国银行股份有限公司…
 百度文心一言率先面向公众开…
 2023光纤光缆品牌TOP10仅一省…
 Gartner:2023年数据安全五大…
 大连46级地震 山东吉林有震感…
 IFA2023:康佳R7系列电视等多…
 A股收评:创业板指跌047%光刻…
 华为云 人工智能赋能产业发展…
 英媒:高端芯片成人工智能竞…
 这家韩国芯片巨头靠人工智能…
 徐矿集团总医院: “人工智能…
 绝绝子奥威BI探寻式数据可视…
 景区门票销售系统可视化数据…
 新三板创新层公司邦正科技新…
 硬核实力!亿信华辰睿码主数…
 可视化大数据赋能多媒体展厅…
 智能家居行业加速迈入全屋智…
 梦幻色彩家居新风尚:强禾科…
 2023-2028年全球及中国智能家…
 2023-2029年中国智能家居行业…
 欧陆通2023年半年度董事会经…
 今年全球智能手机出货量预计…
 索尼看衰智能手机市场前景:…
 索尼表示将智能手机市场复苏…
 IDC:2023年Q1中国智能手机市…
 联想官方:我们才是全球最早…
 智能手表排行榜前十名2023!你…
 华为智能手表将取代苹果成为…
 智能手表测血氧靠谱吗? 专家…
 日本智能手表市场份额华为抢…
 【市场】华为第一Q2智能手表…
 北汽蓝谷:作为北汽新能源旗…
 阿维塔科技盛大亮相慕尼黑车…
 2023电动汽车智能底盘大会在…
 阿维塔CEO谭本宏:智能电动汽…
 智能网联新能源汽车产业集“…
 利用暑假备赛参赛挑战自我 三…
 日本展出高仿生女性机器人As…
 仿真机器人“进军”考古界
 中国机器人及人工智能大赛专…
 超仿真、能行走、会投篮………
 加油干、勇争先仁寿加快推进…
 赛格GPS新产品 车载终端SEG-…
专题栏目
网络
您现在的位置: 智能制造网 >> 人工智能 >> 正文
高级搜索
对话智谱AI CEO张鹏:我们不做中国的ChatGPT|36氪专访
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/9/7 11:48:06 | 【字体:

  安博士插件保护伞他们会按下电梯的这几层:17F,今年5月刚搬进了王小川的百川智能;2层和5层,盘踞着另一家估值超20亿美金的大模型公司:智谱华章(以下简称“智谱AI”)。

  相较于百川智能创始人王小川的自带光环,智谱AI的声量更多存在于AI圈子内。据36氪独家获悉,数月前,美团战投独家投资了智谱AI的B-2轮融资,金额达数亿元。

  “现在只有智谱AI挑投资机构的份。”一位上半年没有投进智谱AI的投资人告诉36氪。连王小川本人,也在2023年初踏进过智谱的门槛——“他们这些创业者,都想从智谱AI身上取经。”一名知情人士解释。

  不少圈内人给出的答案都是:自2019年成立,智谱AI就是“有人、有技术、有客户”的“完成时”企业。

  脱胎于清华KEG(知识工程实验室),智谱AI每个创始成员单拎出来,都是圈内叫得上名字的学者。比如CEO张鹏设计和研发的跨语言知识图谱系统XLORE,在国际上颇受好评。

  而智谱AI合作研发的超大规模预训练语言模型GLM-130B,是2022年亚洲唯一入选斯坦福评测的全球主流大模型。这个自研的大语言模型,也直接让智谱AI的名字,出现在百度、字节、360、有道等企业的合作名单中。

  今年6月,在硅谷科技媒体The Information的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一。

  “中国没有自己的预训练模型框架。”张鹏告诉36氪。市面上最主流的三种模型训练路径都出自西方:GPT来自OpenAI,BERT和T5都来自谷歌。若是照搬西方的主流路径,意味着中国企业已经失去了先发优势,弯道超车的机会渺茫。

  为了打破西方的路径垄断,智谱AI提出了全新的GLM(通用语言模型)路径。若GPT的原理可以被比作“根据上文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。

  时至今日,GLM的探索已经初见成效。“在硅谷,智谱AI的GLM应该是最被头部科技企业承认的中国大语言模型。”一名微软的算法工程师告诉36氪。

  为了更早推动AGI(通用人工智能)技术,智谱AI没有选择推出行业大模型,而是说服行业客户在通用大模型基座上做微调。

  “行业模型本质上是用大模型的壳,重复造了一遍传统算法的轮子。”张鹏指出行业大模型的局限性,“我们认为只有一定规模的(通用)大模型,才能实现类人的认知能力涌现。”

  36氪:智谱AI给人的感觉是手里盘的球很多,一边做技术研发,一边做行业落地,还能做一些企业服务。你们是怎么做到的?

  张鹏:人工智能本来就是一个综合性学科,如果研究的成果不能很快被应用,它的价值很可能被遗忘。所以在KEG,我们会把研究和工程放在相对平等的位置上。这个风格也延续到我们出来做公司。

  另一个因素是,在大模型时代里,产学研用这件事被极度压缩,表现为周期变短、距离变近。原来像神经网络、CV等技术从被学界研究出来,到真正落地工业产生实际价值,中间要2-5年。但ChatGPT模型训练到产品上线,再到有一亿全球用户,可能不超过1年。

  36氪:从2019年成立,智谱AI的商务合作就没断过,当时你们是怎样让商业合作跑起来的?

  张鹏:我们有一个和别人不一样的特点,长期有一群工程师和研究员一起工作,所以从成立第一天起,智谱AI就是从一个团队开始的。

  所以从公司的发展路径上来说,我们是带着技术,带着团队,带着客户和市场直接启动。我们是一边做核心的技术,一边去拓展市场。从第一天开始,我们就有收入。

  张鹏:我们团队早期在学校里做知识工程相关的研究,比如说科技情报分析、数据挖掘,所以服务的客户群体比较广泛,国内的科研机构、科技型企业、互联网企业,甚至包括国际上的顶尖科技企业。

  有一句话叫做“预见未来”,这和我们一开始主要的研究方向有关,包括数据挖掘、机器学习、算法这些知识工程下面的分支。这个过程中我们可以做科技趋势的分析和对未来的预判。

  张鹏:从宏观角度来讲,人工智能技术的发展经历了几个阶段,比如此前到了感知智能的阶段。

  我们认为下一代的技术应该是认知智能。认知智能的技术要解决的问题,和上一代的感知智能不太一样,比如多模态需要更大的数据量、更类人智能的能力,以及多任务、多场景的一些通用化的能力等等。

  所以公司成立的时候,我们就在研究大模型相关的底层技术,包括算法。2021年我们就有了自己的成果GLM,比GPT-3稍微晚了一点。

  张鹏:我还不清楚到底应该怎么和别人比(笑)。如果要比的话,我们更愿意跟世界最顶尖水平去比,比如OpenAI。当然在技术层面上,我们保持开放,和国内其他团队的交流保持得还不错,但我们不会特别从竞争对手的角度去看待问题。

  36氪:硅谷的进展是大模型赛道很重要的一个参照,那边有直接对智谱AI的成立产生重要影响的时刻吗?

  第一件是2020年5月GPT-3的发布,直接将预训练模型的参数规模推到1000亿以上,模型表现出的智能确实超乎想象。我们在第一时间就开始研究参数量的影响,后来对这事儿有了更深刻的理解后,我们对投入更多资源和精力去做大模型也更加坚定。

  第二件事就是ChatGPT的发布。其实在ChatGPT之前,InstructGPT和WebGPT等技术我们一直有,也预感到基于GPT-3这样一个优秀千亿基座的智能应用会迎来爆发。但ChatGPT的上线给我们一个明显信号:预训练模型已经到了完全可使用且好用的阶段,是产品化的很好范例。

  张鹏:GPT-3对我们的影响是坚定了要自研一个稠密的、千亿的、双语的模型。因为当年我们研究完之后也知道,做这样一件事情投入是非常大的,尤其是算力、人才、团队、数据。

  2020年智谱AI才成立一年多,但OpenAI已经做了两年多,他们的估值远超我们,很多资源也远超我们。所以那时即便联合清华的研究团队,做大模型也是一件有挑战的事,团队经过了激烈的讨论才确定。所以GPT-3给了我们信心。

  张鹏:那个时候GLM还没有完全定型,之前我们用的这些模型,比如MoE(专家混合模型,在Transformer架构的基础上增加了可以处理不同数据的“专家层”)等方法,虽然也能通过稀疏化的方式把模型参数推到很大,但效果并不太好。

  我们内部也在讨论是继续走稀释模型路径,还是做更大的稠密模型。那个时候因为OpenAI没有公开很多技术细节,大家也不知道怎么复现,国外像Meta、BigScience,复现GPT都不能算特别成功。所以内部也在讨论,我们该选用什么样的技术路线,然后该怎么做这件事,以及目标是什么。

  36氪:智谱AI采用的是GLM,不是比较主流的GPT。团队是怎么考虑技术路线问题的?

  张鹏:单纯从技术发展上来看,其实早期预训练模型就有几个类型,比如GPT、BERT还有T5,每个训练框架都有适合的某些任务和场景。

  在早期,BERT的效果比GPT-1和GPT-2更好,直到参数规模更大的GPT-3出现。所以,我们做GLM的原因,是希望把不同预训练模型的优势组合到一起。

  还有一个原因是,中国没有自己的预训练模型框架。无论是GPT、BERT,还是T5,都是西方的科学家提出的底层技术,路径是被西方垄断的状态。我们希望打破垄断,所以没有完全复刻OpenAI的路径。

  张鹏:参数规模达到千亿规模的时候,我们突然发现GLM对人类输入意图,以及对一些常识或者知识类信息的理解能力,出现了一些意想不到的表现。我最喜欢举的一个例子是:

  当你问大模型一个简单的问题:一个婴儿出生的时候,它的头长是身长的1/4,如果一个婴儿出生的时候身长是50厘米,请问它的头长是多少?

  但GLM模型给出的答案是非常有意思的,它并没有用简单的“50×1/4”这种方式来计算,而是用了“50÷4”来计算。背后的逻辑是,模型理解了“乘以1/4”和“除4”之间在数学上的等价关系。

  36氪:之前王慧文提到过,大模型和应用场景要同时做。你们觉得这是现在做大模型最好的方式吗?

  老王已经成功过,他对很事情有自己的笃信,他觉得一种技术最终是要落地,结合场景产生实际价值的,这样会更快。

  这个逻辑我也认同,所以我们也会考虑怎么去做落地,比如到底To B还是To C?我们要不要做To C?如果做To C我们到底做什么样的产品?这些问题最终归结到我们更相信什么和更擅长什么。

  张鹏:我们还是比较认同OpenAI的路径,To C有自己的好处,最主要的目的是聚集用户,这是获得用户量和用户数据反馈最直接的通路,团队也基于智谱 AI 自主研发的中英双语对线,正式上线了首款生成式AI助手——“智谱清言”。To B更多的是为了市场和最快的收益。

  张鹏:我们的认知可以概括为:不把目标定为“做中国的ChatGPT”。从成立起我们就认为预训练模型是一项革命性的技术,但它有自己的问题,不能包治百病,可能也不是AGI的终极方案。不复制ChatGPT,会让我们在具体落地过程中和其他团队有一些差异。

  张鹏:从最早开始我们就定了做通用大模型,没有做所谓的小模型。之前也有企业说不一定需要大模型,小模型也能很好地平衡成本和效果。但我们认为只有一定规模的大模型,才能够实现类人的认知能力的涌现。

  其次我们希望拥有解决多场景、多任务甚至跨模态的技术,我们不会把模型局限在具体的任务、场景,甚至垂直的行业里。当然行业大模型也没问题,但是我们认为它可能是阶段性的、时代所需的产物,毕竟需要落地,在使用过程能平衡成本和收益。但最终我们还是得推动AGI,不能停留在一个阶段性目标上。

  张鹏:就算我们做行业落地,用的也是通用大模型,当然中间需要解决的事情会比较多。

  张鹏:我们会和客户拉齐这样一个认知:所谓的行业能力或专业能力,可以在通用基座上用少量数据的微调和深度学习快速获得。

  如果客户没法很好利用通用大模型的能力,而是仍然用专用模型解决问题,本质上和传统模式没有区别,可能唯一的区别是行业大模型的成本比之前更高。

  但如果客户强调近期收益,或者场景很狭窄,比如只想提升智能客服的问答效果,那用所谓的专业小模型可能就够用了。

  所以我们就会把以上的观念同步给客户,如果他们接受通用大模型,那我们就持续合作共创;如果他们说不,我们只需要把当下的业务搞定,那么我们就用符合用户成本预算的方案来解决,比如Model Instance(为企业提供模型API的商业模式)方案。

  张鹏:数据反馈、用户反馈是大家比较了解的最直接的帮助。另外一个帮助是核算收支平衡点,大模型落地的每个行业都还不太一样,这时候就会倒逼我们在技术上做选择:是要更大的模型、更高的成本、更好的效果,还是要去平衡成本,比如出一个中等规模的模型,来满足客户对成本的要求。

人工智能录入:admin    责任编辑:admin 
  • 上一个人工智能:

  • 下一个人工智能: 没有了
  •  
     栏目文章
    普通人工智能 对话智谱AI CEO张鹏:我们不做中国的ChatGPT|… (09-07)
    普通人工智能 深入探索人工智能数学基础的十个步骤 (09-07)
    普通人工智能 “失语者”可用意念发声 AI+脑机接口再迎技术… (09-07)
    普通人工智能 A股收评:创业板指跌047%光刻胶、半导体、房地… (09-06)
    普通人工智能 华为云 人工智能赋能产业发展 创新中心助推企… (09-06)
    普通人工智能 英媒:高端芯片成人工智能竞赛关键 (09-06)
    普通人工智能 这家韩国芯片巨头靠人工智能火了 它统治了一个… (09-06)
    普通人工智能 徐矿集团总医院: “人工智能”触摸脊柱手术“… (09-06)
    普通人工智能 Zoom 重塑品牌并推出新的生成式人工智能功能:… (09-06)
    普通人工智能 重庆八中牵手哈工大 “机器人与人工智能人才培… (09-06)
    普通人工智能 WAIC 2023|傅利叶智能重磅发布GR-1通用人形机… (09-06)
    普通人工智能 机器人板块震荡回升 丰立智能20CM涨停 (09-06)
    普通人工智能 适老化设备如何让老年人跟上“智能时代”?智… (09-06)
    普通人工智能 高科数聚荣获“第八届清华校友三创大赛人工智… (09-05)
    普通人工智能 别让人工智能“偷”走孩子的独立思考能力 (09-05)
    普通人工智能 《青少年人工智能科创能力推进计划》发布 (09-05)
    普通人工智能 每经操盘必知(午间版)丨三大股指均小幅下跌… (09-05)
    普通人工智能 9月4日我爱我家涨停分析:房产经纪装修装饰人… (09-05)
    普通人工智能 延吉服务外包产业规模持续壮大 (09-05)
    普通人工智能 北京人力(600861):23H1外企利润同比+40% 外包… (09-05)