2022百度Create AI开发者大会纪要

返回首页　

设为首页　

加入收藏　

今天是:

网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人

2022百度Create AI开发者大会…
【无忧留学】美本“爆款”新…
AI技术词条机器学习
人工智能AI不会消灭人类也不…
自动化和人工智能的区别你知…
女士运动手表价格-最新女士运…
2020智能穿戴手表排行榜十大…
2022智能手表购买攻略：智能…
2022智能手表购买攻略：智能…
2023年女士手表推荐30款不同…
关于手机的利与弊
手机的利与弊作文600字
手机的利与弊
死磕创新百度 Create AI 开发…
罗永浩的锤与被锤
全球一致同意6G三大场景！
6G移动网络架构的六大特征丨…
中国电信发布《6G愿景与技术…
四川畅讯建设工程有限公司讲…
6G网络长这个样子？
乐融绽放首届上海国际显示博…
新品发布会上再谈“全屋智能…
百闻不如一见！全屋智能长啥…
智能生活必备的八大系统这才…
江苏省建携手华为全屋智能开…
智能电视那些app可以不用vip…
智能电视看电影用什么软件？…
终于有人说出来了！演员李嘉…
智能电视乱收费人民日报都忍…
智能电视“套娃式充会员”让…
『抖音直播电商』必备的36个…
电商术语大全
直播带货的30个专业名词解读…
跨境电商术语跨境电商专有名…
淘宝电商必懂的100个专业术语
7万级高性价比SUV推荐智能与…
又能当房住又有跑车性能还懂…
值得期待的中国智能车盘点都…
「爱车空间」兼具出色驾控…
高性能高智能威马M7成全能型…
机器人是什么
智能机器人三大核心技术（一…
人工智能是什么？我们是在人…
人工智能是什么？智能语音机…
STEM 玩具市场火爆国内创业者…
人工智能技术应用领域及发展…
人工智能的应用领域包括什么
人工智能在交通等领域应用加…
经济增长从何而来？人工智能…
AI人工智能应用方向简述

专题栏目

您现在的位置：智能制造网 >> 人工智能 >> 正文

高级搜索

2022百度Create AI开发者大会纪要

作者：佚名文章来源：本站原创点击数：更新时间：2023/1/12 19:33:58 | 【字体：小大】

　　盐雾腐蚀试验箱价格内容来源于网络，若不便发表，请联系后台删除；文章仅用于研究参考，不构成任何投资建议，投资有风险，入市需谨慎。

　　今年是第五届百度Create AI开发者大会，感谢大家的陪伴，每年我们都在这里探讨技术发展和创新的机会。过去一年，我们看到人们对于风口的讨论少了一些，对于健康的、可持续的增长关注度更高了。今天我的分享就围绕增长话题来展开。

　　增长从何而来？什么样的增长是可持续的？怎么样来推动可持续的增长？这里我有一张过去 2000 年世界人均 GDP 的曲线图。可以看见，在比较早的 1800 年里头，世界人均 GDP 的变化是不明显的。而在最近的 250 年左右，人均 GDP 出现了爆发式的增长。大家应该都已经想到了，这个爆发式的增长是人类历史上几次科技革命带来的。人们对于可持续增长的关注度变高。

　　科技创新驱动了大的增长。沿着这个思路，如果让我来判断第四次科技革命的标志，我认为是深度学习算法技术，它能够带来的效率的提升，能够驱动的经济的增长，是比很多人想象的都要更大的。与深度学习相关的重大创新，包括自动驾驶，也包括像水电能等领域的智能调度系统，他们的应用会像当年汽车、互联网这些个发明一样，产生重大的社会影响，是属于重大创新，所以是科技创新驱动了大的增长。

　　创新本身它又是从何而来的？我把它总结为反馈驱动创新。有科学家做过一个思想实验，就是把魔方打乱，交给一个盲人让他去还原。假设盲人每秒钟转动一次，他需要多久能够把这个魔方还原？答案是 137 亿年。但如果盲人每转动一次魔方，就有人向他做一次反馈，告诉他是更接近目标了，还是更远离目标。盲人需要多久能够把魔方还原？答案是 2分半钟。没有外部反馈的时候需要 137 亿年，能及时获得反馈的时候需要 2 分半钟。这就是反馈的神奇的力量。所以，创新不是闭门造车，创新是你有机会进入市场，不断获得用户和客户的反馈，摸着反馈过河才实现的。

　　百度在经营发展过程当中，也有很多反馈驱动创新的实践经验。我举个例子，百度的昆仑芯片在 AI 芯片当中属于性能非常领先的，这是因为它已经为百度搜索服务优化了 10 年的时间。百度的搜索服务每天响应几十亿次的真实的用户使用需求，每天进行1万亿次的深度语义匹配，能够提供最真实、最及时的反馈，从而倒逼大模型深度学习框架和芯片的优化。这就是一个典型的案例。

　　大规模的、真实的反馈驱动了创新。再举一个例子，百度。从一年前开始，每个季度我们都会发布萝卜快跑的订单量。我们的目标就是要保持自动驾驶出行服务订单量的全球领先。这背后也是反馈驱动创新的理念。订单量最大意味着什么？意味着我们能够获得最多的市场和用户的反馈。北京有一个小伙子，一年打了 600 多次无人车，打萝卜快跑，已经超过了传统的出行方式，成为他出行的首选。我们从社交平台看到，很多地方的网友希望无人车出行服务能够开到自己家门口，这代表着人们对于自动驾驶的接受程度已经很高。自动驾驶的落地速度可能比很多人想象的要快。

　　很多时候，事物的实际发展的路径和最初的设想是大相径庭的。技术的发展没有导航地图，只有指南针，在方向大致正确的情况下，基于实践反馈一步一步的进行迭代，才能够跑出来有价值的出现。

　　百度是全球为数不多的进行全栈布局的人工智能公司，我们所做的事情可以分为四层：芯片层、框架层、模型层和应用层。从高端芯片昆仑到飞桨深度学习框架，再到文心预训练大模型，每个层面都有关键自研技术，每一层之间又有很多的反馈，通过不断的获得反馈，实现端到端的优化。技术架构。越往下，越通用，越往上，它就越专用。更通用意味着不断降低行业使用技术的门槛。更专用则是深入。

　　具体来说有两方面，一方面人工智能技术的通用性越来越好，开发和应用的门槛就进一步降低。比如飞桨是百度自研的开源深度学习框架，目前飞奖凝聚了 535 万的开发者，服务超过 20 万家的企业事业单位，基于飞奖创建了 67 万个模型，已经构建起了一个繁荣的深度学习生态。飞桨就是人工智能时代的操作系统，让开发者能够像搭积木一样的构建起来。

　　AI 应用，大大的降低了 AI 的应用门槛。芯片卡脖子很要紧，但是软件卡脖子其实一样要紧，必须要把软件的根扎下去，才能够让创新持续发生，才能让顶层的商业更加繁荣。2022 年是大模型产业化应用的元年，大模型已经成为许多上层应用的技术底座。它能够有效地集成自然语言处理、计算机视觉、智能语音等多模态的能力，也可以结合多种行业和业务场景进行调优，从而摆脱传统 AI 应用碎片化、作坊式的开发方式，为深度学习技术进入新阶段带来了机遇。百度文心已经累计发布了 11 个行业大模型。

　　另外一方面是人工智能深入产业，赋能实体经济的发展。比如智能交通，我把它看作一个智能调度系统，可以通过智能红绿灯的控制来控制交通流量，从而提升交通的效率。通过对交通网络的智能化改造，可以把通行效率提升 15% 到30%。百度的智能交通方案已经落地全国 63 个城市，交通部也正式将百度列为交通强国的试点单位。我预测，智能交通方案可以使得在 2027 年之前，中国一线城市不再需要限购限行，从而激活汽车消费，为城市疫情之后的经济注入新的活力。在 2032 年之前，靠交通效率的提升，拥堵问题就可以基本解决。智能交通的应用为能源、电力、水利这些领域其实创造了一个行业范式，依靠智能调度系统来实现效率的显著的提升。

　　去年 create 大会上我说，随着技术应用门槛的不断降低，创造者们将迎来属于人工智能的黄金十年。今天我想继续把这句话分享给大家。这些发展的方向是明确的，但是实现的过程却不会很容易，甚至会非常困难，非常有挑战。这就是技术发展的特点。技术战略意味着长周期，而长周期不可能是一帆风顺的。

　　2000 年的 1 月份，我回过创业，现在回头看，很多人会觉得赶上了好时机。但是当时的实际情况是，在我创业刚刚两个月之后，互联网泡沫就破灭了，全世界蒸发了8万亿的市值。那个时候，很多人被困难动摇了信心，选择放弃，选择离开。最后是那些坚持挺过寒冬的人，成就了互联网发展的黄金十年。

　　人工智能从今天走向未来的过程当中，这样的起起落落还会发生。积极的方面是，过去一年，无论是技术层面，还是在商业应用层面，人工智能都有了方向性的改变。技术层面， AI 从理解内容走向了自动生成内容，包括AIGC，用于作画，用于图文、视频等等，就是多种类型的内容的创作。

　　商业应用层面的改变，其实最具代表性的还是自动驾驶。过去大家认为从 L2 到 L5 是一步一步走出来的，但其实 L2 之后率先进入商用的很可能是L4，而不是L3。因为 L2 和L4，它的事故责任的界定是清楚的， L3 的事故责任界定是不清晰的。因此普及 L3 需要更长的时间。

　　百度 L4 的自动驾驶落地是很快的，截止今年9月，累计订单量超过了 140 万，在北京、上海等 10 多个城市进行运营，在重庆和武汉还开放了全无人的商业化运营。然而，我们必须意识到，挑战同样是很大的。事实上，实体经济很多领域数字化改造尚未完成，而数字化本身并未带来效率的明显的提升。智能化的广泛渗透还需要时间。智能化对于实际经济的巨大的拉升作用还没有成为广泛的共识。因此，人工智能的商业化还需要在黑暗当中摸索一段时间。我用危机和希望作为关键词，在百度 AI 作画的平台上，由人工智能自动生成了一幅图画，我觉得很传神。生机勃勃的新生命已经破冰而出，然而寒冷却还没有完全褪去。所有伟大的企业、伟大的创造者也是一样。没有一帆风顺，只有不断的经历困难在凯旋。困难会刺激创新，而创新是真正的增长的动力。

　　百度将一如既往地为社会、为产业培养 AI 人才。三年前，我们宣布 5 年内为社会培养 500 万的 AI 人才。目前已经培养了超过 300 万人。未来百度会投入更多的资源，与各位开发者们一道，为中国的 AI 的发展尽我们最大的努力。接下来我的同事会为大家介绍更多的技术进展，希望大家继续关注，谢谢。

　　开发者朋友们大家好，欢迎大家来到百度create。我们相聚在create，共同探讨技术创新带来的可持续增长，分享开发者和创造者大有可为的机会。

　　在现阶段是什么驱动创新和增长？我认为深度学习+是创新发展新引擎，驱动技术发展和产业增长，让创新创造大有可为。知识而见今。回顾人类历史上经历的前三次工业革命，其核心驱动力：机械技术、电气技术和信息技术都有很强的通用性。进入工业大生产阶段后，一方面这些核心技术自身的产业链逐渐成熟，成为整个经济社会的基础设施，另一方面，各行业加速应用新科技转型升级。同时新的行业得以兴起。比如第二次工业革命的核心驱动力电气技术，从发电机的发明，到大规模发电，架设电力网络、研制各种输电设备等等，形成完整的电力产业链，各行各业都可以高效便捷的使用电力，让电力广泛进入人类生产活动的各个领域。同时，电气技术的发展与传统学科融合，诞生了电化学、电物理、电生物学等新的研究领域，催生了电子通信等新技术领域，促进了电子电器、通信等大批技术密集型产业的兴起，人类社会经济进入可持续的高速增长期。

　　我们都知道，第四次工业革命的核心驱动力是人工智能，而深度学习是其关键核心技术。2019 年4月，我提出深度学习具有很强的通用性，呈现出标准化、自动化和模块化的工业大生产特征，推动人工智能进入工业大生产阶段。几年来，我们看到人工智能的融合创新越来越丰富，深度学习与知识融合、跨模态多技术融合、软硬一体融合、技术与场景融合等等，在融合中趋向统一，在融合中孕育新方向和新模式。大模型进一步增强了人工智能的通用性，成为 AI 开发和应用的新基座。跨模态。统一大模型向着通用人工智能迈进。深度学习平台的标准化、自动化和模块化特征越来越显著，不断降低人工智能的应用门槛，高效便捷的把人工智能技术租送给千行百业，规模化的 AI 大生产已然形成。

　　人工智能的技术创新和产业发展进入深度学习+阶段。首先，从技术角度，深度学习+知识是人工智能技术进一步发展的重要方向。知识凝练了人类认识和改造世界的智慧，让机器同时从海量数据和大规模知识中融合学习及知识增强的深度学习，效果更好、效率更高，有更好的可解释性。百度研制的文心产业级知识增强大模型，具备跨模态、跨语言的深度语义理解和生成能力，应用于搜索、信息流、智能音箱等互联网产品，创新产品功能，提升用户体验，并通过飞桨深度学习平台赋能制造、能源、金融、通信、媒体、城市、教育等各行各业，助力降本增效，加快转型升级。

　　在行业知识增强方面，文心与合作伙伴联合共建行业大模型，以文心通用大模型为基础，从行业及企业的特有数据和知识中融合学习，提升大模型对行业应用的适配性，取得了很好的效果。前面 Robin 以危机和希望为主题，让文心一格自动生成了一幅画。新生命破冰而出，寓意希望萌生，危机尚存。这背后就是文心知识增强。跨模态大模型。通过从语言、视觉等知识中融合学习，机器可以准确理解语言图像中的语义及其映射关系。输入一句话，机器就能自动生成表意准确、纹理精致的画作。

　　从生态角度深度学习，加上下游生态伙伴芯片框架、模型及应用，构成了深度学习良性生态。在芯片层，深度学习=体现在支持深度学习训练推理的芯片类型丰富，与深度学习框架软硬一体，联合优化，性能越来越好，效率越来越高，为深度学习发展提供了强大的算力。

　　在框架层，深度学习框架下接芯片和应用，作用相当于操作系统框架，支持深度学习的便捷开发、高效训练和多端多平台推理部署，大幅提升深度学习模型的研发效率及效果。在模型层，直跟产业需求，提供已训练好的各种深度学习模型，以及支持低代码甚至零代码的开发套件和工具组件，降低门槛，让深度学习应用唾手可得。在应用层，深度学习技术与场景融合创新，加速传统产业转型升级，催生新业态、新模式，深刻改变人类生产生活方式和思维模式，实现生产力的整体跃升。深度学习良性生态的形成，使得应用需求和反馈可以传递到深度学习技术及应用的每个环节，各环节持续迭代优化，加速人工智能技术创新和产业发展。与此同时，生态中的产学研用各方也在携手培养人工智能人才，为高水平科技自立自强提供坚实的人才支撑。

　　百度是全球极少数拥有全栈布局的人工智能公司。截至目前，我们已经培养超过 300 万 AI 人才。从产业角度深度学习加千行百业、各行各业应用深度学习技术，降本增效，创新产品和业务，加快产业智能化进程，努力实现高质量增长。我国的产业体系品类齐全、体量庞大，深度学习驱动的创新，有丰富的应用场景，有助于形成良性循环，促进底层技术突破，加快升级现代化产业体系。

　　比如智能交通中智能调度系统、深度学习加交通融合创新的智能应用。城市交通复杂多变，缺乏全局感知数据，难以痊愈协同控制。如果能够对一个城区甚至整个城市的红绿灯进行统一调控，将会极大的提升城市的交通效率。通过使用图神经网络与强化学习技术，实现了整个区域交通流量的全局调控，最大限度的减少各方向绿灯的空放，减缓道路拥堵，节省出行时间。

　　在制造业，可靠稳定的生产线是企业赖以生存的重要基础之一，而产线涉及的设备杂、数量多，给产线日常运维带来巨大挑战。基于自然语言理解技术，我们通过让计算机从设备的历史、维护数据、设备使用手册等中融合学习运维知识，就能够做到自动识别设备故障、推荐维护建议等等。这样在遇到不熟悉、不擅长的产线故障时，也能够及时获得专业的维修建议。中国已连续 12 年是世界第一的制造大国，深度学习+制造业将助力中国制造再上新台阶。

　　服务业：国际高端会议往往需要同声传译服务，但是同传的门槛非常高，同传译员十分稀缺。国际会议口译员协会的会员才 3000 多人。基于深度学习技术。系统的翻译水平已经与人类译员水平相当，且能够在人说话时机器边听边翻译，而不用等到人把整个句子说完再翻译，机器同传，还可以不知疲倦地持续翻译。而人类一员由于工作强度非常大，一般工作 20 分钟就需要换人休息。深度学习技术的突破，使得机器翻译的水平有了大幅提高，正在让人类无障碍沟通的梦想成为现实。

　　在保险行业，每天都需要把收到的报销单据、发票收据、体检报告等各种文档进行识别、归类并录入系统中，工作量极大，稍有不慎就很容易出错。基于深度学习技术，我们让机器从保险行业数据和行业知识中融合学习，从而对文档识别与归类，并自动提取其中的核心内容，不仅解放了人力，还提高了信息处理的效率和准确率。

　　在智能工厂，深度学习应用，让工人远离危险和辛苦的工作环境。通过智能化的设备与环境管控，提高设备维修和生产制造的效率，构建更安全的生产环境。在智慧农田，深度学习应用，帮助监测并虫害，照顾蔬菜的生长，无人农场成为现实。在智慧医院，辅助诊疗系统，帮助医生拓展医疗知识，别症状，给出诊疗建议，让每个病人都能享受到专业的诊疗能力。在创作领域， AIGC 技术的发展和应用，正在为每个人插上创意创造的翅膀，可以挥洒想象。深度学习家驱动技术创新，产业发展离不开深度学习产业链的不断完善和壮大。其中，核心的深度学习框架平台加上大模型，贯通了从硬件适配、模型训练、推理部署到场景应用的全产业链，夯实了产业智能化基座，进一步加速产业智能化升级。

　　百度以多年的深度学习技术研发和产业实践为基础，打造了飞桨深度学习平台。该平台及深度学习核心框架产业及模型库开发套件、工具组件和服务平台于一体，能够标准化、自动化的支撑模型高效生产和便捷应用。截止目前，飞桨平台已经凝聚 535 万开发者，服务 20 万家企事业单位，创建了 67 万个模型。基于飞桨，百度打造了文心产业级知识增强大模型，包括以文心为代表的通用大模型、跨模态大模型、生物计算大模型、联合共建的行业大模型以及适配场景应用的工具套件。大模型API、基于大模型的产品探索、生态共建的创意社区等等。

　　过去的 18 年，我和我的团队研制了中国最珍贵的三辆车。第一辆是一辆月球车，玉兔号，工作在月球的正面。第二辆环是一辆月球车，玉兔2 号，工作在月球的背面。第三辆这回不是月球车了，是一辆火星车，祝融号。火星车工作在火星广袤的平原，使我们国家成为唯一的一个同时在月球和火星开展探测的国家。18 年来，我们亲历和见证了中国航天的迅猛发展，同时也见证了越来越多的计算机技术在航天领域中得以应用。我们的航天器变得越来越聪明了，如果月球车距离器还可以更多的靠地面操作控制。火星车聪明的祝融号就是一个移动智能体。

　　火星至少有四个方面的困难，第一个就是火星的石头，地形比较复杂，比较容易把车轮扎破。为了应对这个困难，我们准备的是主动悬架。一般的家里的小轿车底盘是不能够升高的。但是如果要是大家喜欢玩越野，有的越野车辆在遇到特定的地形，比如石块地形的时候，是可以把底盘抬高的，这种车就叫做主动悬架。祝融号缓行车就是一个具有主动悬架的车。

　　第二个要关切的困难就是沙尘暴。有的时候沙尘暴会遮天蔽日，导致电池片发不出电了。电池片上积累了很多的沙土之后，车就不能继续工作。应对的办法刚开始的时候，我们曾经想过雨刷，就跟咱们家里的一个小轿车前面雨刷是一样的。后来又想到了一个办法，简单一点，重量也能够更轻一点。在电池片上面，我们铺上 5 层的保鲜膜，当尘土积累到一定程度的时候，我们在第一层和第二层膜之间充气，让第一层膜带着灰尘掀掉，做出来新鲜的第二层。我们再接着工作，后来发现也不行，如果是这第一层膜掀完之后，带着灰尘落到了另外一个太阳炼纸板上，这件事情就变成灾难了。最后我们真正采用的办法是仿照荷叶。下雨天，水柱在荷叶上聚集，并不会把荷叶打湿。微风吹来，荷叶摇叶，然后水柱就乱下去了。我们在电池片上也放了类似的一种工艺材料。

　　第三就是火星的温度总体来说比地球要低。为了解决这个问题，我们准备了两个法宝，一个是开源，一个是接流。所谓的开源，我们设计了火星车顶部两个像望远镜一样的窗口，上面绷着一层膜，白天的时候阳光照进去，把能量也就进来了。晚上的时候，这一层膜对红外线来说是不透的，也能量只能进去出不来。其实这和蔬菜大棚原理是相似的，这就是手段。还有一个手段，给火星车穿了一件棉服，是一件用特殊的材料制作的棉服，这种材料叫做气凝胶。气凝胶这个材料有两大特点，一是轻，为了证明它轻，常常把它放在鲜花上，花瓣不会变形。第二个特征就是隔热的效果。

　　最后一个困难就是远。最远的时候，火星到地球的距离是4亿公里，我们地球赤道绕一圈是4万公里，也就是正好是够绕地球赤道转上1万圈。这样的距离，阳光或者叫无线电子信号从火星传到地球上来，最长的时候需要 22 分钟时间。地面上的师傅管理火星车，就不可能那么及时。工作的方式是，每天地面上的师傅跟车说一次线个小时，你要干什么工作？昨天的 24 个小时，你看看这个工作成果，给我汇报一下。火星车遇到各种各样的情况，遇到各种各样的困难，都需要他自己作出判断。也就是它是一辆自主的火星车。这是火星车的相机，采用自动曝光算法拍摄的容易。平台刚刚落到火星表面上的时候，火星车急着给家里报一声平安。需要根据着陆地点的经纬度、着陆平台倾斜的角度以及当时地球的方向，经过一系列复杂的计算，在控制火星师的天线指向家乡的方向。

　　当我们收到火星车传来的我已着陆火星。我们知道火星车一切正常，这是从火星传来的火星车和助力平台的一个自拍照。自拍照是怎么拍的？在车的底板下面，我们安装了一台相机。火行车往前走，把相机释放掉。它向前走的距离是 5 米。又把这 5 米赶紧退回来，再往后退，和平台形成了一张合影。

　　展望更遥远的未来，小行星、彗星、木星等等都已经纳入到了航天员关注的视野。有的已经进入到研制阶段，相信不久之后大家就能够收到好消息。有的已经开始进行预先研究，希望这些探测项目能够早日立项。想法正处于专家院士和青年才俊的缜密思考之中。希望早一些瓜熟地落。相信不久之后，航天员会在月球上留下中国人的足迹。也许有一天，人类会移民火星，购买的船票不再包括返程。也许有一天，在火星晶莹剔透的玻璃城堡里面，可以召开这样一场人工智能的盛会。

　　百度一直与中国航天合作，展望未来，相信百度会有更多的先进技术在航天领域中得到应用。有一天打开百度地图，第一个选项是地球导航。地球导航还是火星导航？我觉得考验导航软件是不是好用的一个重要的标志就是能不能够帮助沈腾搜索出一条求生路线。感谢各位关注。航天宇宙很大，我们一起去看看。宇宙很美，你也是。

　　大家好，我是百度技术讲解人辜斯缪，我将为大家讲解百度用大模型驱动搜索进化的最新实践。搜索一直是互联网用户的刚需，是一项最核心的基础应用，可以是互联网的水电煤。但它也远未定型，随着人们需求的升级，它还在越来越快速的演进和发展。相信大家遇到过这样的场景，突然忘记一部电影的名字，只能模棱两可的描述剧情，试着百度一下，竟然意外地找到了答案。下雨天，家里的窗户漏水了，不知道怎么处理。百度一下搜出来的第一条视频，比文字讲解更加清晰。遇到不认识的花，不认识的车标，分不清的插孔，直接拍照便能找到答案。这些场景的背后都是 AI 技术。其实，搜索一直是 AI 规模最大的应用场景，搜索引擎就是最大的人工智能项目。用户对搜索引擎的要求越来越高，我们要变得更智能、更懂用户，就必须不断的强化核心技术的投入，让百度搜索能够快速进化。今天我要给大家介绍百度搜索高阶进化的两项杀手锏技术知一和千流，这是百度搜索新一代核心技术的代表。

　　首先是跨模态大模型知一。近年来，随着数据的井喷、算法算力的全面突破，通用性强、效果好的大模型技术逐渐成为人工智能发展的主流方向。对于搜索面临的复杂任务，我们融合多项技术创新，构建了具有跨模态、大规模、高效率三大特点的之一。首先之一，可以理解全网文本、图片、视频、结构化信息等形态各异的资源，持续进行海量知识资源的学习收集，打破资源形态的界限，将最满足用户的搜索结果呈现给用户。这就好像人和人在面对面交流的时候，需要充分调动人的听觉、触觉、嗅觉等多种感官，更有助于理解对方的意思。

　　我们所构建的跨模态大模型知一，正是借鉴了人类对于复杂真实场景的学习和理解过程。通过让模型具备多模态的信息理解能力，充分理解用户的需求和互联网上海量的资源，无论是文本、图片、视频还是结构化的信息，都能统一理解，并真正为用户找到所求。其次，解决复杂问题的背后。大模型的训练需要极大规模的算力和推理能力的支持，对学习规模和处理效率都提出了极高的要求。

　　知一能够理解千亿综合语料和百亿视频语料，每天进行着万亿次的在线推理。这背后百度自研技术成果的加持，让知一领先业界。一方面，基于软硬一体的定制硬件，迅推联合优化的模型架构，通过百度自研的以量化蒸馏为代表的模型压缩和预估优化技术，实现了业务近乎无损的大模型落地。另外一方面，依托于百度自研的飞桨高性能并行训练框架和百度昆仑芯片，我们构建了业界领先的超大规模预训练技术和一整套先进的模型小型化技术，蒸馏压缩率高达99%，完成了知一的持续进化。

　　除此之外，百度搜索提升效率的另外一个路径是更高效快速的找到答案。搜索需要处理的数据规模特别的大，但又需要在毫秒级完成整个过程，面对数千亿的资源，要快速的找到最满足用户需求的内容。传统搜索引擎建立了强大的分布式系统，数万排的服务器同时计算完成整个检索过程。总计算消耗巨大，这就需要做一些性能的折中，一些优质的内容由于计算的不充分而没有办法呈现给用户。

　　为此，我们构建了新检索系统千流。千流具有动态适应和准确高效两大独特优势。依托于大模型对于内容的深度理解，能够把不同维度的信息进行智能有序的组织，将传统索引升级成多领域、多维度表达的立体索引。同时通过模型对每一个请求进行分析，智能判断检索路径，进行商格化激活。整个系统还会根据模型最新学习到的知识进行实时动态的调整，确保最优的检索效果，最大程度避免无效的计算，让每一个内容都可以更高效呈现给有需求的用户。

　　简单来说，有了千流技术，对于用户的每个query，可以精准的只检索相关内容，而不必遍历所有内容来寻找目标。大幅降低了检索系统的单位成本，索引的单位成本降低了50%，而索引的计算速度提升了一倍以上，实现了效能的大幅飞跃。是对搜索引擎后端架构的彻底改造。如果把搜索比作商场，千流就是商场里高度数字化的超级货架，按照货物的种类、成分、产地、生产日期等多元的维度去给货物进行分类、精准圈定、筛选和查找。比如，当你想买一袋五常稻花香 2 号大米，我们要做的就是带你直达精品大米的货架。

　　千流。让百度千亿级索引千流归海，各行其道，让每一个优质内容得到最有效分发，让每一个用户更快找到答案。身处搜索行业 20 余年，百度亲历着行业的高速发展和快速进化，并通过技术和产品的升级领跑行业赛道，不断拓展新的发展空间。在 AI 技术的积淀之下，搜索未来市场前景宽广，用户需求和表达方式的变化、生态供给的升级，都将为搜索营造更大的弹力空间。作为搜索引擎的引领者，未来通过前沿的 AI 新技术和海量的数据应用，百度将进一步实现用户需求和内容生态的高效连接，让智能搜索的场景无处不在。我的分享就到这里，谢谢大家。

　　大家好，我是百度技术讲解人吴华。我将为大家讲解大模型驱动AIGC智能创作的新风尚。我们知道预训练大模型是当前人工智能发展的重要方向，百度文心大模型的内容生成能力极大的促进了AIGC的发展。接下来我给大家介绍 AIGC背后的技术原理。

　　现在我就要给大家介绍三位能力超群的天才创作者。第一位就是文心 ERNIE 3. 0 Zeus，他是你的天才编剧。这个模型首先能够从丰富的无标注数据中学习，这些数据的题材非常丰富，包括百科、小说、新闻、戏剧、诗歌等等。同时在学习的过程中融入了知识图谱，指导模型学习世界知识和语言知识，并提升了学习的效率。除此之外，模型通过持续学习，从百余种不同形式的任务中学习知识，比如学写摘要、写对联、做翻译、分类、阅读理解等等。通过这种通用知识和专门知识的学习，显著提升了模型的泛化能力，使得一个模型能够做多种多样的语言理解和生成任务，成了一个名副其实的通才。文心 ERNIE 3. 0 Zeus，在自然语言理解与深层的公开权威任务上，以及零样本和小样本学习任务上，处于世界领先的水平。他还发布了业界首个开放的千亿参数中文生成API，供各行各业的开发者调用。大家可以在文心大模型官网上体验。编剧的工作完成了，接下来就需要进行场景和画面的美术创作。

　　接下来给大家介绍第二位天才创作者文心 ERNIE-ViLG 2.0。他是你的美术师、插画师，他能根据你的一句话或者一段描述文本，就可以生成一副精美的画作。为了达成这个目标，我们提出了知识增长的扩散模型。在学习的过程中引入了语言、视觉等多元的知识指导模型，更加关注文本和图像中的核心语义元素，实现精准的细粒度语义控制。同时，由于扩散模型在生成过程的各个阶段，对模型的要求是不一样的。具体来说，初始阶段模型需要生成图像的轮廓，结尾阶段就会变成对图下的细节进行建模。因此，我们引入了混合降噪专家网络，在不同阶段选择不同的网络来进行建模，提升了图像生成的质量。根据这个理解，几十秒内就可以生成媲美人类作画水平的图像，而且可以同时生成数百张风格各异的画作，比如写实风格、意向风格、中国风、二次元等等。它甚至可以生成现实世界中没有的创造性的图画，比如穿西装的齐天大圣、街边露串儿的熊猫，让人们天马行空的想象力得到精准的可视化呈现。它可以应用于工业设计、动漫设计、游戏制作、摄影艺术等场景，激发设计者创作灵感。以上功能都可以在文心一格 AI 作画平台上体验。这个平台的背后是文心 ERNIE-ViLG 2.0。

　　接下来我要给大家介绍的是第三位天才创作者,在影视创作的后期需要进行的视频内容生成与编辑技术。他是你的剪辑师和动画师。我们基于大模型技术构建了涵盖视觉内容生成与编辑的全套技术方案。在视觉内容生成方面，我们的视觉生成大模型可以跟着用户提供的一档描述文本或者一副图像，自动的生成高清的视频。具体来讲，是在文心模型的基础上，加入了实时建模，使得模型能根据文本或者图像生成新的视频，而且可以根据需要调节生成视频片段的时长，提升视觉内容生产效果和效率。

　　在视觉编辑方面，我们通过对超分辨率去噪、去模糊、去压缩等多任务的联合预训练，同时实现对多种不同情况的修复和编辑，并通过画质的提升、边缘绿化等方式增强视频的清晰度，达到全方位提升视频编辑效率和观感体验。举个例子来说，以前老电影的修复需要人工手动一帧一帧的修复，现在文心大模型大幅的提升了效率，每天单机就可修复视频 28. 5 万帧，解决了绝大部分画面的修复问题。即便是需要进一步精修，速度也能提升 3- 4 倍。我们看到大模型的进步，让我们在文字、图像、视频等创作领域全面感受到了 AI 技术的魅力。仿佛有一位无处不在的创意专家，能够随意时提供帮助，让创作者们更好地享受轻松、高效、快乐的创作过程。如果你掌握了以上这些内容创作功能，你几乎可以完成一部影片的许多重要工作，成为天才、鬼才创作者。如果再配上自己设计的虚拟人演员，那么你就可以成为一个真正的独立制作人，真正的独立导演。今天我的分享就到这里，谢谢大家

　　英特尔中国研究院承载着英特尔公司对中国经济与科技未来、美好未来的信心与厚望，在新兴应用领域中进行多样化的人工智能创新。

　　未来数字化转型会需要非常多的新技术，我们总结出 5 大超级技术力量：无所不在的计算、无处不在的连接、从云到边缘的基础设施、人工智能技术、传感和感知。他们负责把物理世界的数据转换到数字世界、信息世界，以后通过人工智能算法和其他各种数据处理变成有用的信息，来为我们提供各种开发应用，并且支持新的产品、创新的基础技术。

　　英特尔研究院专注于领先的人工智能和下一代人工智能技术的研究和创新。在计算平台方面，未来神经拟态计算是非常重要的一个方向。我们在新兴应用领域方面开发演示系统，包括智能交通和数字人，从客户端边缘到云。以技术为重点，并联合我们的合作伙伴推广人工智能技术软硬件解决方案。

　　我们正积极的和合作伙伴百度一起推动人工智能在大模型场景的应用。我们和百度在数据中心及产品合作层面，针对飞桨的模型和框架，将英特尔至强全系列 CPU 都做了深度优化。英特尔至强可扩展处理器每一代在 AI 处理能力上都有很大的提高，比如即将发布的英特尔第四代至强可扩展处理器 Sapphire Rapids，集成了AMX。可以看到，拿Intel 8为例，在Icelake上，Intel 8的PCle数是256，在 Sapphire Rapids上边可以达到2048。AMX 可以提供之前 AX512 八倍的指令操作数上的提升。

　　ERNIE 3. 0 是百度最新推出的 NLP 大模型，能够实现阅读理解、观点抽取、自由问答等任务。ERNIE模型的效果非常好，尤其在中文任务上。但大模型的使用成本非常高，飞桨自然语言模型库开源出来的ERNIE 3. 0 轻量化模型能够解决成本大难题，模型又小又快又准。通过软硬件联合优化，百度ERNIE 3. 0 Tiny 在英特尔至强可扩展处理器上的性能达到了业界的领先水平。

　　英特尔研究院在人工智能方面致力于前沿科技的探索，现在人工智能运算大部分是依靠 CPU 或者是带有非常多的矩阵运算单元的加速器，它们的能耗是非常大的。而神经拟态运算的一个突出的优点是，它可以在算法层级和硬件结构设计上突破这种依赖于大量乘加器的模式，而是通过模拟人类神经元的形式去构造底层的计算单元，且通常是纯算一体化设计出这种芯片，再通过脉冲神经网络的方式编程，实现人工智能算法。这样的方式通常可以达到千倍级能效比的提升，也就是完成同样一个人工智能的任务，用神经拟态计算消耗的能量与传统上用 CPU 或者 GPU 相比，减少了 1000 倍以上。所以这是非常重要的方向。

　　从 2017 年的第一代神经拟态芯片Loihi，我们不断在芯片、系统、软件和技术、社区等各个方面推动神经拟态计算的不断发展和突破。

　　今年9月，我们刚刚发布了基于Loihi二代的开发版Kapoho Point，它的正面和背面各有四个芯片，所以它是一个集成了 8 个 Loihi2 芯片的系统，采用了紧凑的可以堆叠的可伸缩设计，即我们通过机插件可以实现多个 Kapoho Point板间直连，这样可以用更多的神经元来做更复杂的计算。单个 PCB 板可以达到 800 万神经元，可以运行包含多达 10 亿个参数的 AI 大模型，也能解决涵盖多达 800 万的变量的优化问题。

　　除了计算算力的创新，对应于五大超级力量的从云到边缘的基础设施，我们也将人工智能的技术运用到智能交通领域的边缘基础设施。本演示展示了在真实的中国城市环境中进行的关于车辆与道路协作的现场测试。这种技术能够在十字路口提供无盲区的实时和全天候感知，可以极大的增强自主车辆的能力。通过在边缘计算框架上部署大规模多传感器融合的能力，我们实现了实时车路协作测试，搭建包括距离城市道路 1. 5 公里内的 3 个连续交叉路口，摄像机、激光雷达、毫米波雷达安装在每个十字路口的各个方向，通过城域光网络连接到附近的边缘计算集群。在现场测试中，我们在边缘框架中部署了多模态和多项的传感器融合，可以共享十字路口的全景实时信息，包括道路用户和过往车辆的位置信息。

　　除了智能交通，我们还开发了基于视觉的三维数字人技术。人脸是三维数字人最重要的组成部分，我们多年来对 3D 人脸进行了广泛而深入的研究，并取得了重大的成果。基于英特尔强大的计算平台，我们将人工智能和计算机视觉技术相结合，在三维人脸建模、动画和渲染方面都取得了一系列的突破，我们的工作获得了研究界的广泛认可。

　　此外，基于视觉的三维人体运动跟踪是许多应用的关键，如人机交互运动、生物力学分析、电影、游戏和社交虚拟现实的三维角色互动。区别于现有的基于标记的 3D 动作捕捉系统，或者使用数十个摄像机的无标记方法，我们使用一个或者稀疏的 RGB 摄像机开发了新的视觉 AI 算法。我们通过使用大量合成的Mocap数据来训练生成模型，以影视学习人体的运动学先验，将该先验嵌入在任何新设计的 CNN 模型中，就可以避免异常的位置预测。我们将该技术应用在中国速滑队、越野滑雪队和花滑队的运动员训练中，使用基于人工智能的高科技方法帮助运动员不断取得突破。

　　2022 年2月4日，北京冬奥会开幕式在鸟巢圆满举行。在致敬人民和闪亮的雪花两个节目中，有 24 名轮滑运动员迎风踏雪滑出奥林匹克口号的轨迹， 600 多个孩子脚下的雪花特效如影随形，为全世界观众呈现了一场科技与艺术融合的视觉盛宴。演员与鸟巢地面大厅系统的完美实施互动的背后，是英特尔领先的视觉人工智能技术为表演团队提供的科技支持。英特尔针对开幕式场景研发的基于 AI 的大型演出实施特效系统，使得演员不需要精准排练就能够呈现更加完美的艺术效果，让观众真切感知到科技为艺术带来的惊喜。

　　英特尔研究院在人工智能方面的多项研究都以技术转化的方式贡献到英特尔的产品中，包括 oneAPI 的 OpenVINO 工具包，在 oneAPI 的工具库中还有一个大名鼎鼎的 Rendering 工具包。

　　Intel Embree光线年被美国电影艺术与科学学院授予科学技术奖。

　　我们认为，多元化创新是释放人工智能技术力量、升级传统产业的关键。软硬件结合的智能计算技术的创新应用，将创造更加丰富的用户体验，产生更加多的社会效益和商业价值。英特尔研究院将持续以开放、创新的态度和大家一起推进人工智能方面最新的科技和解决方案。

　　随着技术的发展和行业的进步，智能手机已经在我们生活中扮演着越来越重要的角色，人们使用手机的场景和频率都在不停的提升。但在语音交互领域，传统的方案只能支持我们与手机进行交互时只能做简单的应答，然后他说你听，这是一个单次的单向交互，而不是一个你和他能够同时听的一个双向过程。因为手机 APP 在说话的时候，又在听你讲话，他就会把你的声音和手机 APP 自己的声音都录制进去，这样后面的识别系统就乱了。比如日常驾驶中，我们往往会用到手机导航APP，我们都希望在驾驶汽车时能够和手机实现自由顺畅的语音交互，在手机播放导航提示音的同时，也能够听清楚我们的指令，甚至能够像真人对话一样，能够按照我们的需求随时打断并对新的语音指令给予反馈。

　　这项技术叫做手机全双工语音交互，并且在全世界范围内，现在还没有一个方案能够普适性的支持在手机上实现全双工的语音交互，因为它的实现存在的很大的技术挑战。首先要实现全双工的语音交互，必须先做到回声消除，避免手机终端识别自己播放的声音。这在音箱车载系统上是比较容易实现的，因为这样的设备都是前装方案，我们可以通过硬件适配算法提前保证了回冲消除的效果。但是手机 APP 属于纯软后装方案，需要让算法适配不同型号的终端手机。手机硬件款式很多，硬件参差不齐，使得语音信号的处理普遍面临严重的非线性畸变，以及时延参考抖动，导致手机回声消除的效果难以保证。而且手机硬件的迭代更新是非常快速的，这就使得风险被大大的放大。

　　针对这个问题，我们研发了 2 级 AEC 技术，这是目前在世界范围内全行业唯一一个能在手机上实现纯软方案的 AEC 回声消除技术。我们融合传统信号处理和深度学习模型各自的优点，基于语音识别目标端到端的进行回声消除和信号增强，解决了手机场景下的回声消除问题，使得手机音量开到最大，回声消除音量也能达到 40 DB，使得手机 APP 的语音识别性能能够正常的工作。

　　手机的便携性也导致了另一个问题，那就是手机上的语音交互使用场景非常复杂，在交互中常常面临音乐、闲聊、环境、噪音、内噪、残余等与交互内容无关的其他信息的干扰，语音识别难度很大。为了解决上述问题，我们也研发了出了基于SMLTA2的多场景统一预训练模型，一个模型解决噪音、用户口音和回声消除残余吸收等难题。在各场景下，语音识别率相对提升超过20%，在业内同类技术中准确率是最高的，可以说实力遥遥领先。同时配合语音语义一体化的置信度技术，降低错误率，并且支持交互过程中的引导和澄清，让手机交互更加顺畅自然，更加逼近人和人的自由交互。想象一下，当我们在驾驶汽车过程中听着音乐，车内有同伴在聊天，还会从窗外传来一些交通噪音，而我们依然可以在手机实时播放导航语音提示的同时，与手机导航进行实时精准的双向沟通交互，这无疑将对出行体来极大的帮助。

　　我将为大家讲解车路一体的自动驾驶感知方案如何称为智能出行千里眼。自动驾驶技术让我们的出行体验更加轻松。人类驾驶员主要依靠眼睛观察道路周边的情况，智能汽车搭载了激光雷达、毫米波雷达和高分辨率摄像头等传感器，配合 AI 算法，帮助智能汽车拥有千里眼。对道路信息的感知，不再受人类视野局限，可以轻松做到 360 度无死角，甚至还可以通过车路协同看到更远的路况。这就是车路一体 BEV 自动驾驶感知方案。

　　自动驾驶系统传统的图像空间感知方法是将汽车上的雷达、摄像头等不同传感器采集来的数据分别进行分析运算，再把各路分析结果融合到一个统一的空间坐标系中，用于规划车辆的行驶轨迹。这个过程中，每个独立传感器收集到的数据和人眼类似，受特定视角的局限，经过各自的分析运算后，在后处理融合阶段会导致误差叠加，难以精准地拼凑出道路实际全貌，给车辆的决策规划带来困难。

　　不同于传统方式， BEV自动驾驶感知就好比一个从高处统观全局的上帝视角，车身多个传感器采集的数据会输入到一个统一模型，进行整体推理，这样生成的鸟瞰图有效地避免了误差叠加。BEV方案还能够轻松支持时序融合，不仅是收集一个时刻的数据，分析一个时刻的数据，而是支持把过去一个时间片段中的数据都融合进模型，做环境感知建模。持续信息的引入，让感知到的结果更加稳定，使得车辆对于道路情况的判断更加准确，让自动驾驶行驶更安全。

　　在 BEV 自动驾驶感知方案中，我们提出了车路一体的解决方案 UniBEV，它提取多传感器、多模态、多任务、持续融合等端到端感知能力。这个方案是由我们在业内首次提出的，它是自动驾驶和车路协同的重要底层方案。UniBEV主要有三个特点：端到端、多任务多模态融合感知、车路一体。其中它集成了车端多相机、多传感器的在线电图、动态障碍物感知，以及路测视角下的多路口、多传感器融合等任务，是业内首个车路一体的端到端感知解决方案。我们认为基于统一的 BEV 空间，更容易实现多模态、多视角、多时刻的时空特征融合。UniBEV 车路一体大模型，借助了大数据加大模型加小型化技术闭环，在车端路测的动态感知任务上都取得了业内领先的表现。UniBEV 让聪明的车和智慧的路可以更好地协同发展，也期待聪明的车、智慧的路在强大底层技术创新的支持下，未来可以让我们的出行更安全、更高效。

　　我将为大家讲解百度车路云一体化融合架构，以及它在未来的演变路径。今年8月，我们在工信部指导下发布了全球首个开源开放的智能网联路侧单元操作系统智路OS。

　　智路 OS 是以高等级自动驾驶技术为牵引沉淀出来的车路协同自动驾驶平台，未来将逐步扩展为以机器人为核心的智能空间机器人操作系统。车路协同自动驾驶是指在单车智能自动驾驶的基础上，充分发挥道路系统语音与网络的优势，开展车与路、车与云、车与人的协同配合，最终实现完全自动驾驶。通过末端原始交通信号代替车端观察，路端持续固定点位观测，代替车端属实离散点位的观测，能够有效解决单车智能的长尾问题。

　　在 2021 年4月，我们在业内率先实现了 Apollo Air 车路协同自动驾驶系统，仅使用路侧感知实现了开放道路连续路段的 L4 级别自动驾驶。在进行车路协同自动驾驶技术探索的同时，我们也将技术降维在城市辅助驾驶、智能信控、智慧停车等领域进行应用落地。截至 22 年底，百度车路协同技术已经成功在国内超过 60 个地级市落地。通过深入协同自动驾驶技术的应用，大大提升了道路的智能化水平，提高了城市通行效率，缩短了市民的通行时间。

　　在车路协同自动驾驶的技术研发与应用落地的过程中，我们发现行业普遍面临车陆云跨终端通信稳定性差、空间位置协议不标准以及行业生态碎片化等问题，导致应用场景受限、开发门槛高、产业规模小、建设难度大。同时，我们也意识到车陆云本质上是异构的智能体。上述关键问题是空间多智能体协同所面临的普遍问题。因此，我们对车路协同自动驾驶关键技术能力进行抽象整合，并发布智路 OS ，未来将演变成为以车路协同自动驾驶为切入点的智能空间机器人操作系统。其主要提供了 5 方面的能力：第一， AI 中间件能力，及时让全球首个自动驾驶高性能开源计算框架 cyber RT 和国际领先的深度学习平台Paddle Paddle赋能广大开发者，实现 AI 模型的便捷开发和多端多平台部署。第二，地图服务能力，提供了统一、高清、实时的数字空间，为云边端应用提供一套标准化的空间位置协议。第三，通信能力，我们提供了跨多主体、高并发、低延迟、高可靠的通信服务，支持云边端协同计算。第四，服务化能力，提供了不同层级的服务化 API 和一套标准的服务化接口，支持一端开发、多端部署，方便不同终端、不同类型的应用的快速开发和迭代。第五，硬件抽象能力，广泛适配云边端主流的传感器计算硬件设备，提供异构加速能力。

　　未来，我们会持续深耕机器人与自动驾驶操作系统领域，通过应用场景驱动关键能力持续提升，打造完善的自动驾驶时代的智能空间机器人操作系统，同时会持续开源开放，助力行业创新发展。

　　我将为大家讲解百度元宇宙基础设施平台希壤如何打造元宇宙底座Meta stack ，快速构建元宇宙 APP。去年，我们的Create大会首次在元宇宙中召开， 10 万人同屏技术突破想象力，希壤也作为首个国产元宇宙进入大众视野。基于云智一体的独特优势，一年内希壤已经成为最为开放和繁荣的国产元宇宙生态， 120 多个元宇宙空间及活动落地，其中 20 多个行业在希壤中开启了元宇宙的初体验。

　　站在元宇宙产业第一线，我们发现越来越多的生态伙伴希望构建具有品牌特性的独立元宇宙APP，快速抢先布局 web 3. 0，并且尤其关注构建效率与持续运营两大能力。作为人工智能、云计算、区块链、虚拟现实等大量前沿技术的结合体，元宇宙尤其是独立元宇宙的构建，涉及到 3D 建模、服务器搭建、客户端研发、基础云和 IoT 平台租用以及持续集成等一系列关键环节，不仅需要投入大量的人力资金，同时也意味着高昂的时间成本，成为了当前我们快速进入元宇宙、搭建独立元宇宙的最大阻碍之一。希壤希望为各界的合作伙伴提供云智一体的基础设施，助力大家率先布局 web 3 时代。

　　今天，我们重磅发布全球首个独立元宇宙底座希壤 Meta stack，助力品牌将原本动辄半年到一年的开发周期压缩到最快 40 天，从 0 到 1 搭建自己的元宇宙。

　　Meta stack 具备四大优势。第一，开箱即用。Meta stack配备了完整的核心产品矩阵，从客户端内核到后台引擎、中台开放平台，能有效解决研发效率低、运营成本高的难点。对比完全自建，平均研发效率提升300%，运营运维成本仅需原来的一半。第二，深度智能。Meta stack 集成了 20 余项百度核心 AI 能力，覆盖语音、语义、视觉、音视频、区块链、 IoT 等领域。第三，全面开放。我们的客户端兼容五大系统，三大引擎，囊括百分之九十的元宇宙触达平台。基于开放的底座，我们不仅允许开发者共创数字与玩法，还允许垂类、 SaaS 应用的自由扩展。以希壤为例， 80% 的数字玩法以及垂类应用皆为开发者所贡献。第四，互联互通。各种不同归属的独立元宇宙，可基于Meta stack实现身份、空间等核心维度的全面互联互通。

　　我们今天发布的希壤 Meta stack 已经经历了市场的检验，包括超媒体控股、厦门文广集团、太一控股集团以及世界人工智能大会，都借助希壤 Meta stack 实现了独立元宇宙 APP 的快速构建与高效运营。40 天建造一座元宇宙城市底座已经就绪。打开思维，毕竟在元宇宙的时空中，唯一的限制就是想象力。

　　我将为大家讲解量子计算如何践行基础科学、基础研究和底层技术的百度两基一底理念。量子计算是量子力学和计算理论相结合的一门新型交叉学科，具有强大的计算优越性。随着量子产业化的逐步深入，量子计算将对人工智能、金融科技、新能源以及医药、化工等多个重要领域带来革命性的推动作用。

　　然而量子产业化人面临着重重困难。最大的痛点之一就是量子硬件与实际应用之间仍然存在着一个巨大的鸿沟，这就需要我们打通量子技术全链条路的一系列难题。为了解决这些难题，百度量子专门制定了QIAN战略，希望通过践行这一战略，努力推进中国的量子产业化。

　　QIAN中的Q代表Quantum，表示量子基础研究。量子计算的产业应用离不开量子算法、量子架构以及量子人工智能这些方面的基础技术研究。百度量子向来高度重视量子基础技术研究和突破，在百度飞桨上开发了全球首个云量一体的量子机器学习平台量桨，成功实现了量子计算和人工智能的深度融合。

　　QIAN中的I表示 infrastructure ，是基础设施建设。我们希望把科研成果转化为实实在在的基础能力，打造高度自主可控的量子软硬件完整产业链。为了大幅降低使用量子计算的门槛，百度量子发布了量易伏 3. 0 版本，其中专门包含了量易伏的移动端APP，这是全球第一个支持量子硬件云端计算的APP。借助他，每一个量子爱好者只需要在手机上就可以访问并使用真正的量子计算机，这就使得量子算力不再局限于实验室，真正实现了触手可及。无论是初学者还是行业专家，都可以在量易伏的 APP 中找到合适自己的功能，比如初学者就可以直接运行量子小调来学习诸如量子纠缠这一类的奇特量子效应；而行业专家就可以使用量子编程调用超导量子计算机、离子阱量子计算机或者是量子计算模拟器来完成复杂的计算任务。

　　说到超导量子计算机，就不得不提到百度自主研发的第一台超导量的计算机乾始。与传统的单一超导量子芯片外加一个控制系统不同，乾始是一台集成应用软件硬件三位于一体的产业级超导量子计算机。与此同时，我们也正在加紧研发第二台超导量子计算机，会在近期投入使用。

　　此外，我们已经在两方面实现了高度的自动化：一方面是量子芯片设计的自动化，我们已经完成了一款 80 亿量子比特 3D 芯片的设计和仿线量子比特含耦合器的 2D 芯片也正在流片之中，相信很快就会与大家见面。

　　另一方面是量子芯片的自动化标定、在量子硬件上运行量子程序，测控平台不可或缺。量脉测控平台就是打通量子软硬件的桥梁，可以高效的实现量子控制、量子脉冲编译以及量子芯片的表征和标定。

　　QIAN中的A为 application，代表潜在性的关键量子应用。在这一层面，我们关注的是量子算力如何能够赋能一些重要的行业，实现高潜的应用。为此，我们建立了一个集成多个先进量子算法的量子应用模型库，这个模型后就好比一个超市，用户可以根据自己的需求来体验、选择并使用一些高价值、高算力的应用算法，让量子算力能够便捷的赋能各个行业。

　　特别值得一提的是，百度量子还推出了全球首个全平台量子软影一体化解决方案量羲，可以便捷地提供一站式的升级服务，帮助有需求的企业部署量子算力，做好产业量子化的准备。

　　QIAN中的N为 network，代表量子生态网络。我们相信，与经典互联网类似，量子互联网最终将会是量子时代最关键的基础设施。因此，持续推进这方面的技术研究并建立相应的生态网络具有重大意义。借助于量子网络，我们不仅能够提高信息传递的效率和安全性，也能实现分布式的量子计算。在这方面，百度量子推出了量子网络工具及QNET，用户能够对量子网络协议的各方面性能进行检测和优化，加速量子网络协议从设计到最终标准化的一个部署的发展，建立可持续的量子生态网络。

　　量子产业化离不开政产学研用的高度融合，而我们希望为用户和开发者提供量子计算的软硬件资源，为有需求的客户提供量子业务方面的咨询和技术培训，与合作者伙伴携手共创量子生态，让量子计算融入到千行百业之中，早日实现人人皆可量子的美好愿景。

　　我将为大家讲解飞桨平台如何进行技术科学、技术研究和底层技术的百度两基一底理念。量子计算的发展离不开人工智能技术的创新应用，除了支撑量子计算将前沿领域向产业化迈进，人工智能也同样帮助许多领域科学家们加速科学研究的进程，这就是人工智能科学计算，英文叫 AI for science。

　　AI 正逐渐应用在物理问题的求解与发现中，比如在工程制造领域， AI 可以用来加速飞行器和汽车的气动外形设计，用来预测及预防摩天大楼、跨海大桥等大型工程设施在台风等极端天下的震动；在气象领域， AI 可以实现更快、更精准的数值天气预报，包括预测强电流天气的短时临近降水情况，监视大尺度的台风形成和演变规律；在生命科学领域，传统的科研方法面临生物类型时延数据少、绩效任务复杂、时刻交叉多等挑战，而随着 AI 应用探索的持续推进， AI 已经逐渐在药物筛选、药物设计、法典研究、合成生物学、疾病激励研究等方面实现落地和持续的进步。

　　我们可以看到，人工智能科学计算目前正处于从广泛科学研究创新逐步走向规模化产业应用的阶段。AI for science 为解决科学问题带来新方法的同时，也对人工智能基础软硬件和科研生态带来诸多新挑战。首先，对科学问题机理化的探索需要深入，学习平台能够具备更加丰富和各类计算的表达能力，如高阶自动微分、负数微分、高阶优化器等。其次，科学问题的求解往往需要超大规模的计算，对深度学习平台和异构超算智创中心适配及融合优化、神经网络编译器加速和大规模分布式训练提出了新的要求。此外，如何实现人工智能与传统科学计算工具链的协同，也是需要解决的问题。

　　AI for science 作为一种新的科研范式，充分体现了 AI 与基础学科的交叉融合，需要大量的跨领域科研人才形成稳定优质的科研生态，来加速 AI for science 的技术创新与应用落地。在基础软硬件层面，飞桨作为国内首个自主研发、功能丰富、开源开放的产业及深度学习平台，研发了通用高阶自动微分神经网络编译器和大规模分布式计算等核心技术，深度适配超算、自算的异构算力，支撑 AI 方法与基础学科方法交叉融合，可以突破基础学科中控制方程数值求解时所面临的维数高、计算量大等挑战，实现数据和物理机理驱动的微分方程快速智能求解和跨尺度模拟仿真。针对科学计算问题的定义与求解，飞桨既提供灵活高效的深度学习框架，支持开发者通过调用框架提供的基础开发接口，实现自定义物理方程、模型组网、仿真计算等过程。

　　同时，飞桨也提供了多领域的工具组件，支持开发者通过调用工具组件提供的高层开发接口，实现物理问题的求解。我们发布了赛奖 PaddleScience 、螺旋桨PaddleHelix、量桨 PaddleQuantum 等科学计算的开源工具组件，支持结构应力应变分析、材料分子模拟等丰富领域算力，广泛支持 AI 加计算、流体力学、生物计算、量子计算等前沿方向的科研探索和产研应用。

　　在科研生态层面，飞奖已经与高校、科研机构等开展了计算流体力学、分子动力学、动力气象学等方面的发力建设，并形成了一些开放性的、多学科交叉的生态社区，包括飞桨特殊兴趣小组、 PPSIG共创计划等。我们也非常期待和各方一道进行技术联合开发推广，资源共享、生态商机共建。

　　如果AI for science帮助未来的科研成果加速来到现实，飞桨深度学习平台同样可以构建在生活中帮助我们预知未来的能力引擎，也就是超大规模图学习训练技术 PGL box，它可以大幅提升我们生活中经常需要的出行时间预测和信息推荐等服务的准确性。

　　随着深度学习技术的持续发展，数据规模和模型参数规模呈现出越来越大的趋势，硬件算力持续提升的同时，生动学习框架技术也不断取得突破。直观的说，我们为了预知未来，就需要把大量数据以及数据之间的关联，构建为一张超大的图。图的规模越大，一张图里能表达的信息就会越丰富。机器通过对图中各个节点的分析，找到更复杂的关系，就可以实现一定的预测。例如交通路网上两个地点，虽然他们在物理上不相连，但通过相关性建模，可以把两个具有相似交通规律的地点关联起来，从而构建更具准确性的预测。图的结构信息越丰富，相应就能越好的建模交通规律。百度地图很早就上线了通行时间预估功能，这个功能背后的原理是把路网中的路口和道路组成一张交通图。基于这张交通图，机器可以对交通路网的流量进行精细建模，具备了路况的预测能力。而在百度 APP 里，我们可以看到精准的搜索结果，以及主动推送等符合我们需求的内容，似乎它可以预知我们要什么样的信息。它的原理是将海量的网页转化为图中的大量节点，再根据网页中的信息让这些节点相互关联，于是所有的互联网公开信息成为一张巨大的图。利用相同的计算逻辑，就能够让具有相似规律的搜索和推荐都做到更好的效果。

　　由数百亿节点和数百亿边构成了庞大图，对算法和算力都提出了巨大的挑战。基于规则的图计算方法已经无法完全适用，这时图神经网络算法就发挥了关键作用。我们在通过扩大图神经网络算法的参数量，对图的特征进行更完整的表达，从而达到了模型越大，效果越优化极致表现。而数据规模和模型参数规模的增大，带来了计算成本高、训练稳定性差、策略迭代周期长等一系列问题和挑战。

　　由此，我们基于百度飞桨平台完成了图神经网络架构的全新升级，为业界带来了超大规模图学习训练技术 PGL box，是首个同时支持复杂算法加超大图加超大离散模型的大规模图学习训练技术。通过显存、内存、 SSD 三级存储技术和训练框架的性能优化技术，单机接口支持百亿节点、数百亿边的图采样和训练，并通过多机扩展支持更大规模。PGL box为百度业务创新提供了广阔的空间，目前已经在智能交通、信息推荐、搜索等标杆场景实现落地，大幅提升业务效率和用户体验。

　　我将为大家讲解百度太行和百度百舸如何践行基础科学、基础研究和底层技术的百度两基一底理念。过去的一年，百度智能云持续深耕云智一体，深入产业。随着产业实践的深入，智能调度、自动驾驶、工业互联网等智能化应用不断普及，产业正在加速从数字化向智能化转移。同时，伴随着 AI 技术的广泛使用，计算负载正在从通用 CPU 计算向异构计算迁移。我们发现，在这两个趋势的背后，本质是对算力的智能化运用。

　　智能计算时代即将来临。作为智能计算的基础，我们去年发布的百度太行 DPU 1. 0 突破了数据中心资源池化以及虚拟化损耗的关键技术，支撑了高弹性、高性能、低成本的全栈 IaaS 产品。在此，我们全新发布 DPU 2. 0 构建的新一代百度太行计算架构，真正实现 One For All。

　　全新DPU2. 0 具有四大核心能力，为产业带来极致的效能提升。第一，多平台。支持英特尔、AMD、 ARM CPU 以及GPU、昆仑芯等等全系列计算芯片。第二，多场景。支持裸金属、虚拟机、容器等各种算力形态，技术同构、资源共池，全硬件加速零损耗，用户在云上可获得物理机百分之百的计算能力。第三，多协议。支持计算、存储、网络虚拟化等各类设备，与接口灵活提供不同规格的实例类型，包括通用接口 Virtio net、Virtio block、NVME、RDMA 以及定制化的高性能网络接口百度 RDMA 简称BDR。第四，多业务。支持实现带宽共池、智能分流，适配、存储、搜索、 AI 计算等各类场景的混合部署，管理各类业务的流量分配，同时满足高带宽、低延迟的需求。另外，全面支持了热插拔、热升级、热迁、移热恢复，对整体可用性、安全性也有了极大的提升。

　　与此同时，智能计算时代， AI 已经在行业场景中无处不在，计算也需要和 AI 进行天生的融合，具备 AI 原生的特性。我们总结 AI 原生的基础设施需要同时满足芯片多元化、算力规模化以及全面云原生化。秉承 AI 原生的技术理念，百度一直致力于把云计算与 AI 技术进行融合创新，在DPU 构建的弹性 IaaS 基础上，打造出面向智能计算的新一代基础设施 AI 大底座。将 AI 基础架构IaaS 与应用平台 PaaS 能力深度融合，发挥 IT 资源极致效能，全要素端到端的整合百度 AI 优势，为产业提供最强的 AI 基础设施支持。

　　在此，百度智能云全新升级 AI 大底座的核心 IaaS 层产品 AI 异构计算平台百度百舸2.0。全新的百度百舸2.0将通过 AI计算、 AI 存储、 AI 加速、 AI容器以及顶层业务场景这五个层级，全面构建 AI 原生时代智能计算新基础设施。

　　百度百舸 2. 0 实现了超大规模支持，万卡并行，线% 以上，支持了超高效能，能将 GPU 的资源利用率提升一倍以上，赋能了端到端，在核心业务场景性能提升了 4 倍。以自动驾驶领域为例，百度百舸2.0为用户提供了从数据存储、数据处理、模型训练、模型仿真的端到端加速能力。通过并行文件系统和分布式缓存，数据访问效率可提升 5 倍。借助百舸AIAK推理加速，数据处理和标注效率可提升一倍。对于耗时最长的模型训练，通过专有的算子优化与底层基础设施相结合的变形效率优化，百度 AIAK 训练加速将模型训练性能提升 50%-400%。最后，通过大模型的 AI 容器调度技术，支持数千仿真任务的并行执行，将仿真任务处理效率提升了近一倍。通过与场景端到端的结合，全面加速自动驾驶业务创新，同样在生物计算、跨模态、大模型计算中心等广泛的应用场景取得了类似的效果。

人工智能录入：admin 责任编辑：admin
	上一个人工智能：【无忧留学】美本“爆款”新专业！AI人工智能专业你心动了吗？下一个人工智能：没有了

　栏目文章

2022百度Create AI开发者大会纪要 (01-12)	【无忧留学】美本“爆款”新专业！AI人工智能… (01-12)
AI技术词条机器学习 (01-12)	人工智能AI不会消灭人类也不会有任何创新 (01-12)
自动化和人工智能的区别你知道吗？ (01-12)	人工智能技术应用领域及发展趋势方向分析 202… (01-12)
人工智能的应用领域包括什么 (01-12)	人工智能在交通等领域应用加快落地 (01-12)
经济增长从何而来？人工智能去向何处？李彦宏… (01-12)	AI人工智能应用方向简述 (01-12)
人工智能前沿峰会盛大召开隆重揭示AI六大领域 (01-11)	人工智能现阶段应用的领域有哪些 (01-11)
人工智能都应用于哪些领域 (01-11)	人工智能的6个重要服务领域+机器人重塑武装部… (01-11)
人工智能的细分领域有哪些 (01-11)	虚拟现实技术的应用 (01-11)
虚拟现实技术的十大用途 (01-11)	虚拟现实技术十大应用案例 (01-11)
VR虚拟现实技术应用大盘点 (01-11)	虚拟现实技术应用- 工业、军事篇 (01-11)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	智能制造网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！