返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 标准出现问题人工智能正在走…
 AI在大健康生根发芽
 中消协:强制关注公众号消费…
 临床前药物研发AI搞出来的已…
 李迅雷:五项举措降低地方债…
 智能电视和网络电视哪个好 智…
 智能电视和网络电视的区别是…
 智能电视和网络电视有哪些区…
 智能电视与网络电视有什么区…
 什么是网络电视 智能电视和网…
 人人都能用的“AI 作画”要成…
 美图公司“AI商品图”带来新…
 新智者Talk第四期:AI生成新…
 AI画作拍出300万元AI绘画还有…
 “夫妻肺片”AI绘画被玩坏 我…
 车企尽上GPT:乱花渐欲迷人眼…
 理想首届家庭科技日新产品带…
 首批“成都造”智能网联汽车…
 宇通获智能网联汽车大赛公交…
 依托智能网联汽车“中国方案…
 道达投资手记:沪指跌破防守…
 人工智能“画”的“照片”比…
 中经评论:人工智能如何应对…
 全球AI大模型一览:中美之外…
 奔赴AI之约 同盾科技“新一代…
 世界各地区企业对商务智能应…
 第十四届陕西青年科技奖名单…
 商业智能行业发展现状及趋势…
 商业智能行业发展现状及发展…
 电子商务智能化管理探讨
 父母常起冲突对娃有三个弊端…
 2019陕西社会工作师初级实务…
 “原生家庭”成热词:变迁中…
 2020年社会工作者《中级实务…
 社会工作实务冲刺速记02 家庭…
 差异化定价凸显国产5G手机品…
 华米OV最便宜的5G手机红米最…
 销量超华为!iQOO最便宜5G手…
 5G普及风暴来了Redmi10X刷新…
 5G手机的价格已经被确认这4款…
 中国国产手表品牌推荐!国产…
 国产手表哪个牌子好?天王表…
 国产手表什么牌子好
 国产手表哪个牌子好
 国产品牌哪些牌子的手表好一…
 OPPO智能终端操作系统多个功…
 为开发者生态保驾为用户安全…
 让产品安全可信赖丨2020 OPP…
 OPPO智慧跨端系统支持跨平台…
 坚守本分商道陈明永助力OPPO…
专题栏目
网络
您现在的位置: 智能制造网 >> 智能通信 >> 正文
高级搜索
标准出现问题人工智能正在走向错误的方向
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/6/26 21:18:09 | 【字体:

  seqingwuyetian我的这篇文章不是第一篇(也不会是最后一篇)讨论人工智能界如何按自身规律发展的文章。正如不久前汉娜克纳(Hannah Kerner)的话:“很多AI研究人员认为现实世界中的问题无关紧要。社区过度关注新方法,却忽略了真正要紧的事情。”

  许多大型会议公然忽视了应用型论文,这些文章聚焦于使用目前的技术解决现实世界中的问题,其中很多文章还关注在此过程中面临的挑战。程序是虚无缥缈的,目标检测额外精准10%,远比减少癌症死亡的1%更有价值。

  人工智能界忽略了一个显而易见的事实:深度学习是一门实验科学。虽然神经网络脉络清晰,但它是一个难以解释的庞大的非线性系统。尽管越来越多的研究致力于阐释神经网络,但神经网络依然像以前一样神秘。科学方法是我们理解神经网络的唯一可靠工具,因为它植根于实验。

  而矛盾之处在于,尽管神经网络的本质是实验,但是这个领域却拒绝纯粹的实验。一般,一篇神经网络的论文首先介绍其新颖之处,然后尝试形式证明,接着做消融研究,最后得出结论。这是根据实验得出的结论。

  想象一下,如果土木工程师们决定创造与众不同的桥梁设计,却选择在桌子大小的乐高复制品上进行验证。没有使用真实建筑材料进行昂贵的仿真模拟或试验,你敢相信新提出的设计方案吗?你会特别信任这些实验,然后投资数百万美元来实现它们吗?不管你敢不敢,反正我是不敢。

  简化的世界模型对于快速构建原型和尝试想法非常有用。但为了实际验证,你需要在真实的世界中进行尝试。这是一个两步走的过程。

  现代AI研究停滞在前半段基准这一问题上,实际的使用案例是后半段。ImageNet、COCO、CIFAR-10,这些都是人工智能的乐高。它们让我们实验新的想法,摒弃不佳的构思,它们是很好的工具。然而,它们只是达到目的的一种手段,而不是目的本身。

  看看这个图表:该图介绍了COCO目标检测基准的最新进展,每一个小点都是一个不同的模型一种新技术或现有技术的融合,领跑者用蓝色标出。

  该图表显示了从2016年1月的28.8点到2020年7月的55.1点的轨迹。取得的进步是无可否认的,从图中可以看出,EfficientDet D7x是目前最好的目标检测技术。但是,问你一个问题:你会在应用程序中使用哪一个模型?

  你很可能无法作答,因为你不知道我说的是哪个应用程序,也不知道它有哪些要求。它需要实时运行吗?它能在移动设备上运行吗?它需要识别多少类?用户对错误检测的容忍度有多大

  依据答案,以上这些都不值得考虑,甚至连EfficientDet D7x都不值得考虑。如果模型必须在手机上实时运行,那么即使略微调整这些模型,也执行不了。更糟糕的是,不能保证这些模型能在连续帧之间产生一致的检测结果。我甚至不能说出一个要求最高检测质量的应用程序的名字,除了高准确度之外,没有其他要求。

  早在2015年,研究发现,神经网络的深度增加超过12层会对性能造成损害。在著名的残差网络(ResNet)论文(中,何凯明博士以及其他几位学者假设通过跳过连接,连接非连续层可以扩大容量,因为它可以提升梯度流。

  第一年,ResNet在几个基准竞赛中取得了优异的成绩,如ILSVRC和COCO。但你现在应该已经意识到了这只暗示ResNet是一个重要贡献,但这不是证据。

  ResNet在人工智能历史上的地位的确切证据是建立在其大量工作上的。ResNet的惊人之处在于它解决不相关问题的数量,而不在它获胜的竞争。它真正的贡献在于这个跳过连接的想法,而不是架构本身。

  这篇有关Focal Loss(的论文同样经受住了时间的考验,确实改进了他人的研究。这篇关于Attention的论文(也遵循同样的路线。每天都有一篇新文章讨论Attention是如何提高某些基准的,以及聚集损失让Attention变得更好。

  重要的不是竞赛,而是之后的影响。事实上,2012年ILSVRC的冠军是AlexNet,而2015年的冠军是ResNet。你能说出2013年和2014年的获胜者吗?2016年、2017年和2018年的挑战是什么?你能确保每年都举办ILSVRC吗?

  你可能会问:为什么没有更好的基准或更有用的度量标准?我们如何衡量后继影响?

  遗憾的是,我们做不到。我们可以使用引用或下载的计数,Reddit的访问量或者GitHub的星号标注。然而,这些度量标准都是有瑕疵的。为了进行公平的比较,我们需要考虑到每一个细节,同时从等式中将所有的偏差进行标准化处理,这太难了。

  例如,为了比较Attention和ResNet的影响力,我们需要考虑正确使用这些概念,权衡它们的相对影响,并将时间和影响范围进行标准化处理。很明显,量化这些属性的工作量巨大,可能与所有基准或度量标准一样有缺陷。诸如杂志的影响因素之类的想法甚至没有触及这个问题的表面。

  有些目标是无法量化的。谁是最有声望的人?是西方音乐史上最具影响力的作曲家巴赫,还是最具影响力的剧作家莎士比亚?比较他们的作品毫无意义,更不用说他们的领域了。

  这就走进了死胡同。我们可以测量精确度,可以测量速度,但是无法判定影响力。我们都承认我们需要更先进的科学,但是我们如何断定一种科学比另一种科学更好呢?我们如何衡量研究和现实之间的脱节?我们希望能和人工智能一起前进,但是我们既不知道前进的方向,也不知道已经走了多远。

  这不仅仅是人工智能的问题。我们想要更健全的政府,更完善的医疗服务,更优质的教育,但是怎样才能真正量化这些呢?到目前为止,最失败的方法(也是最普遍的方法)是替代度量,比如COCO AP的得分。

  我们无法衡量人工智能的进步,但我们可以测量目前的目标检测方法有多精准。目标检测也是AI的一部分,所以,如果能在这方面取得一些进展,我们也可以期待在人工智能方面取得进展。

  在我们确定使用COCO之前,我们一直使用ImageNet前5名的结果,所以面临一个更具挑战性的问题。我们无法通过训练检测模型来提高AP,但是可以教会它们减少边界盒坐标的L2损失。损失是不可微度量的替代。L2损失不是AP,但低L2损失与高AP相关,所以它是有效的。

  从前,识字率是许多国家衡量教育进步的主要指标。几十年后,在识字率非常高的情况下,更高的学业完成率便是衡量教育进步的重点。然后是更高的大学入学率。我不知道学位与教育之间的关系是否像我们想象的那样紧密,也不知道高中教的知识是不是他们应该教的,但这是我们今天追求的指标。

  从某种意义上说,对于这些问题,没有什么解决方法是对的。因此,根据定义,所有的路线都是错误的。只有尽可能多的尝试各种途径,我们才有可能选择一条相对正确的道路。使用AI术语,我们需要使用更大的批量抓取,并对尽可能多的分布进行采样。

  这意味着我们必须将关注范围扩大到“准确性”和“速度”之外,还要包括“稳健性”或“连贯性”等内容。最重要的是,我们需要从精心挑选的基准转向现实世界。

  以我研究乳腺癌检测算法的案例为例,研究员很容易错将这个领域当成已解决的领域。最近的研究已经在这个主题上取得了超人的成绩,但是,这些算法却无法应用于任何一家医院。原因很简单,它并不起作用。

  这听起来有些夸张,但其实非常简单:即使是同一种东西,即乳房x光片,如果你在数据集a上训练算法,算法不会在数据集B上工作。

  目前没有已知的技术可以在不进行微调的情况下,在数据集上进行训练,并在其他数据集上运行良好。你必须针对每台机器/每家医院建立数据集,以获得有用的结果。度量标准合理,这个领域就解决了。实际上,这连开始都难。

  最重要的是,算法无法为他们的答案提供帮助。站在医生的角度想想:你会因为机器是这样显示的,就告诉患者他们得了癌症吗?你不会,你会再次查看这些图像。

  到目前为止,已发表的论文的主要评判标准是AUC评分。它告诉你该算法对乳房x光片的良恶性分类有多合理,不会告诉你它对其他数据集有多稳健,或者所有都是可解释的。换句话说,它从不回答“它有用吗”这类问题。

  发展人工智能没有正确的道路,但肯定有非常错误的道路。花不了太多的时间,你就能发现大多数文献有多不适用,以及真正紧迫的问题是如何堂而皇之的被人们忽视了。

  正如我在开头所说的,这篇文章并不要指责当前的研究不好,而是说问题的关键在于当前学术界和现实世界之间脱节我们过于狭隘地关注准确性。

  发展人工智能不是为了纸上谈兵,推动社会发展是真正重要的事,我们希望通过改善人工智能来实现这一点。但只有当我们正视现实的社会问题时,我们才能正确地做到这一点。社会的问题远比精确的目标检测更复杂

  本文转载自公众号“读芯术”(ID:AI_Discovery) 我的这篇文章不是第一篇(也不会是最后一篇)讨论...

  本文转载自公众号“读芯术”(ID:AI_Discovery) 我的这篇文章不是第一篇(也不会是最后一篇)讨论...

  本文转载自公众号“读芯术”(ID:AI_Discovery) 我的这篇文章不是第一篇(也不会是最后一篇)讨论...

  本文转载自公众号“读芯术”(ID:AI_Discovery) 我的这篇文章不是第一篇(也不会是最后一篇)讨论...

  本文转载自公众号“读芯术”(ID:AI_Discovery) 我的这篇文章不是第一篇(也不会是最后一篇)讨论...

  在去年秋季的新品发布会上,苹果公司也是推出了3款Apple Watch。......

  现在有最新消息,继此前的渲染图和部分配置细节后,近日有数码博主进一......

  6月26日消息,京东物流发布公告,董事会宣布余睿因个人身体原因,已辞......

  据报道,马克·扎克伯格(Mark Zuckerberg)的混合武术教练表示,他并......

  芯片代工市场在三季度开始恢复,似乎与ChatGPT带动的人工智能应用芯片......

  6月26日消息,25日晚间,美团发布公告称,王慧文因“个人健康原因”已......

  据报道,在本月发布Vision Pro混合现实头显之后,苹果正在努力完善这款......

  6月26日消息,从相关渠道了解到,腾势品牌首款全新中型SUV车型腾势N7将......

  6月26日消息,近日北京市人民政府新闻办公室组织召开2023全球数字经济......

  SpaceX首席执行官(CEO)埃隆·马斯克表示,今年对星际飞船项目的投资......

  据报道,近日,印度总理莫迪访问美国,和美国总统拜登和其他政界商界领......

  SpaceX首席执行官(CEO)埃隆·马斯克表示,今年对星际飞船项目的投资......

  【Techweb评测】去年11月,vivo发布了十年最强旗舰、X系列多年来的扛鼎......

  芯片代工市场在三季度开始恢复,似乎与ChatGPT带动的人工智能应用芯片......

  SpaceX首席执行官(CEO)埃隆·马斯克表示,今年对星际飞船项目的投资......

  芯片代工市场在三季度开始恢复,似乎与ChatGPT带动的人工智能应用芯片......

  在去年秋季的新品发布会上,苹果公司也是推出了3款Apple Watch。......

  大家都知道蔚来从中东拿了一笔钱,但事实上,中东的资本,还看上了另外......

  6月26日消息,百度创始人、董事长兼首席执行官李彦宏出席“世界互联网......

  6月26日消息,25日晚间,美团发布公告称,王慧文因“个人健康原因”已......

  在美国会见了印度总理纳伦德拉·莫迪后,亚马逊和谷歌的CEO宣布了在印......

  同N3B制程工艺相比,N3E制程工艺有更少的EUV层,晶体管的密度也更低。......

  据外媒报道,SpaceX正寻求通过出售内部股票筹集7.5亿美元资金,这将使......

  在全新ES6价格发布之前,蔚来汽车罕见地向车友征求ES6定价。......

智能通信录入:admin    责任编辑:admin 
  • 上一个智能通信:

  • 下一个智能通信: 没有了
  •  
     栏目
    普通智能通信 标准出现问题人工智能正在走向错误的方向 (06-26)
    普通智能通信 AI在大健康生根发芽 (06-26)
    普通智能通信 中消协:强制关注公众号消费者有权举报 (06-26)
    普通智能通信 临床前药物研发AI搞出来的已经占一半了? 对撞… (06-26)
    普通智能通信 李迅雷:五项举措降低地方债务风险 (06-26)
    普通智能通信 OPPO智能终端操作系统多个功能获优胜设计奖 (06-26)
    普通智能通信 为开发者生态保驾为用户安全护航丨OPPO开发者… (06-26)
    普通智能通信 让产品安全可信赖丨2020 OPPO开发者大会安全专… (06-26)
    普通智能通信 OPPO智慧跨端系统支持跨平台跨终端万物互联 (06-26)
    普通智能通信 坚守本分商道陈明永助力OPPO加码5G争夺战渠道… (06-26)
    普通智能通信 飞熊投研【公司分享】 无线通信+北斗卫星北斗… (06-25)
    普通智能通信 了解量子通信的基本原理及特点以及其发射过程… (06-25)
    普通智能通信 墨子号科学实验卫星升空 10年后百姓受益 (06-25)
    普通智能通信 环保科普|电磁辐射对人体健康影响大吗? (06-25)
    普通智能通信 还在为海上没网发愁?带上这套设备 (06-25)
    普通智能通信 资本赋能产业发展!麓谷资本投资助力本土企业… (06-25)
    普通智能通信 在未来微波通信能完全代替光纤通信吗? (06-25)
    普通智能通信 MWC 23关键词(一)|5G、55G、卫星通信 (06-25)
    普通智能通信 奖金超百万元!首届广州粤港澳大湾区中小企业… (06-25)
    普通智能通信 星网计划渐明 卫星通信产业有望迎来历史提速拐… (06-25)