返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 谷歌《自然》论文:回答医疗…
 免费AI人工智能在线写作伪原…
 人民法院报2023年上半年民商…
 抗衡亚马逊?隐形快消巨兽凭…
 观远数据苏春园:零售数据分…
 7个商业案例展示DePin如何实…
 6个数据分析成功案例:内部解…
 基于STM32设计的智能家居控制…
 基于机智云的智能家居控制系…
 智能家居控制系统解析
 智能家电控制技术解决方案 -…
 三峰照明添智能家居控制系统…
 【智能手机排行榜】智能手机…
 2020 年全球十大最畅销智能手…
 智能机排行(10大智能手机排…
 VCX 公布智能手机影像排行榜…
 2022年智能手机性能排行榜手…
 咕咚codoon 专业智能运动手表…
 城市户外终极选择咕咚智能运…
 咕咚X3-RE运动手表评测:定位…
 5000字详细实测codoon 咕咚 …
 咕咚智能心率带守护运动安全
 中九大一分流选专业电子信息…
 电子信息类专业和计算机类差…
 今年最难考的几个专业出炉谨…
 高考成绩22日揭晓 决定命运的…
 考研界公认的最难的几个专业…
 75寸竟不到3000元 2022上半年…
 满血HDMI21!2022款Redmi智能…
 创维电视50A23-F 50英寸全通…
 创维电视50A23-F 50英寸全通…
 2022年智能电视机选购攻略
 国产协作机器人厂家有哪些?…
 6大工业机器人产业基地之争中…
 直击2023世界人工智能大会:…
 盘点中国十家机器人产业园
 湖北有武汉、襄阳、孝感等地…
 你梦想中的智能纯电动SUV已经…
 “智己知彼” 关于智己汽车我…
 首达40万辆交付的新势力车企…
 一篇文章看懂理想汽车智能驾…
 氪星晚报丨茅台回应跨界卖咖…
 伪原创文案AI写作: 总结4款…
 智能ai伪原创文章生成器推荐…
 关于人工智能的内容伪原创工…
 文章原创在线检测轻松了解文…
 从“Al换脸”到模仿人类灵感…
 万余个INC指数单元AI数据分析…
 【专业】人工智能(AI)加持…
 AI大数据分析细谈2018人工智…
专题栏目
网络
您现在的位置: 智能制造网 >> 人工智能 >> 正文
高级搜索
谷歌《自然》论文:回答医疗咨询AI医生可与人类医生表现相当
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/7/15 0:58:12 | 【字体:

  综琼瑶之容若下山·研究人员提出一个评估基准来评测大语言模型在临床知识方面的表现,在引入指令提示调整后,由此产生的模型Med-PaLM表现令人鼓舞:92.6%的长篇答案符合科学共识,与临床医生生成的答案(92.9%)相当;5.9%的答案被评为可能导致有害结果,与临床医生生成的答案(5.7%)的结果相似。

  ·“但是房间里有一头大象,这就是‘医学问题’和实际行医之间的区别。行医并不只是回答医学问题,如果纯粹是回答医学问题,我们就不需要教学医院,医生也不需要在学术课程之后接受多年的培训。”

  大语言模型已展现出令人印象深刻的功能,但临床应用的门槛仍然很高。人们敢相信AI医生吗?如何评估AI问诊有效性?在回答这些问题之前,医学界急需一个评测标准来鉴定。

  当地时间7月12日,Google和DeepMind的科研人员在《自然》杂志上发表一项研究,提出了MultiMed QA评估基准,用于评测大语言模型在临床知识方面的表现。结果研究人员发现,大语言模型构建的AI医生在很多方面与人类医生相当。

  谷歌的研究人员表示,这项技术不会威胁到全科医生的工作,但未来可能可以用于医疗求助热线。

  “医学是一项人性化的事业,语言为临床医生、研究人员和患者之间的关键互动提供了可能。然而,当今用于医学和医疗保健应用的人工智能(AI)模型在很大程度上未能充分利用语言。”论文写道,“这些模型虽然有用,但主要是单任务系统(例如用于分类、回归或分割),缺乏表达性和交互能力。因此,当今模型的功能与现实临床工作流程中的预期之间存在不一致。”

  MultiMed QA结合了涵盖专业医学、研究和消费者查询的6个现有医学问答数据集,以及包含3173个在线搜索医学问题的新数据集HealthSearchQA。研究者为模型的回答提出了一个人类评估框架,包括事实性、理解性、推理、可能的伤害和偏见几个指标。

  MultiMed QA结合了涵盖专业医学、研究和消费者查询的6个现有医学问答数据集,以及包含3173个在线搜索医学问题的新数据集HealthSearchQA,对PaLM进行了测试,并引入指令提示调整。

  然后,研究人员对大语言模型PaLM以及其变体Flan-PaLM进行了测试。通过结合提示策略,Flan-PaLM在每个MultiMedQA多项选择数据集上都取得了较高的准确度,包括在MedQA(美国医疗执照考试类型问题)上准确率达67.6%,比之前最先进的大语言模型还要高17%。

  尽管Flan-PaLM在多项选择题上表现强劲,但其对消费者医疗问题的回答却暴露出关键差距。为了解决这个问题,研究人员引入了指令提示调整,可以使用一些示例将大预言模型与新领域对齐。由此产生的模型Med-PaLM表现令人鼓舞。例如,临床医生小组认为,Flan-PaLM只有61.9%的长篇答案符合科学共识,而Med-PaLM答案的这一比例为92.6%,与临床医生生成的答案(92.9%)相当。同样,Flan-PaLM 29.7%的答案被评为可能导致有害结果,而Med-PaLM的这一比例为5.9%,这与临床医生生成的答案(5.7%)的结果相似。

  研究者提出,随着模型规模和指令提示的调整,理解力、知识回忆和推理能力得到提高,这表明大语言模型在医学领域具有潜在用处。不过,“尽管这些结果很有希望,但医学领域很复杂。进一步的评估是必要的,特别是在安全性、公平性和偏见方面。”

  论文作者维韦克·纳塔拉扬(Vivek Natarajan)博士表示:“我们希望医生能够信任这个项目。当人们转向互联网获取医疗信息时,他们会遇到信息超载,因此他们可以从10种可能的诊断中选择最坏的情况,并承受很多不必要的压力。这种语言模型将提供简短的专家意见,不带偏见,引用其来源并表达任何不确定性。”

  此外,这个项目可以用于分诊,了解人们的病情有多紧急,再让他们排队接受治疗。“当我们缺乏专业医生时,我们需要这个来提供帮助,这将使他们能够腾出时间来完成自己的工作。这确实令人兴奋,医生们不必担心人工智能会抢走他们的饭碗,因为这只会让他们有更多的时间与病人相处。”

  然而,巴斯大学教授詹姆斯·达文波特(James Davenport)告诉《每日邮报》:“新闻稿描述了这篇论文如何推进我们使用大型语言模型回答医学问题的知识,就其本身而言是准确的。但是房间里有一头大象,这就是‘医学问题’和实际行医之间的区别。行医并不只是回答医学问题,如果纯粹是回答医学问题,我们就不需要教学医院,医生也不需要在学术课程之后接受多年的培训。”

人工智能录入:admin    责任编辑:admin 
  • 上一个人工智能:

  • 下一个人工智能: 没有了
  •  
     栏目文章
    普通人工智能 谷歌《自然》论文:回答医疗咨询AI医生可与人… (07-15)
    普通人工智能 免费AI人工智能在线写作伪原创-百度ai自动写文… (07-15)
    普通人工智能 伪原创文案AI写作: 总结4款软件 (07-14)
    普通人工智能 智能ai伪原创文章生成器推荐让你写作如虎添翼 (07-14)
    普通人工智能 关于人工智能的内容伪原创工具 (07-14)
    普通人工智能 文章原创在线检测轻松了解文章质量! (07-14)
    普通人工智能 从“Al换脸”到模仿人类灵感Al伪造技术引发担… (07-14)
    普通人工智能 淘宝店家售卖“洗稿”神器:48元洗稿套餐伪原… (07-14)
    普通人工智能 原创流量不高洗稿速成爆款!酷玩实验室你们是… (07-14)
    普通人工智能 网络洗稿维权难:软件“秒洗”写手接单千字十… (07-14)
    普通人工智能 原创文章代写平台危险了AI自动写作神器即将替… (07-14)
    普通人工智能 山东乡村广播APP (07-14)
    普通人工智能 人工智能拓展生活应用新场景 (07-13)
    普通人工智能 AI技术不是你的错! (07-13)
    普通人工智能 星辉娱乐:公司处于人工智能的应用端 通过第三… (07-13)
    普通人工智能 美图秀秀AI绘画新功能上线 革新科技拓宽美学边… (07-13)
    普通人工智能 人工智能比赛让静安这家企业的员工提升了80%的… (07-13)
    普通人工智能 什么是动物的“结构化探索”?为什么这可以帮… (07-12)
    普通人工智能 专访美国国家工程院院士张捷:人工智能“听觉… (07-12)
    普通人工智能 AI行业研报:AI写的研报不具人类特有的理智和… (07-12)