王小川新公司「百川智能」发布首个开源中英文大模型开源免费可商用最前线

返回首页　

设为首页　

加入收藏　

今天是:

网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人

王小川新公司「百川智能」发…
touch_id
PlusNotePro 智能机这些后缀…
搜索20
时尚健康新选择华为迄今为止…
小米手环8上手评测：全新升级…
公司的AI智能手环市场销量如…
暑期经济乘“热”而上学习机…
迄今为止华为最轻最薄的大屏…
浅谈低轨卫星通信
卫星通信系统的发展及其关键…
中国访谈_中国网
【核芯观察】卫星通信产业链…
2019年全球卫星通信行业市场…
2021年华为盒子刷机固件汇总
创维盒子软件下载
泰信盒子X1：让您的盒子永不…
2023年电视盒子流畅度最新排…
移动魔百盒刷机_IPTV机顶盒破…
公告精选丨巨轮智能与藦卡机…
智能机器人汉特云 Pre-A+ 轮…
直击2023警博会现场！高新兴…
AI测温、机器人问诊……这些…
联合光电：目前公司研制产品…
5万元以下纯电动轿车江淮电…
电动汽车将迎来起飞时刻
纯电动BMW i4再添新车型让更…
电动汽车5万元以下推荐便宜…
做“中国电动界保时捷”昊铂…
海天瑞声(688787SH)：可服务…
迄今最复杂人工智能语音模型…
探索AI时代的翻译技术：时空…
循环智能亮相2023世界人工智…
思必驰：以全链路人工智能语…
10 分钟玩转Elastcisearch—…
国内最大BI国产化替换项目永…
7款电商数据分析软件对比后面…
AI重塑千行百业华为云发布盘…
浅谈商业智能BI的过去、现在…
融资合伙人入围项目为新零售…
36氪首发丨以对话智能分析技…
“时尚海盐家”全民时尚文化…
开门红爆品新蛋发布北美第一…
南京我乐家居股份有限公司关…
【独家解读】超400万人下单的…
准大学生看过来骁龙系精品手…
“软件定义汽车”浪潮之下车…
重新定义智能手机的未来形态…
高端市场潜力大中国智能手机…
华为WATCH GT Cyber可换壳新…

专题栏目

您现在的位置：智能制造网 >> 智能手机 >> 正文

高级搜索

王小川新公司「百川智能」发布首个开源中英文大模型开源免费可商用最前线

作者：佚名文章来源：本站原创点击数：更新时间：2023/7/8 20:11:03 | 【字体：小大】

　　香国特攻王小川新公司「百川智能」发布首个开源中英文大模型，开源免费可商用最前线

　　在C-Eval、AGIEval、MMLU等多个NLP权威测试中，baichuan-7B综合效果都位于当前中文大模型的前列。

　　36氪获悉，6月15日，百川智能公司正式推出中英文预训练大模型——baichuan-7B，参数量为70亿。

　　在MMLU英文权威评测榜单上，baichuan-7B也超过了Meta旗下的LLaMA-7B。MMLU是由加州大学伯克利分校等知名高校共同打造，集合了科学、工程、数学、人文、社会科学等领域的57个科目，主要目标是对模型的英文跨学科专业能力进行深入测试。其内容广泛，从初级水平一直涵盖到高级专业水平。

　　而AGIEval评测基准则是由微软研究院发起，意在全面评估基础模型在人类认知和问题解决相关任务上的能力，包含了中国的高考、司法考试，以及美国的SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。在AGIEval的评测里，baichuan-7B综合评分达到34.4分，超过LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他开源模型。

　　此次开源内容包含推理代码、INT4量化实现、微调代码，以及预训练模型的权重。其中，微调代码方便用户对模型进行调整和优化；推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用。在预训练模型权重开源后，用户则可以直接使用预训练模型进行各种实验研究。

　　而在数据质量上，通过质量模型对数据进行打分，对原始数据集进行篇章级和句子级的精确筛选，对数据进行了多层次多粒度的聚类，最终构建了包含1.2万亿token的兼顾质量和多样性的预训练数据。

　　训练又是另一个重要的工程壁垒。baichuan-7B整合了模型算子来加快计算流程，并针对任务负载和集群配置，自适应优化了模型并行策略以及重计算策略。通过高效的训练过程调度通信，baichuan-7B成功地实现了计算与通信高效重叠，进而加速了训练效率，在千卡集群上训练的吞吐速度达到180+Tflops——这也相较业界平均水平要高。

　　本次百川开源的的预训练模型也将开源模型窗口进行扩展，开放了4K的上下文窗口。当前，已有的开源模型窗口长度在2K以内——对一些长文本建模任务，以往模型的处理效果可能会有所制约。在需要引入外部知识做搜索增强的场景，延展到4K后，模型在训练与推理阶段就能捕获越多的上下文信息，从而让模型的应用场景更广泛。

　　而对于大模型的“幻觉”问题，baichuan-7B也对模型训练流程进行深度优化，在这一问题上有所改善。据百川智能团队介绍，训练中，百川采用了更稳定的训练流程和超参数选择，使baichuan-7B模型的收敛速度大大提升。和同等参数规模的模型相比，baichuan-7B在困惑度（PPL）和训练损失（training loss）等关键性能指标上表现更加优秀。

智能手机录入：admin 责任编辑：admin
	上一个智能手机： touch_id 下一个智能手机：没有了

　栏目文章

王小川新公司「百川智能」发布首个开源中英文… (07-08)	touch_id (07-08)
PlusNotePro 智能机这些后缀都啥意思 (07-08)	搜索20 (07-08)
【独家解读】超400万人下单的“沪惠保”买之前… (07-08)	准大学生看过来骁龙系精品手机汇总颜值影像和… (07-08)
“软件定义汽车”浪潮之下车载智能计算平台迈… (07-08)	重新定义智能手机的未来形态荣耀Magic V2或给… (07-08)
高端市场潜力大中国智能手机品牌探索发展新路… (07-08)	怎么查询银行卡是一类卡还是二类卡银行卡一和… (07-07)
老年人为什么要用智能手机？原因很简单！并不… (07-07)	养教有方：家长如何引导孩子正确使用手机？ (07-07)
别让孩子沉迷手机 (07-07)	16岁孩子为什么沉迷手机无法自拔 (07-07)
“秒充”离我们还有多远？石墨烯：神奇的“新… (07-06)	手机资讯-手机相关资讯-天极网 (07-06)
再起纷争浅谈智能手机后盖材质的前世今生 (07-06)	河南省人民政府门户网站 (07-06)
可弯曲的智能手机材料或将采用石墨烯 (07-06)	什么样的手机最打扰工作？ (07-06)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	智能制造网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！