返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 英语的人工智能使用费比其他…
 中文AI“读心术”来了!研究…
 百度大数据+人工智能 突破高…
 探路者加强企业数据资源管理…
 ConverSight 融资900万美元利…
 中国电信OTN“专家服务”助力…
 LIDA:使用大语言模型自动生…
 NVIDIA Q4财报:业绩超预期游…
 打造未来家居云米科技引领智…
 打造个性化、定制化产品 促进…
 2023广州国际智能家居博览会
 皮阿诺40智能数字工厂:“智…
 睿住智能:以空间智能为核心…
 华为:2022年净利润下滑687%…
 俄罗斯真的出手了禁止在公务…
 印度又玩横跳?也开始“反美…
 利润低的生意绝对不能做
 回复@forcode: 像透明胶不粘…
 暖心!广州番禺免费为500多名…
 谷歌Pixel Watch 2智能手表配…
 歌尔股份:上半年营收同比增…
 你真的需要一块智能手表吗?…
 展现儿童成长科技新风尚 小寻…
 IPTV终端管理主要功能和关键…
 终端安全管理的建设方法
 玄讯智研:快消企业终端管理…
 终端管理中的三大问题
 终端突围:战略性终端管理五…
 最受欢迎的智能电视直播点播…
 全网最好用的七款高清直播软…
 电视直播软件有哪些?推荐几…
 什么APP可以看电视直播 手机…
 使用率最高最好用当贝市场为…
 年轻人等的智能汽车来了——…
 “智商”超越特斯拉WEY摩卡成…
 目前最先进的智能汽车
 搜狐智能汽车评测第三季 11款…
 国产智能汽车盘点各种黑科技…
 早教机十大品牌排行榜 早教机…
 年度最具潜力早教机器人企业…
 国产儿童陪伴机器人大盘点
 广州智博会开幕 智能机器人大…
 早教机器人十大品牌排行榜
 2017年人工智能行业现状与发…
 国际人工智能联合会议优质论…
 浅谈人工智能发展趋势
 学位法草案提交审议:用人工…
 朱民:人工智能的发展与全球…
 重庆市渝中区发展和改革委员…
 投资广东平台上线数字政府全…
专题栏目
网络
您现在的位置: 智能制造网 >> 人工智能 >> 正文
高级搜索
英语的人工智能使用费比其他语言便宜 15 倍 简体中文成本约为英语的两倍
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/8/30 11:51:33 | 【字体:

  如果这是宋史下载研究表明,对于类似 OpenAI 的服务,由于计算成本的计量和计费方式,英语输入和输出比其他语言要便宜得多,其中简体中文的成本约为英语的两倍,西班牙语为英语的 1.5 倍,而掸语则要贵 15 倍

  一项由牛津大学进行的研究发现,让一个大型语言模型处理一句缅甸语句子需要 198 个 tokens,而同样的英语句子只需 17 个 tokens。Token 代表通过 API 访问大型语言模型(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)的计算成本,这意味着使用服务处理缅甸语句子比处理英语句子要贵 11 倍。

  这种「标记化」模型意味着在不理想的情况下,访问和训练非英语语言模型会更昂贵。这是因为像中文这样的语言与英语在结构上(无论是语法上还是字符数量上)有所不同,从而导致其标记化的成本更高。

  举个例子,根据 OpenAI 的 GPT3 tokenizer,将「your affection」这个词组标记化为英语只需两个 tokens,而在简体中文中则需要八个 tokens。这是因为简体中文的文本虽然只有 4 个字符(你的感情),而英语文本有 14 个字符。

  微软自己在解释其 ChatGPT 模型的 API 访问和使用的页面上提供了一个很有用的工具,其中甚至包括了一个标记化工具,您可以用来测试每个提示的标记成本。在那里,我们可以看到在英语中,1 个 token 约等于 4 个字符,100 个 tokens 约等于 75 个英文单词。但是这种数学规则并不能应用于其他任何语言,微软清楚地表明了这一点。

  在人工智能相关的成本方面,英语的成本效益无可匹敌;例如,相对于输出而言,中文的成本是英语的两倍。但这只是 AI 公司迄今为止用于训练模型的可用训练数据的反映。人工智能的爆发已经向世界展示了高质量紧急数据(作为生活记录而产生的数据)的价值。

  此问题直接关系到 AI 公司希望实现递归训练的愿望,即能够用自己的输出训练 AI 模型。如果实现了这一点,那么未来模型仍将显示英语与其他语言相比的成本效益,其他语言的复杂性和更有限的基础训练数据导致了更高的标记化速率。

  为了进一步复杂化问题,似乎除了标记化之外,其他衡量成本的方法最终也会遇到相同的问题。无论是通过位数还是字符计数,显然没有任何一种语言能够超越英语的实际实用性——英语的「可压缩性」较高,因此标记数量较低。

  这意味着问题不在于模型的货币化方式;它实际上是技术和基础模型在训练中的一个真实局限。而且不难想象,这个问题会影响到各个版本的多语言模型。毕竟,它们几乎都是以相同方式构建的。

  当我们考虑到推出大型语言模型(如 ChatGPT)或生成式图像网络(如 Midjourney)的公司主要位于美国时,这种成本差异已经导致一些国家推出了培训和使用本地语言的大型语言模型的计划。中国和印度都这样做了,而且都声称这样做是为了配合英语为基础的 AI 网络所允许的创新速度。而这种速度主要受到访问和训练成本的限制。

  每个人都希望花尽可能少的钱获得尽可能多的东西,这是很自然的。而这些动态直接影响根据基础语言进行 LLM 培训和部署的成本。人工智能业务是如此复杂,其影响如此深远,我们必须非常小心地采取每一个小步骤。

人工智能录入:admin    责任编辑:admin 
  • 上一个人工智能:

  • 下一个人工智能: 没有了
  •  
     栏目文章
    普通人工智能 英语的人工智能使用费比其他语言便宜 15 倍 简… (08-30)
    普通人工智能 中文AI“读心术”来了!研究人员拟基于中文构… (08-30)
    普通人工智能 百度大数据+人工智能 突破高考英语单词记忆魔… (08-30)
    普通人工智能 2017年人工智能行业现状与发展趋势报告 (08-29)
    普通人工智能 国际人工智能联合会议优质论文13来自中国 (08-29)
    普通人工智能 浅谈人工智能发展趋势 (08-29)
    普通人工智能 学位法草案提交审议:用人工智能代写论文等学… (08-29)
    普通人工智能 朱民:人工智能的发展与全球化的未来 (08-29)
    普通人工智能 科大讯飞:公司AI学习机定义了人工智能学习机… (08-28)
    普通人工智能 智算无遗 黔进未来——2023年贵州省人工智能产… (08-28)
    普通人工智能 2023年的科技趋势预测中藏着哪些机会? (08-28)
    普通人工智能 我国人工智能产业如何实现“弯道超车” (08-28)
    普通人工智能 新基建按下智慧交通“加速键”让高速公路更聪… (08-28)
    普通人工智能 如何认定人工智能生成的虚假信息造成侵权?北… (08-28)
    普通人工智能 当人工智能代替我们来思考:算法与公共生活的… (08-28)
    普通人工智能 试析通用人工智能在心理学领域的应用 (08-28)
    普通人工智能 厘清中国人工智能的早期发展脉络 (08-28)
    普通人工智能 《梦幻新诛仙》放王炸阿根廷门票现场免费送展… (08-28)
    普通人工智能 美国人工智能专业学校介绍 (08-27)
    普通人工智能 好未来自研数学大模型MathGPT开启内测 用AI实… (08-27)