返回首页  设为首页  加入收藏  今天是:
网站首页人工智能商业智能智能家居智能手表智能手机智能通信智能电视智能汽车智能机器人
相关文章
 最高识别率可达99%!刚刚火山…
 人工智能赋能工业制造AI质检…
 重磅赋能工业质检数智转型获…
 人工智能的诡异美学:12张图…
 15张高清大图带你看:世界互…
 中美AI新局势:中国大模型加…
 三款数字孪生产品深度解析:…
 大数据可视化认知分析系统:…
 卓创资讯:红桃3是公司自主开…
 2023年智能锁行业最受消费者…
 指纹密码锁公认十大品牌榜单…
 智能门锁排名前十名-十大品牌…
 即使劳力士再便宜这几款你也…
 世界十大名表买不起啊买不起…
 如何避开买表的十大误区_时尚…
 合合信息智能文档处理技术赋…
 智能文档处理技术突破大数据…
 直播预告|揭秘AI智能文本处…
 OPPO不再沉默!系统迎来最重…
 看电视玩街机 8款国产手机媲…
 回归传统 11款最值得购买非智…
 中国网络电视台上线 可看央视…
 网络电视看直播用什么软件
 中国网络电视台多终端全球直…
 我心目中最理想的新能源汽车…
 说一说你梦想中的未来汽车这…
 配双激光雷达 才卖2499万极越…
 机器人价格表:不同功能不同…
 2021最新机器人价格表大揭秘
 小米推出米家烹饪机器人售价…
 ai 写文章在线(在线写文章网…
 知网发布AI智能写作平台 支持…
 自动续写:文章续写的三个关…
 低门槛轻应用的智能实时数据…
 智能分析与预测:洞察市场趋…
 智能分析:将数据转化为业务…
 新时代智能生活:小米手机与…
 创意无极限 可DIY的小米智能…
 Xiaomi HyperOS 澎湃出发
 外媒评出全球最出色的5款智能…
 外媒高分推荐华为WATCH FIT …
 种草周雨彤同款vlog神器 京东…
 深度智能将成为视频监控行业…
 金奥博获15家机构调研:公司…
 深市上市公司公告(5月17日)
 2024年手机性价比排行榜前十…
 性价比最好的手机前五位
 2024年最受欢迎的五大性价比…
 OpenAI发布人工智能新模型 “…
 电视上怎么看世界杯直播?这…
专题栏目
网络
您现在的位置: 智能制造网 >> 智能机器人 >> 正文
高级搜索
最高识别率可达99%!刚刚火山语音ASR技术 实力获得国检中心权威检测
作者:佚名 文章来源:本站原创 点击数: 更新时间:2024/5/20 14:01:42 | 【字体:

  落落清欢19楼2023年1月9日,由国家工业信息安全发展研究中心举办的以“智融应用 质惠未来”为主题的人工智能高质量融合与安全应用研讨会在京举行。

  会上针对技术评测以及标准化工作带来的成果,研究中心公布了一众通过AI国检中心检验检测的优秀行业企业,其中火山引擎语音识别产品榜上有名,获得国家语音及图像识别产品质量检验检测中心(以下简称“AI国检中心”)颁发的语音识别增强级检验检测证书,在语音识别的基本要求以及扩展要求上均已达AI国检中心的最高等级标准。

  本次技术评测涵盖中文普通话、方言混合、语种混合识别在低噪和高噪唤醒下的识别效果和准确率等多个角度,经专业评测后最高语音识别字正确率可达99.54%,集中体现了在火山语音支持下的语音识别技术能力和产品方案成熟度获得了业界认可。

  作为我国质检系统在人工智能领域的首家、也是唯一的国家级语音及图像产品质量检验检测机构,AI国检中心始终致力于推动智能语音产业的健康发展。本次获得AI国检中心的权威检测,也充分表明了火山语音的语音识别技术能力已达行业领先水平。

  长期以来,火山语音(字节跳动 AI Lab Speech & Audio 智能语音与音频团队)将打磨多年的AI语音技术能力以及全栈语音产品解决方案面向市场并通过火山引擎开放给外部企业,目前已经覆盖多种语言和方言,涵盖音视频、有声阅读、语音交互、游戏、广告等众多行业应用场景,为抖音、剪映、飞书、番茄小说、Pico等核心业务提供了领先的AI语音能力应用与拓展。

  本次参评的火山引擎语音识别产品为火山语音团队自主研发的端到端流式语音识别系统,主要涵盖语音识别、断点检测、逆文本标准化、智能分句以及标点、口语顺滑等模块,对口音、复杂的声学场景都体现了更强的鲁棒性,对不同领域词汇的识别率以及推理速度、识别结果展示速度等均比其他竞品有大幅提升。

  众所周知语音识别主要负责将音频转换成文字,为了兼顾效率和成本,火山语音团队率先基于RNN-T框架,通过大量训练数据的积累和持续的算法优化,自研推出的端到端的流式语音识别系统,有效规避传统语音识别系统中涉及的大量人工假设,采用了业界领先的Conformer结构,做到同时对局部信息以及全局信息进行建模,识别效果较传统的CNN、LSTM和DFSMN等结构都有大幅提升。

  此外团队又从模型角度优化了Conformer的训练和推理耗时,主要通过下采样和Attention Mask等方式,凭借自研的模型压缩框架,自动对模型进行裁剪和量化,在降低计算复杂度的同时做到效果基本无损;并提出将上下文信息引入语音识别系统中来提升系统的识别效果,更充分的将对话历史信息融入到 RNN-T 模型中,目前该论文已成功入选全球最大的综合性语音信号处理盛会Interspeech2022。

  如今在火山语音ASR技术支持下,火山引擎语音识别产品已广泛应用于金融、传媒、互娱、游戏等多类应用场景中,例如在短视频成为全民时尚的今天,为了改变视频内容生产过程中传统添加字幕方式带来的反复听写校对以及逐帧对齐的费时费力,与过程中需要精通多语言并熟悉字幕文件的制作的高门槛要求,火山语音自研推出了智能字幕解决方案。

  该方案不仅能够高效识别方言与歌曲,还可以针对语种混合以及说话唱歌混合的场景有不错的识别效果;实践过程中团队通过对用户创作内容的音频特性以及领域分析,凭借算法优化大大提升语音识别对于噪声场景、多人说话等复杂场景的表现。尤其面对移动端用户针对功能响应时间的较高要求,即希望字幕可以既快且准,还做了大量的工程优化和策略,1分钟的视频只需2-3秒即可完成。

  除此之外为应对人们对于音频信息的获取效率远低于文本信息的获取效率的情况,火山语音又强力推出了“千言转文字,一字胜千言”的实时字幕解决方案,通过“语音识别+语音翻译”的AI链路让跨国家、跨语言交流变得更加流畅;凭借自动生成会议记录与纪要,做到大大提升与会者的工作效率,大幅减少会后整理和会中记录的工作量。

  值得提及的是,在2022年卡塔尔世界杯期间,火山语音的ASR技术能力还同步支持了上线抖音的“无障碍字幕直播间”,截至12月19日决赛,已有累计超过1905万人在该直播间观看了球赛,累计观看次数超过2624万次。

  赛事期间,火山语音团队通过自研推出的端到端的流式语音识别系统,着力解决了世界杯比赛场景中外国球员教练员的人名识别等难题,通过对足球相关领域专有名词、球队和球员名称等术语进行自动化语料挖掘,凭借语言模型干预和自动化热词干预完成专项优化,从而发挥更好的识别效果;还凭借对解说场景的分析以及对现场原声的分析进行模型调优,做到在“解说+现场原声+bgm”的复杂场景下也能准确识别,为观众呈现更佳的字幕效果,带来更好的观赛体验。

  无障碍字幕直播间展示 伴随不断的创新发展,火山引擎语音识别产品已广泛应用于视频娱乐、办公会议、硬件交互、智能客服等诸多行业,为用户提供了优质且有前景的语音识别解决方案。可以想见,未来在火山语音不断探索前沿科技与业务场景的高效结合的基础上,持续为用户体验和业务增长注入创新势能以实现更大价值乃是大势所趋。

智能机器人录入:admin    责任编辑:admin 
  • 上一个智能机器人:

  • 下一个智能机器人: 没有了
  •  
     栏目文章
    普通智能机器人 最高识别率可达99%!刚刚火山语音ASR技术 实力… (05-20)
    普通智能机器人 人工智能赋能工业制造AI质检成重要赛道 (05-20)
    普通智能机器人 重磅赋能工业质检数智转型获认可图麟科技同天… (05-20)
    普通智能机器人 机器人价格表:不同功能不同价格 (05-19)
    普通智能机器人 2021最新机器人价格表大揭秘 (05-19)
    普通智能机器人 小米推出米家烹饪机器人售价5999元 (05-19)
    普通智能机器人 新款“妻子”机器人开售上线一小时被抢空网友… (05-18)
    普通智能机器人 日本最新机器人妻子具备女友一切功能你想到的… (05-18)
    普通智能机器人 砖家:美国最新机器人老婆Alice面世与真人极度… (05-18)
    普通智能机器人 foxbot机器人的优点及用途介绍 (05-17)
    普通智能机器人 机器人的新定义 (05-17)
    普通智能机器人 实在智能丨智能机器人流程自动化的 2021年顶级… (05-17)
    普通智能机器人 硅胶娃娃体验馆乱象丛生:换顾客不消毒 有关系… (05-16)
    普通智能机器人 揭秘成人体验馆深圳男子寻求生理需求的新途径 (05-16)
    普通智能机器人 全国首家硅胶娃娃体验馆被查封 (05-16)
    普通智能机器人 “欢笑之余泪流满面”《我的女友是机器人》观… (05-15)
    普通智能机器人 99万元就能买到人形机器人 国产创新低价震撼市… (05-15)
    普通智能机器人 《开始推理吧2》迪丽热巴染蓝发戴唇环网友:我… (05-15)
    普通智能机器人 中国机器人产业图谱 (05-14)
    普通智能机器人 N夏厦今日上市 开盘上涨9392% (05-14)