暴君的七夜罪妃IT之家 7 月 11 日消息,微软近日发布新闻稿,推出了名为可组合扩散模型(CoDi),这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。
微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。
CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。
CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 Microsoft 项目 i-Code 的一部分,该项目使用人工智能来增强人机交互。
IT之家在此附上 CoDi 项目官方介绍链接,感兴趣的用户可以深入阅读。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
空姐、乘客被甩到天花板,水瓶抱枕满天飞...国航一航班遭遇严重颠簸,亲历者:降落那一刻大家都在鼓掌
坐着“运-20”去上大学!空军“001号”招飞录取通知书主人辜瑞:实现一家三代从军梦
14700K性能提升17%,Threads在5天突破1亿用户,英伟达两位数增长
消息称苹果Vision Pro头显将采用SK海力士DRAM,与R1芯片配合使用
荣耀MagicPad 13跑分曝光:骁龙888加持,采用2.8K高刷护眼屏
|