← 返回列表

美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

发布日期:2026-04-05 来源:量子位 阅读:30

阿里通义万象大模型开启预约

阿里巴巴正式开启通义万象大模型的公开预约。这款模型主打图像生成和视频生成能力,是阿里在多模态AI领域的重要布局。

模型能力

通义万象在以下方面具有突出表现:

  • 图像生成:支持文生图和图生图,画质达到商业级水准
  • 视频生成:可生成最长10秒的高质量视频
  • 风格控制:支持多种艺术风格,包括中国风、动漫、写实等
  • 编辑功能:支持局部重绘、背景替换、风格迁移等

预约方式

用户可以通过以下渠道预约体验:通义千问App内的万象入口;阿里云官网的AI模型广场;钉钉工作台的应用中心。

技术特点

通义万象采用了阿里自研的扩散模型架构,针对中文场景进行了优化。模型特别擅长理解中文文化元素,生成的内容更符合中国用户审美。

商业模式

通义万象将采用Token计费模式,同时提供免费体验额度。企业客户可以申请API接入,用于内容创作、广告设计等商业场景。通义万象将面临Midjourney、Stable Diffusion、DALL-E等竞品的挑战。阿里的优势在于庞大的用户基础和完善的云服务生态。