紫东太初
对话问答
紫东太初

中科院与武智院推出的千亿参数全模态大模型和助手

紫东太初:国产全模态通用人工智能平台


1. 平台概况与最新进展

开发者:中国科学院自动化研究所(联合武汉人工智能研究院、华为昇腾AI)[[1][4][6]]

当前版本:紫东太初3.0(2024年11月发布)[[7][8][12]]

技术定位:全球首个实现"感知-认知-决策"闭环的全模态大模型,基于国产化全栈技术(昇腾AI+昇思MindSpore)[[4][6][14]]

名称寓意:"紫东"与自动化所谐音,"太初"象征人工智能从专用迈向通用的起点


2. 技术演进与核心突破

? 版本迭代路径

  • 1.0(2021.7):全球首个图文音三模态千亿参数模型,实现跨模态生成(如"以图生音")[[1][6][11]]
  • 2.0(2023.6):新增视频/3D点云/传感信号模态,突破认知增强技术,获世界人工智能大会SAIL奖[[4][9][14]]
  • 3.0(2024.11):强化逻辑推理与任务规划能力,OCR精度超GPT-4o 3%,支持25种工业场景智能体[[7][12]]

? 核心技术亮点

  • 全模态统一编码:12种模态数据(文本/图像/3D点云等)的协同表征与生成[[4][14]]
  • 动态掩码机制:视觉预训练中通过自注意力图指导遮蔽,保留关键结构(相比BERT随机遮蔽提升23%准确率)
  • MoE架构:3.0版本采用混合专家模型,实现万亿参数级推理

3. 应用生态与落地场景

? 垂直行业应用

医疗健康

  • 骨科器械识别准确率97%(效率提升6倍)
  • 神经外科手术导航实时多模态融合
智慧城市

  • 北京地铁13号线电控运维
  • 低空经济监测管理("紫东长空"子模型)
工业制造

  • 华工科技智能焊接工艺自动化
  • 中车集团机车设计智能体

? 用户端产品

  • 紫东太初APP:支持多轮问答/文本创作/图像生成(2024年12月更新至v2.1.0)
  • 开放服务平台:提供SaaS/私有化部署等6种交付模式,15个城市算力节点接入[[6][15]]

4. 技术架构与开源生态

⚙️ 基础架构

  • 底层框架:昇思MindSpore+昇腾AI硬件(全栈国产化)[[6][11]]
  • 模型规模:千亿参数级,40层Transformer(文本模型32亿参数)
  • 训练数据:整合中科院100+院所数据资源,含卫星遥感/城市交通等多源数据

? 生态建设

  • 多模态产业联合体吸纳120+企业/高校成员
  • 开源图像-文本-语音多模态模型(3.8B参数)
  • 与8所高校合作开发大模型课程

5. 竞争优势与未来规划

? 国际对标

  • 相比GPT-4o:在中文OCR、任务规划等场景精度领先3-5%
  • 相比微软CoDi:支持3D点云/传感信号等更丰富模态

? 发展方向

  • 构建"空天地一体化"监测网络(低空经济领域)
  • 推进建筑/教育等细分行业模型开源(如"大A天玑"建筑设计模型)

? 最新动态(2025年3月):发布国内首个低空行业大模型"紫东长空",支持24小时多源数据监测

? 访问技术文档
? 下载APP

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注