对话问答

紫东太初

中科院与武智院推出的千亿参数全模态大模型和助手

链接直达手机查看

紫东太初：国产全模态通用人工智能平台

1. 平台概况与最新进展

开发者：中国科学院自动化研究所（联合武汉人工智能研究院、华为昇腾AI）[[1][4][6]]

当前版本：紫东太初3.0（2024年11月发布）[[7][8][12]]

技术定位：全球首个实现"感知-认知-决策"闭环的全模态大模型，基于国产化全栈技术（昇腾AI+昇思MindSpore）[[4][6][14]]

名称寓意："紫东"与自动化所谐音，"太初"象征人工智能从专用迈向通用的起点

2. 技术演进与核心突破

? 版本迭代路径

1.0（2021.7）：全球首个图文音三模态千亿参数模型，实现跨模态生成（如"以图生音"）[[1][6][11]]
2.0（2023.6）：新增视频/3D点云/传感信号模态，突破认知增强技术，获世界人工智能大会SAIL奖[[4][9][14]]
3.0（2024.11）：强化逻辑推理与任务规划能力，OCR精度超GPT-4o 3%，支持25种工业场景智能体[[7][12]]

? 核心技术亮点

全模态统一编码：12种模态数据（文本/图像/3D点云等）的协同表征与生成[[4][14]]
动态掩码机制：视觉预训练中通过自注意力图指导遮蔽，保留关键结构（相比BERT随机遮蔽提升23%准确率）
MoE架构：3.0版本采用混合专家模型，实现万亿参数级推理

3. 应用生态与落地场景

? 垂直行业应用

医疗健康

骨科器械识别准确率97%（效率提升6倍）
神经外科手术导航实时多模态融合

智慧城市

北京地铁13号线电控运维
低空经济监测管理（"紫东长空"子模型）

工业制造

华工科技智能焊接工艺自动化
中车集团机车设计智能体

? 用户端产品

紫东太初APP：支持多轮问答/文本创作/图像生成（2024年12月更新至v2.1.0）
开放服务平台：提供SaaS/私有化部署等6种交付模式，15个城市算力节点接入[[6][15]]

4. 技术架构与开源生态

⚙️ 基础架构

底层框架：昇思MindSpore+昇腾AI硬件（全栈国产化）[[6][11]]
模型规模：千亿参数级，40层Transformer（文本模型32亿参数）
训练数据：整合中科院100+院所数据资源，含卫星遥感/城市交通等多源数据

? 生态建设

多模态产业联合体吸纳120+企业/高校成员
开源图像-文本-语音多模态模型（3.8B参数）
与8所高校合作开发大模型课程

5. 竞争优势与未来规划

? 国际对标

相比GPT-4o：在中文OCR、任务规划等场景精度领先3-5%
相比微软CoDi：支持3D点云/传感信号等更丰富模态

? 发展方向

构建"空天地一体化"监测网络（低空经济领域）
推进建筑/教育等细分行业模型开源（如"大A天玑"建筑设计模型）

? 最新动态（2025年3月）：发布国内首个低空行业大模型"紫东长空"，支持24小时多源数据监测

? 访问技术文档
 ? 下载APP

相关导航

发表回复取消回复