后摩智能携全新端边大模型 AI 芯片后摩漫界®M50 全矩阵新品亮相
2025年7月26日,2025年世界人工智能大会(WAIC 2025)在上海世博展览馆开幕,大会以 “智能时代 同球共济” 为主题,汇聚全球人工智能领域的顶尖企业、专家学者与行业精英。作为端边大模型 AI 芯片的领跑者,后摩智能携全新发布的端边大模型 AI 芯片后摩漫界®M50 (以下简称M50 )系列产品、后摩漫界®M30 (以下简称M30 )系列产品及端边大模型应用方案亮相,全面呈现存算一体技术在端边场景的落地成效。
后摩漫界®M50 首次亮相 存算技术让算力配得上智能的野心
作为专为大模型推理设计的新一代高能效端边 AI 芯片,M50 依托创新存算一体架构实现性能突破,单芯片算力达 160 TOPS,支持多精度运算,搭配最大 48GB 内存与 153.6 GB/s 带宽,为百亿级参数模型本地运行提供硬件支撑,让云级推理能力下沉至终端。同时,M50 采用多芯互联技术可动态扩展算力,超小尺寸适配紧凑型设备集成,本地计算模式从物理层保障数据隐私、杜绝云端延迟,目前已实现 7B/8B 大模型 25+tokens/s 的推理速度,成功将大模型能力融入 PAD / PC、智能语音设备、机器人等端边智能场景,推动端边设备从 “功能型” 向 “智能体” 升级。
M50 系列硬件 让模型在端边自在舒展
M30 系列持续落地 让AI设备融得进每一个场景
M30 系列通过技术验证与场景落地,为端边大模型的普及应用奠定了坚实基础,与 M50 系列形成技术迭代与场景互补,共同构建起覆盖全场景的端边大模型硬件体系。M30 芯片及系列产品,作为端边大模型应用的成熟解决方案,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问、DeepSeek等。其系列产品包括力谋®LM30 加速卡、力谋®SM30 计算模组、力谋®BX30 计算盒子等,覆盖从一体机到工业终端的多元场景。
智能办公场景中,后摩智能的应用方案展现本地化 AI 的独特价值。AI 会议助手依托M50 芯片的澎湃算力,实现实时语音转写、声纹识别、智能纪要生成,全流程本地处理保障数据安全;AI + 知识问答方案以轻量化部署支撑 7×24 小时稳定运行,160 TOPS 算力适配多样化需求;信创 AI + 公文写作方案通过自动化生成规范公文、智能审核,兼顾效率与合规性;依托M50、M30 芯片,这些方案让 AI 在安全可控的前提下深度融入政务处理与日常办公,推动场景化智能应用落地。
AI Stick
以存算一体深耕创新 解锁端边大模型应用新可能
随着人工智能大模型向端边侧深度渗透,传统芯片架构在算力供给、能效平衡与内存带宽上的局限性愈发明显,以存算一体技术为核心的创新路径成为突破端边智能瓶颈的关键。作为端边大模型 AI 芯片的领跑者,后摩智能在本次 WAIC 2025 上首次亮相的M50 芯片及系列产品,与 M30 系列形成技术迭代与场景互补的完整矩阵,以全场景覆盖能力为PAD、PC、智能语音设备、机器人等多种智能移动终端,以及一体机、计算盒子等边缘智能设备提供从 “功能型” 到 “智能体” 的升级引擎。未来,后摩智能将持续深耕存算一体技术,推动算力能效比与场景适配性的再突破,让大模型能力真正融入千行百业的终端及边缘端设备。
端边大模型应用体验