无问芯穹

无问芯穹是领先的AI算力与大模型基础设施服务商,提供异构算力优化与大模型推理部署解决方案,助力企业高效低成本地落地人工智能应用。

访问官网
无问芯穹

特点

全栈算力服务

覆盖模型训练、微调、推理全链路,兼容PyTorch、TensorFlow等主流框架,降低AI开发门槛。

异构芯片调度

统一管理NPU、GPU等混合算力,智能分配任务,最大化资源利用率并优化成本。

弹性部署与微调

支持LoRA、QLoRA等高效微调方法,一键部署推理服务,根据负载自动扩缩,保障业务稳定。

基本信息

无问芯穹
  • 出品方:北京无问芯穹科技有限公司(清华大学电子工程系孵化)
  • 英文名称:Infini‑AI
  • 首次发布:2024 年 3 月(Infini‑AI 大模型算力平台正式上线)
  • 产品类型:AI 算力基础设施平台,支持大模型训练、推理及异构算力调度
  • 核心能力:统一调度多厂商 GPU、模型训练加速引擎、推理优化、一键部署环境
  • 最新产品:Infini‑AI 算力平台 V2.0(2025 年迭代),支持自动伸缩与混合云编排
  • 服务规格:提供 A100、H100、国产加速卡等实例,最高千卡集群,按秒计费

所获荣誉

无问芯穹
  • 2024世界人工智能大会SAIL之星:无问芯穹凭借“大规模异构算力集群高效调度与优化系统”项目获得该奖项,表彰其在AI算力基础设施领域的创新突破。
  • 国家级专精特新“小巨人”企业:公司因在高性能计算芯片适配、分布式推理引擎等方面的核心技术实力入选工信部第四批专精特新小巨人企业名单。
  • 中国算力大会“算力先锋”奖:在2023中国算力大会上,无问芯穹的“Infini-Megrez云端推理加速平台”被授予年度算力创新产品荣誉。
  • 上海市科技小巨人(培育)企业:2024年经上海市科委评审认定,公司在AI算力优化与芯片生态建设方面表现突出,获得该资质。
  • Gartner“中国AI基础设施创新者”:入选Gartner 2024年《中国AI基础设施市场指南》,被列为跨架构、跨厂商算力管理领域的代表性厂商。
  • 2024中国AI算力基础设施领军企业:由赛迪顾问和人工智能产业发展联盟联合评选,无问芯穹在算力池化、模型适配效率等维度综合得分排名前三。
  • 世界人工智能大会“卓越人工智能引领者”提名:2023年大会期间,公司展示的“国产芯片统一推理解决方案”获得评审团提名奖。

发展历史

2023年5月

无问芯穹(Infini-AI)在北京正式成立,由清华大学电子工程系教授汪玉联合多位AI基础设施领域专家发起,专注大模型推理效率与算力优化技术研发。

2023年8月

完成首轮数千万人民币种子轮融资,投资方包括红杉中国种子基金、北极光创投等,资金用于核心团队搭建与原型产品开发。

2024年1月

发布自研大模型推理加速引擎“Infini-Engine”内测版本,在主流GPU平台上实现Transformer类模型推理速度提升3-5倍,显存占用降低60%。

2024年4月

宣布完成近亿元天使轮融资,由启明创投领投,老股东跟投;同期启动“芯穹计划”,联合多家芯片厂商打造异构算力适配层。

2024年7月

正式上线Infini-AI云服务平台,提供模型推理、微调、部署一站式服务,首批支持英伟达、昇腾、寒武纪等多款AI芯片。

2024年11月

获得由美团龙珠领投的Pre-A轮融资,融资额超2亿元人民币;公司估值突破10亿元,团队扩展至120人,研发占比超80%。

2025年3月

发布第三代推理引擎Infini-Engine v3,首次支持MoE架构大模型的高效部署,单卡可运行千亿参数模型,与头部云厂商达成深度合作。