覆盖模型训练、微调、推理全链路,兼容PyTorch、TensorFlow等主流框架,降低AI开发门槛。
统一管理NPU、GPU等混合算力,智能分配任务,最大化资源利用率并优化成本。
支持LoRA、QLoRA等高效微调方法,一键部署推理服务,根据负载自动扩缩,保障业务稳定。
无问芯穹(Infini-AI)在北京正式成立,由清华大学电子工程系教授汪玉联合多位AI基础设施领域专家发起,专注大模型推理效率与算力优化技术研发。
完成首轮数千万人民币种子轮融资,投资方包括红杉中国种子基金、北极光创投等,资金用于核心团队搭建与原型产品开发。
发布自研大模型推理加速引擎“Infini-Engine”内测版本,在主流GPU平台上实现Transformer类模型推理速度提升3-5倍,显存占用降低60%。
宣布完成近亿元天使轮融资,由启明创投领投,老股东跟投;同期启动“芯穹计划”,联合多家芯片厂商打造异构算力适配层。
正式上线Infini-AI云服务平台,提供模型推理、微调、部署一站式服务,首批支持英伟达、昇腾、寒武纪等多款AI芯片。
获得由美团龙珠领投的Pre-A轮融资,融资额超2亿元人民币;公司估值突破10亿元,团队扩展至120人,研发占比超80%。
发布第三代推理引擎Infini-Engine v3,首次支持MoE架构大模型的高效部署,单卡可运行千亿参数模型,与头部云厂商达成深度合作。