NVIDIA Dynamo 的推出,为企业在 AI 推理范畴的降本增效提供了强盛的技术支持。然而,对于许多企业来说,尤其是那些缺乏大规模 GPU 集群资源的企业,如何高效利用这些先辈的推理技术仍是一个挑衅。
英智在高性能 H100 集群上,结合了 NVIDIA Dynamo 的高性能推理优化技术,优化了自有的英智大模型API私有摆设托管服务、英智大模型API公有云服务,进一步提升企业的 AI 推理效率,为企业提供稳定、高效的大模型 API 服务;同时,针对英智大模型推理一体机,可根据企业用户的需求,搭配 NVIDIA Dynamo 分布式推理框架。
1. 英智大模型API私有摆设托管服务