华为计划于11月21日发布一项AI领域的突破性技术,旨在解决算力资源利用效率问题。这项技术可以将GPU、NPU等算力资源的利用率从行业平均的30%至40%提升至70%,显著释放硬件潜能。

该技术通过软件创新实现英伟达、昇腾及其他三方算力的统一资源管理与利用,屏蔽算力硬件差异,为AI训练推理提供更高效的资源支撑。这一技术路径与以色列AI初创公司Run:ai的核心技术路线有共同之处。Run:ai自2018年成立以来,专注于GPU调度技术,致力于打造一个能将AI模型拆分并行运行的平台,无论硬件位于本地、云端还是边缘。
Run:ai的核心产品基于kubernetes构建,用于调度GPU的计算资源。通过动态调度、池化、分片等技术,优化GPU资源利用率,使深度学习训练与推理任务在企业级环境中高效运行。管理生成式AI、推荐系统、搜索引擎等工作负载时,需要复杂的调度来优化系统和底层硬件性能。
(网站咨询与信息版权问题处理:wfxxw@foxmail.com)