芯云协同,算力普惠:英特尔x火山引擎专场,见证AI原动力进阶之路

openlab_96bf3613 更新于 21小时前

近日在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔®至强®6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例g4i、算力增强型实例g4ie,并深入展示了此前发布的I/O增强型实例g4il的丰富用例。不仅如此,双方还分享了AI时代共同驱动算力成本优化、端云协同与开发范式升级的最新合作进展。

点击链接,查看现场精彩瞬间

AI的发展推动着云计算的演进,加速行业从云原生时代迈向AI原生时代。在这一进程中,企业对算力的需求日益多样化,同时对高性价比、高稳定性的需求也与日俱增。基于多年的广泛合作,英特尔与火山引擎继续携手共进,一方面充分利用双方的优势,打造涵盖从通用到智能的弹性AI算力底座,为企业提供强大、灵活、兼顾成本效益的AI算力基础设施;另一方面,双方亦通过共建开放生态,支持大模型应用、智能体DevOps中台与高性价比智算平台相结合,构建AI生态新范式,加速企业的智能化进程。

高效算力底座,推动云端算力跃升

本次大会上,英特尔携手火山引擎共同发布了全新第四代ECS实例家族,不仅功能上更加丰富,在性能与架构上也得到了进一步提升。

与上一代实例相比,通用计算基础型实例g4i在MySQL数据库和Web应用上分别实现了20%和19%的性能提升,算力增强型实例g4ie在视频解码和图像渲染上带来了15%和26%提升,I/O增强型实例g4il在Spark大数据和Redis数据库上也实现了13%和30%的提升。

值得一提的是,得益于英特尔® 高级矩阵扩展(AMX)的深度优化,基础型实例g4i在RAG全链路提速、WDL模型推理优化上均展现了出色的性能。其中,RAG全链路在文档处理、Embedding、向量数据库检索和Reranking加速中,耗时减少了40%-90%。


高性价比智算平台,助力企业智能体进阶

边缘AI应用的发展,对定制化、便捷化和安全化提出了新的需求,这让具备灵活、高效、高性价比的智算平台成为理想之选。在基于英特尔至强处理器和多张英特尔锐炫显卡的一体机解决方案中,全新英特尔锐炫™ Pro B60,单卡可提供24GB显存,在上下文扩展和并发扩展等场景中,提供更强的处理能力。因此,在边缘和企业AI等应用场景中,该方案能够以出色的成本效益优势,提供高效、可靠的AI算力。


此外,英特尔提供了包括vLLM、PyTorch在内的完善的主流生态软件栈和封装成服务化的企业AI平台(EAP),帮助用户将上层应用平滑迁移到英特尔平台上,加速用户私有化部署LLM应用和智能体。

软硬件协同加速,焕新模型开发至应用落地

通过帮助企业打造弹性的AI算力底座,英特尔与火山引擎正携手推动AI技术在云端的普及与应用,护航AI云原生从开发到生产的全流程,本次活动的现场展区也展示了双方合作的丰富成果。

在企业AI应用开发侧,英特尔携手火山引擎基于第四代实例提供了大模型应用的开发环境——“开源大模型应用-知识库问答”应用镜像,支持开发者快速完成大模型的微调和推理环境的搭建。在结合HiAgent大模型能力中台时,能够从Dev到Ops全方位支持智能体规划、开发与应用,帮助降低AI落地的技术门槛和运营成本。

在助力企业AI生产领域,英特尔至强处理器和AMX加速引擎、配合火山引擎的深度优化,让企业在大模型落地阶段可以实现全流程性能提升,降低AI应用的部署成本,保障在高并发场景下的系统稳定性的同时,提升产品的整体性能与实际落地效率。





扫码观看专场分论坛精彩内容

通过共同构建开放的AI生态,英特尔与火山引擎正在推动AI算力普惠,打造高性价比的智算平台。展望未来,双方也将继续探索AI时代云计算的更多创新应用,以高效的算力加速低成本AI应用落地,助力企业的智能化升级之路。









【英特尔+火山引擎联手推出系列课:解锁 AI 开发新范式】

英特尔联合火山引擎,重磅推出「火山引擎系列课」,聚焦个人开发者如何成长为超级个体,以及企业开发者在大模型应用开发中面临的关键挑战。


本系列课程以“技术普惠”为核心理念,围绕研发人员的实际痛点,设置行业圆桌对话 + Demo 实战演示双重模块,深入讲解如何基于 CPU 云实例完成最优配置,并探索通过 RAG 实现高效启动路径。点击阅读原文,立即访问课程页面。

注释


1. 文档处理对比数据基于ecs.g4i.8xlarge+MinerU工具+OpenVINO测试,embedding对比数据基于ecs.g4i.16xlarge+bge-base-zh-1.5模型+ IPEX/16并发请求测试;reranking对比数据基于

ecs.g4i.16xlarge+bge-reranker-base模型+IPEX/16并发请求测试;向量数据库检索对比数据基于ecs.g4i.4xlarge+hnswlib算法库+P99检索召回率测试。

©英特尔公司,英特尔、英特尔 logo 及其它英特尔标识,是英特尔公司或其分支机构的商标。

*文中涉及的其它名称及品牌属于各自所有者资产。

0个评论