当云游戏还在卡顿、视频转码慢如蜗牛——英特尔ATS-M:用一颗GPU终结所有流媒体烦恼

你是否经历过这样的场景:兴致勃勃打开云游戏,却发现画面糊成一团、操作延迟让人抓狂?或者公司要上线一批视频课程,后台转码进度条龟速爬行,眼看deadline逼近却毫无办法?又或者远程办公时虚拟桌面频繁卡顿,开个视频会议都要祈祷别崩盘? 当云游戏还在卡顿、视频转码慢如蜗牛——英特尔ATS-M:用一颗GPU终结所有流媒体烦恼 IT技术

这些困扰着无数企业与开发者的流媒体与图形处理难题,或许即将迎来转机。

一个困扰行业的共同难题

做云游戏平台的李明(化名)最近很头疼。用户抱怨游戏串流体验差,团队排查后发现问题根源在于:处理像素、运行AI推理、渲染画面、传输至客户端这些操作,需要在云端部署四五种不同的独立产品。光是系统集成和维护成本就已经让人心力交瘁,更别说还要不断优化各个模块之间的协作效率。 当云游戏还在卡顿、视频转码慢如蜗牛——英特尔ATS-M:用一颗GPU终结所有流媒体烦恼 IT技术

这并非个例。在视频直播、在线教育、远程办公全面爆发的今天,传统数据中心架构正在遭遇前所未有的挑战。每一个看似简单的视频流背后,都涉及复杂的编码、解码、渲染、推理计算——而这些工作分散在不同的硬件和软件栈上,不仅运维复杂,成本更是居高不下。

一颗GPU的破局尝试

英特尔数据中心GPUATS-M的出现,瞄准的正是这个痛点。它的核心思路很朴素:既然工作负载类型越来越多,为什么不能用一颗GPU统一处理?

具体怎么做?ATS-M设计了两种配置。150W版本适合追求极致性能的场景,32个Xe内核配合4个Xe媒体引擎,处理复杂的游戏串流和4K视频转码绰绰有余。75W版本则走性价比路线,16个Xe内核的设计在功耗和算力之间找到了不错的平衡点,特别适合需要高密度部署的环境。

两种配置都搭载了英特尔首款面向数据中心的AV1硬件编码器。这意味着什么?相比传统的软件编码方案,AV1硬件编码器能在保持画质的同时节省30%的带宽。对于需要同时处理数十路甚至上百路视频流的服务商来说,这省下来的可不是一星半点的带宽成本。

那些让人头疼的细节,被一一拆解

做过虚拟桌面项目的技术团队都知道,GPU资源调度是个大难题。传统的方案只能对所有虚拟机进行全局设置,想单独优化某个关键虚拟机的性能?门都没有。ATS-M的虚拟GPU调度策略打破了这个限制——管理员可以针对每个虚拟机单独微调运行指令,这就好比从只能统一调节所有灯泡的亮度,升级到了可以独立控制每一盏灯。

更让人惊喜的是虚拟化授权费用的调整。业内其他厂商对硬件可扩展I/O虚拟化功能普遍收取额外软件授权费,这笔开支在规模化部署时相当可观。英特尔这次选择免费开放这项能力,对服务商来说无疑是个实实在在的利好。

从一个人到一群人的改变

回到开头提到的李明。在接触了ATS-M的早期测试方案后,他最直接的感受是:以前需要协调四五家供应商才能搞定的工作,现在一个团队加一套SDK就能覆盖。更重要的是,基于oneAPI开发的代码可以在不同硬件平台间无缝迁移,这让他的团队在技术选型上获得了前所未有的灵活性。

类似的故事正在多个领域上演。云游戏平台可以获得更流畅的串流体验;视频直播服务商可以降低带宽成本;企业IT部门可以用更低的总拥有成本部署虚拟桌面;AI开发者则能在统一的开发框架下高效调用CPU与GPU的混合算力。

选择,从来不只是性能

对于技术决策者而言,评估一款数据中心产品从来不只是看峰值性能数字。配套软件的成熟度、开发社区的活跃程度、授权模式的商业友好度,这些都是实实在在的影响因素。ATS-M的oneAPI开源堆栈、针对主流框架的优化支持、以及相对开放的授权策略,在这些维度上都展现出了足够的诚意。

芯片定于2022年第三季度正式发布,首批已有超过15家合作伙伴基于该产品进行设计。从纸面参数到生态建设,英特尔这次显然不想只做一个硬件供应商——它更希望围绕这颗GPU,构建一套完整的解决方案闭环。

至于这套方案最终能否如预期般改变行业格局,还需要时间与市场的双重验证。但至少在当下,它为那些在流媒体与图形处理困境中挣扎的技术团队,提供了一个值得认真考虑的新选项。