苹果跨平台本地 AI 时代来临! Apple ML框架MLX的CUDA后端全线测试通过

Electron.js 创办人、现任Apple MLX维护者的 Cheng Zhao(@zcbenz)昨日在X平台上发表一则贴文:「MLX 的CUDA后端,所有测试已全数通过。」这则简短的贴文,在开发者社群中引发了不小的涟漪。 主要原因是:MLX 是 Apple 专为 Apple Silicon 设计的机器学习框架,而 CUDA 是 NVIDIA 的独家 GPU 运算平台。 当苹果的ML框架宣布能完整支持NVIDIA的生态时,背后代表的意义远不止技术里程碑那么简单。

苹果跨平台本地 AI 时代来临! Apple ML框架MLX的CUDA后端全线测试通过-计算机王阿达

MLX 从「Apple Silicon 独占玩具」到跨平台框架

MLX 最早于 2023 年底由苹果 机器学习研究团队开源,采用类似 NumPy 的阵列运算接口,深度整合 Apple Silicon 的统一内存架构(Unified Memory),让开发者能在 Mac 上高效运行 LLM 推论甚至微调模型。

然而长期以来,MLX一直被视为「Apple Silicon 专属玩具」,因为它在 Mac 上跑得很顺,但出了 Apple 生态系就英雄无用武之地。 相较之下,PyTorch 虽然跨平台但效能调校复杂,NVIDIA 的 CUDA 虽然强大但绑定自家显卡。 MLX 的 CUDA 后端从 2025 年中开始由 zcbenz 主导开发,历经近一年的打磨,如今终于达到 full parity。

zcbenz:从 Electron 到 MLX 的传奇开发者

Cheng Zhao 这个名字,对资深开发者来说首先联想到的是 Electron.js:那个让网页技术跨界桌面应用的框架。 而在加入苹果全职投入MLX维护后,他再次扮演了「串联生态」的关键角色。

从他贴出的 GitHub diff 截图可以看到,这次里程碑的具体内容是删除了 这个文件——里面原本列着 和 等因「量化尚未实现」(Quantization NYI)而需要跳过 CUDA 测试的案例。 如今这些例外全部移除,代表MLX的CUDA后端功能已完整到位。python/tests/cuda_skip.pyTestQuantized.test_gather_matmul_gradTestQuantized.test_gather_qmm

苹果跨平台本地 AI 时代来临! Apple ML框架MLX的CUDA后端全线测试通过-计算机王阿达

Apple 拥抱 CUDA:开放还是算计?

从战略角度来看,这个发展颇具玩味。 多年来,Apple 在 GPU 策略上始终走自己的路,Metal API、自家 GPU 架构、对 CUDA 敬而远之。 如今MLX反过来支持CUDA,代表Apple承认NVIDIA的GPU生态在AI领域的重要性,选择打不过就加入的策略(其实由最近Apple开放外接NVIDIA显卡驱动就可见一斑)。

然而这并非单纯的妥协。 MLX 的设计哲学是「同一套程式码,随处运行」,开发者在 MacBook 上用 MLX 开发与测试,部署时可以直接在搭载 NVIDIA GPU 的云服务器上运行,无需任何移植工作。 这与 PyTorch 的「写一次、到处除错」形成了鲜明对比。

正如Apple ML研究团队在官方博客所说:「MLX的设计目标是让研究人员能快速迭代,同时保持模型在Apple Silicon上的最佳效能。」CUDA 后端的加入,无疑扩大了这个 vision 的边界。

此外,MLX 生态也在快速扩张。 2026 年 3 月,Ollama 宣布 Apple Silicon 推理引擎将改用 MLX,这对 MLX 来说是重要的生态认证。 从就能启用CUDA支持的简洁设计,也降低了开发者的采用门槛。pip install "mlx[cuda]"

本地 AI 跨平台时代来了?

MLX CUDA后端全线通过测试,对于本地AI开发者来说意味着什么? 最直接的影响是:如果你同时拥有 MacBook 和搭配 NVIDIA GPU 的台式机或云端实例,现在可以用 MLX 同一套代码无缝切换,不再需要维护两套不同的 PyTorch/CUDA 环境。

对于 Mac 用户来说,这也是一个好消息:MLX 在 Apple Silicon 上的效能持续精进,而且开发者社群写的MLX套件(如 mlx-lm、mlx-snn 等)现在也能在 NVIDIA GPU 上运行,扩大了生态系的吸引力。

当然,MLX 要真正挑战 PyTorch 的霸主地位,还有很长的路要走:PyTorch 的生态成熟度、社群规模、第三方套件数量都远非MLX能比。 但MLX走的是一条不同的路:简洁的API设计、深度硬件整合、以及现在跨平台的CUDA支持,它在「开发体验」这个维度上,确实提供了 PyTorch 做不到的丝滑感。

结语

「MLX 的 CUDA 时代,正式拉开序幕。」这句话或许稍嫌夸张,但这一小步,确实让MLX从Apple Silicon的舒适圈跨出了一大步。 当Apple的ML框架开始拥抱NVIDIA的生态,本地AI开发的版图正在悄悄重组。 接下来值得关注的是:MLX 能否吸引更多开发者与开源项目加入,真正打开那个「跨平台时代」。

(0)
麦克哥麦克哥

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注