Nvidia Cuda MAC版是一款应用广泛的驱动程序软件,Nvidia Cuda MAC官方版能够支持CUDA功能的GPU(图形处理器)的C语言开发环境,Nvidia Cuda MAC版还支持跨多个领域的加速插入,例如线性代数,图像和视频处理,深度学习和图形分析,满足用户的不同需求。
{mac3}
软件介绍
Nvidia Cuda MAC版是国际上大名鼎鼎的显卡厂商英伟达(Nvidia )专为Mac OS用户推出的一款 Compute Unified Device Architecture NVidia运算平台。它可以通过利用 GPU 的处理能力,可大幅提升计算的图像处理性能。
软件特色
Nvidia Cuda MAC版使用的前提条件是需要软件的支持,如 Photoshop ,Maya等等。开发人员现在可以使用C语言来为CUDA架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA的处理器上以超高性能运行。将来还会支持其它语言,包括FORTRAN以及C++。
使用方法
第一步:阅读《NVIDIA 软件许可》。下载之前请阅读该许可中所规定的条款。
欲下载驱动,请先接受许可中规定的条款。
第二步:下载驱动文件。
下载 – CUDADriver-6.5.14-macos.dmg。
第三步:安装。
必须在安装 NVIDIA 174; CUDA 174; 6.5.14 之前安装 Mac 专用 NVIDIA® Quadro 或 Mac 专用 NVIDIA 174; GeForce 174显卡
双击 CUDADriver-6.5.14-macos.dmg,以启动 CUDA 6.5.14 驱动程序安装程序。
在“CUDA 6.5 Installer Welcome”页面中点击“Continue”。
看完许可协议之后,点击“Continue”,然后点击“Agree”。
在“Standard Install”页面中点击“Install”。 系统将要求用户输入管理员密码。
一旦看到“Successful Installation”页面,则表示已经完成安装。 无需再重启系统了。
常见问题
CUDA 如何构建计算?
CUDA 广泛遵循数据并行计算模型。通常,每个线程对数据的不同元素并行执行相同的操作。
数据被分成 1D、2D 或 3D 块网格。每个块的形状可以是 1D、2D 或 3D,并且可以由当前硬件上的超过 512 个线程组成。线程块中的线程可以通过共享内存进行协作。
线程块作为称为“warp”的较小线程组执行。
CUDA 是否支持一个系统中的多个显卡?
是的。应用程序可以跨多个 GPU 分配工作。但是,这不是自动完成的,因此应用程序可以完全控制。
更新日志
CUDA 10.0 增加了对图灵架构(compute_75 和 sm_75)的支持
CUDA 10.0 增加了对称为 CUDA Graphs 的新编程结构的支持,这是一种新的异步任务图编程模型,可以更高效地启动和执行。有关更多信息,请参阅 API 文档
Warp 矩阵函数现在支持额外的矩阵形状 32x8x16 和 8x32x16。Warp 矩阵函数还包括使用张量核心执行子字节操作(4 位无符号、4 位有符号和 1 位)的能力(在 CUDA 10.0 中进行实验)
添加了对 CUDA-Vulkan 和 CUDA-DX12 互操作性 API 的支持
添加了对新指令 nanosleep 的支持,该指令将线程挂起指定的持续时间
添加了 6.3 版本的并行线程执行指令集架构 (ISA)。有关新的(sm_75 目标、wmma、nanosleep、FP16 atomics)和弃用指令的更多详细信息,请参阅 PTX 文档中的此部分
从 CUDA 10.0 开始,CUDA 运行时与特定的旧 NVIDIA 驱动程序兼容。一个名为“cuda-compat-" 包含在工具包安装程序包中。有关兼容性的更多信息,请参阅最佳实践指南中的部分
CUDA 支持以下新操作系统。有关支持的操作系统的完整列表,请参阅适用于 Linux 的 NVIDIA CUDA 安装指南中的系统要求部分
Ubuntu 18.04 LTS*
Ubuntu 14.04 LTS
SUSE SLES 15
OpenSUSE Leap 15
添加了对 Windows 上使用 CUDA 的点对点 (P2P) 的支持(仅限 WDDM 2.0+)
添加了一个新的 CUDA 示例来演示多设备协作组 API
CUDA 示例现在也可以在 GitHub 上获得:https://github.com/NVIDIA/cuda-samples
添加了用于检索 CUDA 设备的 LUID 的 API (cuDeviceGetLuid)
在设备管理 API (cudaDeviceGetLimit) 中添加了 cudaLimitMaxL2FetchGranularity 以设置 L2 的最大获取粒度(以字节为单位)
cudaDeviceProp 结构现在包含设备 UUID
在 TCC 模式下,在 Windows 上添加了对使用协作组 (cuLaunchCooperativeKernelMultiDevice) 跨多个设备进行同步的支持