cuda编程指南,中文版,根据官方版翻译
摘 要 为了提高编码速率, 将视频编码中计算量较大的运动估计和离散余弦变换(DCT ) 系数计算移植到图像处 理器(GPU ) 上处理. 根据H. 264öA VC 的编码要求和处理器的并行结构, 提出了一种并行处理方法, 并利用统一计 算设备架构(CUDA ) 的计算平台, 实现了H. 264öAVC 中的运动估计和DCT 变换系数的计算. 实验表明: 在GPU 上 采用并行计算方法可较大
统一设备架构(CUDA) 是NV ID IA公司提出的一个基于GPU通用计算的开发环境, 它 针对GPU多处理单元的特性, 通过并行计算提高大规模运算的速度。根据CUDA技术的特点, 提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法, 并论述其关键技术和基本执行 流程。试验结果表明, 提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降。这 同时体现了CUDA的优势和局限性,
Compute unified device architecture (CUDA) is a software development platform that allows us to run C-like programs on the nVIDIA graphics processing unit (GPU). This paper presents an acceleration
NVIDIA CUDA v2.0原版英文手册
初学cuda必备的基础知识教程,希望对大家有所帮助
JOHN NICKOLLS, IAN BUCK, AND
MICHAEL GARLAND, NVIDIA,
KEVIN SKADRON, UNIVERSITY OF VIRGINIA
March/April 2008 ACM QUEUE
NVIDIA构架师的论文,想学cuda可以耐心看看。
NVIDIA工程师写的论文,不可不看。里面还有一些CUDA编程的小技巧。
CUDA 编程指南 3.0 中文版发布了。
cuda 源程序,gpu计算入门参考,《GPU高性能运算之cuda》里面的源程序