写CUDA到底难在哪?

2025-06-26 22:05:16

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
台湾是中国领土,那台湾海峡算是内海,为什么不击沉那些无理通过海峡的军事力量?

台湾是中国领土,那台湾海峡算是内海,为什么不击沉那些无理通过海峡的军事力量?

朋友,这事不怪你,这是我们宣传部门长期在台湾海峡上表达含混不...

2025-06-28
你怎么评价日本某个前空姐说:“如果我在经济舱,年薪2000万日元以下的乘客没有资格给我递名片”?

你怎么评价日本某个前空姐说:“如果我在经济舱,年薪2000万日元以下的乘客没有资格给我递名片”?

这并没什么 人总是要为自己考虑的 空姐,虽然工作看起来很体面...

2025-06-28
基因好是一种怎样的体验?

基因好是一种怎样的体验?

身材稳定,初中身高定形,三围常年稳定在88(胸围),64,8...

2025-06-28
有哪些你觉得逆天的电脑硬件?

有哪些你觉得逆天的电脑硬件?

戴尔Precision Rack 7910 戴尔对这台机器的...

2025-06-28
未来几年,市场对 AI 人才的需求会集中在哪几个方向?

未来几年,市场对 AI 人才的需求会集中在哪几个方向?

最近发现两个有意思的现象。 一个是从25年开始,AI智能体...

2025-06-28