网站地图官方微信:
网站首页 平泉镇 娄烦镇 春阳镇 芦集镇 垫江县 乾龙乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二? |

    当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最...

    查看详情>>
  • | 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些? |

  • | 为什么 macOS 并不差,可市场总敌不过 Windows? |

  • | 你的低成本爱好是什么? |

  • | SQL Server 真的比不上 MySQL 吗? |

  • | 当量子计算机能预测人类选择,自由意志是否沦为算法的注脚? |

  • | PHP和Node.js哪个更爽? |

  • | 为什么开了这么多会,却依然提升不了员工的***? |

  • | Rust、Go、Zig、Dart、C3、C++、C,仓颉、moonbit、凹语言哪个语言更有未来? |

  • | 为什么还用导弹发射井,机动式部署不是更安全吗? |

  • | Office 中为何还要保留 Access 数据库? |

  • 题主已经拍过片子,腰五骶一存在椎间盘突出,但没有确定的是什么...

    2025-06-21
  • 更新一下,发现dart3的模式匹配,一定程度能缓解 最近因为...

    2025-06-21
  • 当年天涯上有一个帖子,讲的是社会如何通过驯化让底层人变得温顺...

    2025-06-21
  • 有个道理,很多人一辈子都不明白:现状不好,前途就大概率不会好...

    2025-06-21

关注我们

添加微信好友,关注最新动态