posts/lpu-deep-dive/ #34
Replies: 1 comment
-
|
금번 GTC 2026행사에서 LPU 활용방안이 공개되었습니다. 골자는 단순 Prefill-decoding disaggregatipn이 아닌 decoding 연산 내에서 attention-ffn disaggregation, speculative decoding내의 lpu gpu 분산 처리입니다 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
posts/lpu-deep-dive/
그록과 LPU의 탄생 배경과 그들의 하드웨어 / 소프트웨어 설계 철학에 대해 알아보고 엔비디아가 그록을 인수한 의도에 대해 분석해봅니다.
https://hyper-accel.github.io/posts/lpu-deep-dive/
Beta Was this translation helpful? Give feedback.
All reactions