vLLM-XPU roadmap - 2026 Q1

Create this issue to track vLLM-XPU roadmap, feature development plan. will try to move to vLLM main repo. 

- [x] kernel migration. https://github.com/vllm-project/vllm/issues/33214
- [ ] torch accelerator API replacement. https://github.com/vllm-project/vllm/issues/30679 
- [ ] (WIP)xpu graph functionality support https://github.com/vllm-project/vllm/issues/26970 
- [ ] MLA support  https://github.com/vllm-project/vllm/pull/37143 
- [ ] sparse MLA support @wuxun-zhang
- [ ] WoQ compressed tensor support on BMG (Wint4A16/Wfp8A16, gemm/moe_gemm)
- [ ] xpu CI pipeline optimization  https://github.com/vllm-project/vllm/issues/37305 
- [x] xpu dockerfile refine. https://github.com/vllm-project/vllm/pull/31112/ 

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

vLLM-XPU roadmap - 2026 Q1 #141

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

vLLM-XPU roadmap - 2026 Q1 #141

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions