WeSearch

[Paper on Hummingbird+: low-cost FPGAs for LLM inference] Qwen3-30B-A3B Q4 at 18 t/s token-gen, 24GB, expected $150 mass production cost

May 3, 2026 · 12:55 PM UTC · 0 reactions · 0 comments · 3 views

via

LocalLlama

Original article

LocalLlama

Read full at LocalLlama →

Anonymous · no account needed

Discussion

0 comments

More from LocalLlama