TWIML AI Podcast
TWIML AI Podcast

The Race to Production-Grade Diffusion LLMs with Stefano Ermon - #764

Mar 26, 2026 · 1h 3m

Today, we're joined by Stefano Ermon, associate professor at Stanford University and CEO of Inception Labs to discuss diffusion language models. We dig into how diffusion approaches—traditionally used for images—are being adapted for text and code generation, the technical challenges of applying continuous methods to discrete token spaces, and how diffusion models compare to traditional autoregressive LLMs. Stefano introduces Mercury 2, a commercial-scale diffusion LLM that can generate multiple tokens simultaneously and achieve inference speeds 5-10x faster than small frontier …

اس حصے کو ابھی تک نقل نہیں کیا گیا ہے

AI کے ساتھ اس اي پيز کو نقل کرنے کے ليے STT.ai استعمال کريں اسپيکر کٹ گي ، ٹائم سٹیمپ اور متعدد فارمٹس ميں صادرات کے ليے صحيح متن حاصل کريں

اسپیکر کی تلاش لفظ سطح کے ٹائم سٹیمپ SRT، TXT، JSON کے طور پر برآمد کریں

مزید ایپیز