Practical AI
Practical AI

Technical advances in document understanding

Dec 02, 2025 · 49m

<p>Chris and Daniel unpack how AI-driven document processing has rapidly evolved well beyond traditional OCR with many technical advances that fly under the radar. They explore the progression from document structure models to language-vision models, all the way to the newest innovations like Deepseek-OCR. The discussion highlights the pros and cons of these various approaches focusing on practical implementation and usage.</p><p>Featuring:</p><ul><li>Chris Benson – <a href="https://chrisbenson.com/">Website</a>, <a href="https://www.linkedin.com/in/chrisbenson">LinkedIn</a>, <a href="https://bsky.app/profile/chrisbenson.bsky.social">Bluesky</a>, <a href="https://github.com/chrisbenson">GitHub</a>, <a href="https://x.com/chrisbenson">X</a></li><li>Daniel Whitenack – <a href="https://www.datadan.io/">Website</a>, <a href="https://github.com/dwhitena">GitHub</a>, <a …

ตอนนี้ยังไม่ได้บันทึกไว้

ใช้ STT.ai เพื่อบันทึกตอนนี้ด้วย AI ได้รับข้อความที่ถูกต้อง ด้วยการตรวจจับผู้พูด ตราเวลา และส่งออกในรูปแบบหลายรูปแบบ

ตรวจจับตัวเล่าเรื่อง ตราเวลาระดับคำ ส่งออกเป็น SRT, TXT, JSON

ตอนเพิ่มเติม