top of page

Bootcamp MasterClass AI for Document Understanding End-to-end System

  • Ảnh của tác giả: vn Cole
    vn Cole
  • 2 ngày trước
  • 2 phút đọc

Sự Tiến Hóa Từ OCR Truyền Thống Đến Document AI Thế Hệ Mới

Từ hóa đơn, chứng từ ngân hàng, hợp đồng đến giấy tờ tùy thân, việc trích xuất thông tin bằng máy tính từ lâu đã dựa vào công nghệ OCR. Tuy nhiên, OCR truyền thống thường xuyên gặp lỗi và khó hiểu được ngữ cảnh của tài liệu có bố cục phức tạp. Để giải quyết bài toán này, các doanh nghiệp đang chuyển dịch mạnh mẽ sang hệ thống Document AI – nơi trí tuệ nhân tạo không chỉ "đọc" chữ mà còn "hiểu" toàn bộ cấu trúc văn bản.

Nắm bắt xu hướng này, trung tâm Cole đã ra mắt khóa học Bootcamp MasterClass AI for Document Understanding End-to-end System với 12 buổi chuyên sâu và 1 dự án thực tế.

Chi Tiết Lộ Trình 4 Module Đỉnh Cao Chuẩn Production-Ready

Khóa học tập trung vào việc xây dựng một đường ống (pipeline) hoàn chỉnh từ Layout Analysis đến Production System.

Module 1: Xây dựng OCR Pipeline và Trích xuất thông tin (KIE)

Học viên sẽ được thực hành trên bộ dữ liệu thực tế SROIE để xây dựng hệ thống với các công nghệ lõi:

  • Phân tích bố cục (Layout Analysis) bằng DocLayout-YOLO.

  • Nhận diện vùng chữ (Text Detection) bằng MixNet và DB-Net.

  • Nhận diện ký tự (Text Recognition) thông qua kiến trúc PARSeq. Đỉnh cao của Module này là việc trích xuất thông tin trọng yếu (KIE) bằng cách Fine-tune mô hình LayoutLMv3.

Module 2: Khai Phá Sức Mạnh Của Vision Language Model (VLM)

Thay vì phụ thuộc hoàn toàn vào OCR, học viên sẽ tiếp cận phương pháp OCR-free Document Understanding. Giảng viên hướng dẫn kỹ thuật LoRA/QLoRA để Fine-tune các mô hình ngôn ngữ lớn như Qwen2.5-3B và InternVL cho tiếng Việt.

Module 3: Tối Ưu Hóa Mô Hình Và Đóng Gói Hệ Thống (Deployment)

Một mô hình AI thông minh đến đâu cũng vô nghĩa nếu nó chạy quá chậm. Bạn sẽ học kỹ thuật xuất mô hình sang ONNX Runtime, lượng tử hóa (Quantization INT8/INT4) nhằm giảm dung lượng bộ nhớ. Sau đó, học viên tự tay viết FastAPI để tạo cổng giao tiếp (API).

Module 4: Khả Năng Mở Rộng Với Docker Compose Và Kubernetes (K8s)

Để hệ thống chịu tải tốt, học viên sẽ học cách container hóa ứng dụng bằng Docker Compose và quản lý tự động thông qua Kubernetes (K8s).

Chuyên Gia Dẫn Dắt Và Đặc Quyền Tại Cole

Bảo chứng cho chất lượng khóa học là sự đồng hành của ThS. Nguyễn Hữu Đạt, Giảng viên tại Phenikaa University với hơn 5 năm kinh nghiệm thực chiến. Học viên được cung cấp slide, notebook, source code và checkpoint model. Đặc biệt, Top 3 học viên xuất sắc nhất sẽ được hoàn 50% học phí.

Link:

 
 
 

Bài đăng gần đây

Xem tất cả
Business Intelligence Fullstack

Sự Bùng Nổ Của Ngành Phân Tích Dữ Liệu Và Business Intelligence Dữ liệu đang được ví như "mỏ dầu" mới của thế kỷ 21. Bất kỳ doanh nghiệp nào, từ tập đoàn đa quốc gia đến các startup nhỏ, đều đang thu

 
 
 

Bình luận


0869 810 635

©2022 bởi coleblogvn. Tự hào được xây dựng từ Wix.com

bottom of page