Chuyển đến nội dung chính

Trình Trợ Lý CLI

Bạn có thể xác nhận văn bản nào có thể được tìm thấy trong một hình ảnh mà không cần chạy thử nghiệm bằng cách sử dụng Trình Trợ Lý CLI OCR. Những thứ duy nhất cần thiết là:

  • bạn đã cài đặt @wdio/ocr-service như một dependency, xem Bắt Đầu
  • một hình ảnh mà bạn muốn xử lý

Sau đó chạy lệnh sau để khởi động trình trợ lý

npx ocr-service

Điều này sẽ khởi động một trình trợ lý hướng dẫn bạn qua các bước để chọn hình ảnh và sử dụng haystack cùng chế độ nâng cao. Các câu hỏi sau được đặt ra

Bạn muốn chỉ định tệp như thế nào?

Các tùy chọn sau đây có thể được chọn

  • Sử dụng "trình duyệt tệp"
  • Nhập đường dẫn tệp thủ công

Sử dụng "trình duyệt tệp"

Trình trợ lý CLI cung cấp tùy chọn sử dụng "trình duyệt tệp" để tìm kiếm tệp trên hệ thống của bạn. Nó bắt đầu từ thư mục bạn gọi lệnh. Sau khi chọn một hình ảnh (sử dụng phím mũi tên và phím ENTER), bạn sẽ chuyển sang câu hỏi tiếp theo

Nhập đường dẫn tệp thủ công

Đây là đường dẫn trực tiếp đến một tệp ở một nơi nào đó trên máy cục bộ của bạn

Bạn có muốn sử dụng haystack không?

Ở đây bạn có tùy chọn chọn một khu vực cần được xử lý. Điều này có thể tăng tốc quá trình hoặc giảm/thu hẹp lượng văn bản mà công cụ OCR có thể tìm thấy. Bạn cần cung cấp dữ liệu x, y, width, height dựa trên các câu hỏi sau:

  • Nhập tọa độ x:
  • Nhập tọa độ y:
  • Nhập chiều rộng:
  • Nhập chiều cao:

Bạn có muốn sử dụng chế độ nâng cao không?

Chế độ nâng cao sẽ có các tính năng bổ sung như:

  • thiết lập độ tương phản
  • nhiều tính năng khác sẽ có trong tương lai

Demo

Đây là một demo

Welcome! How can I help?

WebdriverIO AI Copilot