メインコンテンツにスキップ

CLI ウィザード

テストを実行せずに画像内のテキストを検証するには、OCR CLI ウィザードを使用できます。必要なものは以下だけです:

  • @wdio/ocr-service を依存関係としてインストールしていること、使用開始を参照
  • 処理したい画像

次のコマンドを実行してウィザードを開始します

npx ocr-service

これにより、画像を選択し、ヘイスタック(検索対象範囲)と高度なモードを使用するための手順を案内するウィザードが起動します。次の質問が表示されます

ファイルを指定する方法を選択してください

以下のオプションから選択できます

  • 「ファイルエクスプローラー」を使用する
  • ファイルパスを手動で入力する

「ファイルエクスプローラー」を使用する

CLI ウィザードでは「ファイルエクスプローラー」を使用してシステム上のファイルを検索するオプションが提供されています。コマンドを実行したフォルダから開始します。画像を選択した後(矢印キーとENTERキーを使用)、次の質問に進みます

ファイルパスを手動で入力する

これは、ローカルマシン上のどこかにあるファイルへの直接パスです

ヘイスタックを使用しますか?

ここでは、処理する領域を選択するオプションがあります。これによって処理速度を上げたり、OCRエンジンが検出するテキスト量を減らす/絞り込むことができます。以下の質問に基づいてxywidthheightのデータを提供する必要があります:

  • x座標を入力してください:
  • y座標を入力してください:
  • 幅を入力してください:
  • 高さを入力してください:

高度なモードを使用しますか?

高度なモードには次のような追加機能があります:

  • コントラストの設定
  • 今後さらに機能が追加される予定

デモ

こちらがデモです

Welcome! How can I help?

WebdriverIO AI Copilot