画像からテキストを抽出するためのMicrosoft PowerToys追加ツール

知っておくべきこと
- Microsoft PowerToys には、画像からテキストを抽出するツールがまもなく追加されます。
- この機能により、ユーザーは長方形の領域を選択したり、単語をクリックしたり、画像を右クリックしたりできるようになります。
- 現時点では開発の初期段階にあるため、一般公開されるまでにはかなり時間がかかる可能性があります。
Microsoft PowerToysの新しいツールにより、アプリで画像からテキストを抽出できるようになります。GitHubではPowerOCRと呼ばれているこの機能は、まだ初期段階です。
OCRは光学式文字認識(Optical Character Recognition)の略です。OneNoteなど、Microsoftの他のアプリケーションでもこの機能をサポートしています。Office内では、名刺や印刷物からテキストを抽出できる多機能ツールです。PowerToysOCRは同様の機能を提供しますが、あらゆるアプリケーションで使用できるため、より幅広いコンテンツに対応しています。
「このPRでは、長方形の領域を選択したり、単語をクリックしたり、画像ファイルを右クリックしてPowerOCRを選択したりすることで、画面上の任意の場所でOCRを実行できる新しいPowerToyが導入されています」と、GitHubのこの機能に関するページには記されている。
PowerOCRの動作を短いビデオでご覧いただけます。将来的には、長方形の領域を選択したり、単語をクリックしたり、画像を右クリックしたりすることでテキストを抽出できるようになる予定です。
PowerOCRはまだ初期段階なので、一般公開されるまでにはしばらく時間がかかると思われます。「7月第1週時点では、このPowerToyを本番環境で使えるようにするにはまだ多くの作業が必要ですが、このツールだけをプルしてビルドしたい人にとっては、これがMVPと言えるでしょう。コードの大部分は私のリポジトリText Grabからコピーしたものです」と、この機能のプルリクエストの概要には記されています。
将来的には、PowerOCR に次の機能が追加される予定です。
- マルチモニターでの作業
- 各モニター内でカーソルをキャプチャする
- 画像の右クリックオプションを追加
- テストを追加する
- インストーラーに接続する
- 設定ページを追加
現時点では、このツールは単一画面上の選択領域内でのみ機能します。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
ショーン・エンディコットはWindows Centralのテクノロジージャーナリストで、Windows、Microsoftソフトウェア、AI、PCを専門としています。Windows 10と11からChatGPTのようなAIツールの台頭まで、主要なリリースを取材してきました。ショーンのキャリアはLumia 930から始まり、アプリ開発者との強いつながりを築きました。執筆活動以外では、アメリカンフットボールのコーチも務めており、チームの運営にMicrosoftのサービスを活用しています。ノッティンガム・トレント大学で放送ジャーナリズムを学び、X(@SeanEndicott_)とThreads(@sean_endicott_)で活躍しています。