マイクロソフト、無料のSeeing AIアプリを30億人に提供

  • abmhh
  • 0 comments
マイクロソフト、無料のSeeing AIアプリを30億人に提供
Microsoft Seeing AI アプリ
MicrosoftのSeeing AIアプリは、iOSだけでなくAndroidでも利用可能になりました。 (画像提供:Microsoft)

知っておくべきこと

  • Microsoft は Android 向けに Seeing AI アプリをリリースし、アプリの利用範囲をさらに 30 億人に拡大しました。
  • Seeing AI は人工知能を使用して、視覚障害者や弱視者のコミュニティを支援します。
  • このアプリは、通貨の識別、手書きの読み取り、シーンの説明、文書の案内などのタスクを実行できます。

Microsoftは2017年に研究プロジェクトとしてSeeing AIアプリの開発に着手しました。その後、一般公開されるフル機能アプリへと進化を遂げました。これまでSeeing AIはiOS版のみでしたが、Android版でも利用可能になりました。世界中に30億人を超えるAndroidユーザーがいるため、今回の展開によりアプリのリーチは飛躍的に拡大します。

Seeing AIは、視覚障碍者や弱視者を支援するために人工知能を活用しています。書類やメニューの案内、紙幣の認識、画像の識別といった日常的なタスクを実行できます。アプリを使用するには、カメラを向けるか、写真を撮影します。

Seeing AIは現在18の言語をサポートしていますが、その数は2024年には36に増える予定です。

以下の機能は、Seeing AI の iOS バージョンに追加され、新しくリリースされた Android バージョンにも搭載されています。

  • 写真のより詳しい説明: シーン チャンネルの写真の簡単な概要に加えて、「詳細情報」をタップすると、画像の内容に関するより詳しい説明が生成されます。 
  • ドキュメントとチャット: ドキュメントをスキャンした後、読み上げを聞くだけでなく、メニューの項目やレシートの商品の価格について質問したり、記事を要約したりするために、Seeing AI とチャットすることもできます。 

Microsoft はまた、このアプリを知らない人のために、Seeing AI の主要な機能のいくつかを紹介しました。

  • ショート テキスト: カメラの前に現れるとすぐにテキストを読み上げます。 
  • ドキュメント:音声ガイドで印刷されたページをキャプチャし、元の書式のままコンテンツを読み上げます。Seeing AIとチャットすれば、情報を素早く見つけることができます。 
  • 製品: バーコードをスキャンし、音声ビープ音でガイドします。製品名とパッケージ情報(ある場合)を音声で読み上げます。 
  • シーン:撮影されたシーンの説明を音声で確認し、「詳細情報」をタップすると、より詳しい説明が表示されます。画面上で指を動かして写真内を探索し、様々なオブジェクトの位置を音声で確認しましょう。 
  • 人々 : あなたの周りの友達を識別します。 
  • 通貨:紙幣を認識します。 
  • : 知覚される色を識別します。 
  • 手書き: グリーティング カードのような手書きのテキストを読み取ります (一部の言語で利用可能)。 
  • ライト:周囲の明るさに応じて可聴音を生成します。 
  • 他のアプリの画像: 写真を Seeing AI と共有して認識してもらいます。 

以下のビデオは 4 年前のものですが、Seeing AI の一般的な概念を示しています。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

ショーン・エンディコットはWindows Centralのテクノロジージャーナリストで、Windows、Microsoftソフトウェア、AI、PCを専門としています。Windows 10と11からChatGPTのようなAIツールの台頭まで、主要なリリースを取材してきました。ショーンのキャリアはLumia 930から始まり、アプリ開発者との強いつながりを築きました。執筆活動以外では、アメリカンフットボールのコーチも務めており、チームの運営にMicrosoftのサービスを活用しています。ノッティンガム・トレント大学で放送ジャーナリズムを学び、X(@SeanEndicott_)とThreads(@sean_endicott_)で活躍しています。