Microsoft の Windows リコールは、Opera の Browser Operator が文書上で約束したとおりのものであるはずでした…

  • abmhh
  • 0 comments
Microsoft の Windows リコールは、Opera の Browser Operator が文書上で約束したとおりのものであるはずでした…
The Opera browser logo appears on the screen of a smartphone in Reno, United States, on December 6, 2024.
Operaは最近、Browser Operatorのプレビュー版を発表しました。このAIエージェントはAI機能を活用し、Operaの閲覧中に重要なウェブタスクを実行し、時間を節約します。 (画像クレジット: Getty Images | NurPhoto)

生成型AIは、私たちが世界、特にインターネットと関わる方法に革命をもたらしています。これは、Microsoft CopilotやOpenAIのChatGPTといったAI搭載チャットボットの急速な出現に一部起因していると考えられます。これらのチャットボットは、人々のオンライン検索の方法を変革しています。

専門家は、ChatGPT検索のようなツールが、検索分野でGoogleに食ってかかる可能性があると警告している。Googleは、競合他社に対してAI分野で優位性を維持するための「あらゆる要素」を備えていると主張しているが、OperaはAI分野における自社の地位を確固たるものにするために、大胆な動きを見せた。

同社は最近、Browser Operatorのプレビュー版を公開しました。予想通り、このAIエージェントはユーザーのブラウジング体験を向上させることが期待されています。

Opera 社によると、Browser Operator のリリースにより、ブラウザが AI 機能を活用して Web 上で重要なタスクを実行し、他のことに使える時間を節約できるようになるのは初めてのことだという。

AIエージェントはブラウザにネイティブで組み込まれていることは特筆に値します。そのため、ユーザーはウェブサイトにログインしたままでいられます。個人の認証情報は安全に保護され、不正なサードパーティベンダーに転送されることはありません。

Opera社は、このアプローチはサーバーベースのソリューションよりも処理速度が速いため、より信頼性が高いと主張しています。「Browser Operatorは、ユーザーが常に制御できる効率的で直感的なエクスペリエンスでこれを実現します」とOpera社は説明しています。

Opera のブラウザ オペレータはどのように機能しますか?

Browser Operator は、オンラインで靴下を購入するなどの日常的なタスクを簡単に引き受けてくれるので、より重要で差し迫った問題に集中できます。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

Operaによれば:

Browser Operatorは、ブラウザクライアントのローカルリソースを利用して自然言語で書かれた指示を理解し、AI Composer Engineがこの情報を処理してブラウザ内でタスクを完了します。フォームへの入力、注文の確認、その他の機密性の高いタスクの実行など、必要な操作を行う必要がある場合は、Browser Operatorは一時停止し、ユーザーに操作を促します。このプロセス全体を通して、ユーザーは制御権を持ち、いつでもBrowser Operatorから操作を引き継ぐことができます。また、要求したタスクを実行するために実行されたすべての手順を確認することもできます。

Opera社は、ウェブ開発における専門知識を活かし、他社との差別化を図り、ユーザーに役立つようブラウザにAIを組み込んだと述べています。「私たちはウェブページがどのように構築され、どのような外観になるかを熟知しています。そこで、AIを自社の領域に取り入れ、Browser Operatorを開発しました」と同社は付け加えています。

プライバシーとセキュリティへの懸念から、ユーザーはAIに対して露骨な懸念を表明していますが、OperaはBrowser Operatorの使用中にユーザーのプライバシーを保護することを約束しています。同社は、このAIツールはスクリーンショットや動画キャプチャに依存していないと述べています。

Browser Operatorは、使用中にキー入力やスクリーンショットなどの情報がサーバーに送信されないよう開発されました。Browser Operatorが介入を要求した場合、またはユーザーが操作を引き継いだ場合、AIによる情報処理は行われず、「再開」をクリックした場合にのみウェブサイトの読み取りが再開されます。

オペラ

Opera社は、このAIツールはネイティブで動作し、ユーザーの認証情報はデバイス内に限定されると改めて強調した。「DOMツリーとブラウザレイアウトデータを使用してコンテキストを取得します。つまり、ウェブページのテキスト表現を使用するということです」と同社は付け加えた。

同社は、Browser Operatorは画面のピクセルを解析する必要がないため、このアプローチはより高速で安全な代替手段だと宣伝しています。さらに、このツールは少なくともほとんどの場合、Webページを一度にスキャンするため、割り当てられたタスクをより簡単に実行できます。

クッキーの承認や検証ダイアログなどのポップアップダイアログは AI エージェントにとって抑止力のように思えるかもしれないが、Opera によれば、AI ツールはブラウザと同じように Web ページのデータを表示するため、そうではないという。

興味深いことに、MicrosoftはWindows Recallという類似製品を提供しています。しかし、Windows 11のこの機能は、複数のタスクをこなしながらインターネットを検索するユーザーを支援するのではなく、コンピューター画面のスナップショットを定期的にキャプチャし、自然言語を使ってPCで見た特定のコンテンツを検索できるようにします。

レドモンドの巨大企業は、セキュリティとプライバシーに関する一連の問題に悩まされており、ツールの使いやすさをめぐる論争を引き起こしている。

Opera はブラウザ オペレーターのプライバシーとセキュリティ機能をしっかりと把握しているようだが、このツールが紙面で報じられているような期待に応えるかどうかはまだ分からない。

ユーザーはOperaのサイドバーまたはコマンドラインからこの機能にアクセスできます。この機能はまだプレビュー段階であり、すべてのユーザーが利用できるわけではないことに注意してください。ただし、OperaはAI機能追加プログラムの一環として、このツールを広く利用できるようにする予定です。

Browser Operator は、Opera の専用ページから今すぐダウンロードできます

ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。