新しいAIが、ストリートビューの精度92%で1枚の写真から正確な位置を特定し、プロのGeoGuessrプレイヤーを上回ります。

知っておくべきこと
- スタンフォード大学の大学院生が、Google ストリートビューに基づいて正確な位置を特定できる AI 搭載アプリを開発した。
- このツールは 92% の精度を約束しており、推測の 40% 以上で正確な位置から 25 キロメートル以内に位置を絞り込みます。
- ベンチマークを実行中、このアプリは有名な GeoGuessr プレイヤーの Trevor Rainbolt を 6 試合で破りました。
- このアプリはOpenAIのCLIPニューラルネットワークをベースにしており、テキストと画像をリンクすることができます。
- このモデルは、安全性とプライバシーの懸念から、一般向けには出荷されていません。
生成AIは2023年に大きな注目を集め、2024年も同様の勢いを維持すると予想されています。確かに、ユーザーはこの技術をかなり活用しており、最終的には医療、教育、政治、そしてテクノロジー全般において驚くべき成果を上げています。マイクロソフトは、特にOpenAIの技術に数十億ドル規模の投資を行って以来、自社の製品とサービスのほとんどにAIを組み込む最前線に立っています。
同様に、この技術は安全性とプライバシーをめぐる問題にも直面しています。このことがユーザーを限界まで追い込み、AIに対する疑念を露骨に表明するに至っています。バイデン政権はこの問題を認識し、AIの利用を規制するためのガードレールを設けることを目的とした大統領令を発令しました。
関連:米国政府の輸出規制により、中国からの50億ドル相当の先進AI GPUがブロックされる
新年を迎えても、AIは依然として脅威となっています(特に、静かでプライベートな生活を好むユーザーにとって)。ソーシャルメディアはあなたの生活を全世界に公開します。幸いなことに、ソーシャルメディアアカウントを非公開にしたり、コメントやステータスの閲覧機能を制限したり、写真を共有する際に正確な位置情報を記載しないように設定したりするなど、プライバシーを確保するための巧妙な対策がいくつかあります。
しかし、上記の対策を講じていても、AIがあなたの正確な位置を特定できることをご存知でしたか?昨年、スタンフォード大学の大学院生グループが、写真に基づいてあなたの正確な位置を特定できるAI搭載アプリを開発しました。このアプリは、写真に写っているストリートビュー、あるいは一般的には共有された画像ソースに基づいて、あなたの位置を絞り込むことができます。
「画像の位置情報予測(PIGEON)」と呼ばれるプロジェクトによると、このアプリはGoogleストリートビューを参照することで、写真の正確な撮影場所を特定できます。さらに、写真の撮影場所を絞り込む際の精度は92%とされています。また、推測の40%以上で、正確な撮影場所から25km圏内まで絞り込むことも可能です。
この点を踏まえると、PIGEONはGeoGuessrプレイヤーの中で上位0.01%以内にランクインしました。ご存知ない方のために説明すると、GeoGuessingとは、Googleストリートビューに基づいて写真の撮影場所を正確に推測する地理ゲームです。少し背景を説明すると、これがPIGEONのコンセプトそのものだったのです。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
PIGEONはどのように機能しますか?
このアプリはOpenAIのCLIPニューラルネットワークを搭載しており、テキストと画像をリンクする機能を備えています。このモデルは、注目すべき視覚カテゴリーの名称を学習します。そして、世界的に有名なGeoGuessrプレイヤー、トレバー・レインボルトを6試合で破りました。
PIGEONプロジェクトの開始当初、スタンフォード大学の卒業生たちは、GeoGuessrからランダムに抽出した10万地点のデータを用いてアプリを学習させました。また、特定の場所の「パノラマ」全体をカバーする4枚の画像をダウンロードし、合計40万枚の画像を作成しました。
PIGEON プロジェクトに参加した卒業生の一人は次のように語っています。
「私たちは約50万枚のストリートビュー画像からなる独自のデータセットを作成しました。実際にはそれほど多くのデータではありませんが、非常に素晴らしいパフォーマンスを得ることができました。」
PIGEONは、特定の場所を正確に特定する際に、葉や天候といった重要な詳細を捉えることができます。これが、OpenAIのDALL-E 2などの他のモデルと比較して、PIGEONが驚異的なパフォーマンスを発揮する主な理由です。DALL-E 2は数百万枚の画像を用いて学習されており、さらに性能を向上させるための膨大なリソースも活用されていますが、それでもPIGEONはより優れた結果を示しています。
プライバシーの重大な侵害が迫っている
これは素晴らしい成果であり、大きな発展につながる可能性を秘めていますが、AI 搭載アプリが一般公開された場合に生じるであろうマイナスの影響を考えずにはいられません。
スタンフォード大学の卒業生たちは、このアプリが自動運転、視覚調査、セキュリティなどにおいて効果的なツールとなり得ると強調した。しかし、この技術が悪意ある者の手に渡り、本来の目的とは異なる悪意ある用途に利用された場合、引き起こされる被害は非常に懸念される。
そのため、このモデルは一般公開されていません。プロジェクトで共有されているように、学生たちは学術的な目的でのみコードを共有しました。
その結果、学生たちはモデルの重みを公表しないことに決め、学術的な検証のためにコードのみを公開したと論文は伝えている。
この新興技術と、それがプライバシーと安全へ与える長期的な影響について、あなたはどうお考えですか?コメント欄でぜひお聞かせください。
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。