Copilot と ChatGPT は、70 年代の 4 KB Atari チェス ゲームと対戦しましたが、結果は残念な結果に終わりました。

Citrix のエンジニア Robert Caruso 氏は最近 LinkedIn に、Microsoft の Copilot チャットボットと ChatGPT の両方を 1970 年代の Atari チェス ゲームでテストしたという投稿をしました。このテストでは、46 年前の 4 KB の Atari 2600 ビデオ チェス ゲームが現代の人工知能に対して無敗のままでした。
カルーソ氏によると、ChatGPTをAtari製の「AI」と対戦させるという決断は、オープンソースのチェスエンジンStockfishとプログラムAlphaZeroの違いについてチャットボットと会話したことから生まれたという。カルーソ氏によると、会話は一転し、ChatGPTのチャットボットが「自分はそれ自体が強力なプレイヤーであり、AtariのVideo Chessに簡単に勝てる」と主張した。
そこでエンジニアは、1979年に発売されたAtari 2600用ゲーム「ビデオチェス」で、Stellaエミュレータを使ってチェスのゲームをセットアップしました。対戦中、ChatGPTは駒を間違え、盤面の状態を把握できなくなってしまいました。Carusoの支援を受けて盤面の認識を修正したにもかかわらず、90分間の対戦は失敗に終わり、最終的には初心者レベルでの敗北に終わりました。決して良いスタートとは言えませんでした。
人間と AI とチェスの間の戦いは、IBM の Deep Blue スーパーコンピューターがロシアのチェスのグランドマスターで元世界チェスチャンピオンのガルリ・カスパロフを破った 90 年代後半から激しく続いています。
カルーソ氏がChatGPTとAtariの対戦に失敗したことで諦めきれないのは当然のことでした。彼はMicrosoftの金字塔であるCopilotで同じ実験を繰り返すことにしました。「Microsoft製品がChatGPTを上回ったら、誰もが頭が爆発するだろうと想像してみてください」とカルーソ氏は書いています。
彼は、ChatGPTの場合と同じように、MicrosoftのCopilot AIを使った実験の冒頭部分を再現し、ゲーム開始前にチャットボットと「会話」を交わしました。CopilotはChatGPTとは異なり、盤面を追跡できると主張していたと報じられていますが、カルーソ氏がMicrosoftのチャットボットに想像通りの盤面をレンダリングするように指示すると、試合の現実がより鮮明になりました。
Copilot のボードは、Caruso が以前に入力したスクリーンショットとは異なっていました。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
「7ターン目までに、ポーン2つ、ナイト1つ、ビショップ1つを失い、代わりにポーン1つだけを失いました。そして、次のターンに捕獲されるアタリのクイーンのすぐ前にクイーンを置くように指示を出していました。」
Atari 2600 ビデオチェス: 2。
現代の LLM: 0。
カルーソ氏は、Google Gemini などの他の LLM でもこの実験を再試行する可能性を示唆している。
AIチャットボットには乗れない
消費者向けAI技術の台頭に伴い、企業は自社の大規模言語モデルチャットボットの能力を誇示したいという強いニーズが高まっています。AIがソフトウェアエンジニアや中間管理職に取って代わるというニュース記事が、絶え間なく流れてきます。
しかし、実際にテストしてみると、現代のAIに対するPRイメージの欠陥が露呈し始めます。これらのAIチャットボットは、子供たちに教えるゲームで、4KBのデータで構成される50年近く前のプログラムにさえ勝てないのです。
ChatGPTやMicrosoft CopilotのようなLLM AIは、エンジニアがチャットボットを必死に擬人化し、成功するためのあらゆる機会を与えたとしても、抽象的な思考や持続的な記憶を実現することができません。これらのモデルは実際には意味のある形で何かを「学習」しているわけではなく、単に入力された内容を、まるで誇張された予測テキストモジュールのように繰り返しているだけです。
マイクロソフトの元共同創業者であるビル・ゲイツ氏でさえ、AIが人間の創造性や判断力を再現できるとは考えていません。それでも、OpenAI、Google、Microsoftといった企業は、管理職でさえもAIが人間を置き換えることを推し進めています。
マイクロソフトの幹部らは、世界で最も価値のある企業となった同社の最近の大量レイオフの波を受けて、LinkedIn で履歴書作成用の AI ツールを宣伝した。それ自体が、マイクロソフトにとって AI への投資をさらに強化するための手段となった。
AIが70年代の8ビットゲームでルークとビショップの違いも見分けられないのなら、一体なぜこの技術が機密性の高い医療データを追跡できると信じられるというのか?あるいはエネルギーシステムのソリューションを生み出すことができると?そして、なぜ私たちはそれを実現しようとして地球を燃やそうと躍起になっているのか?
コールはWindows Centralの常連で、Call of Dutyの知識人であり、インディーゲーム愛好家でもあります。彼女はデジタルペインティングで20年の経験を持つ、生涯アーティストであり、低価格のペンタブレットについて喜んでお話してくれます。