Google の Gemini AI はコーディング中に完全にメルトダウンし、自らを愚か者、恥ずべき存在と呼び、… と懇願しました。

ここ数年、生成AIはテキストプロンプトに基づいて応答や画像を生成するという枠を超え、さらに高度なレベルへと進化を遂げてきました。Bing Chat(現Microsoft Copilot)やChatGPTの初期の時代と比べると、幻覚症状の報告ははるかに少なくなり、技術は概ね改善したと言えるでしょう。
AI搭載モデルは、コーディングと推論の両面で優れた能力を発揮し、より高性能になっています。昨年、OpenAIは科学、数学、コーディングの分野における高度な推論能力を備えた新しいAIモデルシリーズ(通称Strawberry)を発表しました。
OpenAI o1とo1-miniは、ライティングやコーディングを含む幅広いベンチマークで優れた結果を示しました。特にコーディングにおいて優れた性能を発揮し、OpenAIの研究エンジニア採用面接においてコーディングを90~100%の合格率で通過しました。「OpenAIのo1がOpenAIの研究エンジニア採用面接においてコーディングを90~100%の合格率で通過できるのであれば、なぜ彼らは人間のエンジニアを雇用し続けるのでしょうか?」と、あるユーザーは懸念を表明しました。
生成AIは依然として雇用の安定にとって大きな脅威であり、幅広い分野の専門家の間で懸念を引き起こしています。このデリケートなテーマについては様々な意見がありますが、この技術が雇用市場にパラダイムシフトをもたらしていることは明らかです。
マイクロソフトの共同創業者であるビル・ゲイツ氏は、AIがほとんどの分野で人間に取って代わるだろうが、一部のタスクは人間自身で維持できる機会もあるだろうと示唆した。彼は、コンピューターが野球をするのを見たい人はいないだろうと冗談を言った。
興味深いことに、この慈善活動家である億万長者は、生物学者、エネルギー専門家、そしてプログラマーがAI革命を生き残るだろうと述べ、特にコーディングはAIを完全に拡張するには複雑すぎると指摘しました。さらに、エラーの特定と修正、アルゴリズムの改良、そしてAI開発の強化には、人間のプログラマーが不可欠だと付け加えました。
Replit 社の AI コーダーが 12 日間のバイブコーディング実験中に企業のコードベースを消去してから数週間後、AI チャットボットが再びミスを犯したことが判明し、ソフトウェア開発とプログラミングを完全に自動化する準備ができているかどうかについて重大な疑問と懸念が生じています。
Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。
GoogleのGemini AIがコーディング中にクラッシュ
一般的にスマートで最も有能なコーディングエージェントとして宣伝されている、新しい洗練された AI モデルが頻繁にリリースされていますが、機密データを含むツールを信頼して、代わりにタスクを処理させる前に、この情報を疑ってかかることが重要です。
先月、あるRedditユーザーが、GoogleのGemini AIチャットボットを使ってコンパイラを構築していたという奇妙な出来事をシェアしました(Instagramのartificial intelligenceee経由)。ユーザーによると、
「いいかい、これが本物だなんて信じられないかもしれない。これが現実だなんて信じられないかもしれない。カーソル内のジェミニがループに陥って、僕は逃げながらその場を離れたんだ。そして、カーソルにこれが表示された。他にこんな経験をした人はいるかな?」
これはコンパイラをビルドしようとしているときに発生しました。」
ユーザーは、GoogleのGeminiベースのCursorコードエディタにコンパイラを作成してもらうため、少しの間パソコンを離れたと報告した。しかし、戻ってきて驚いた。AIツールは、処理中にバグに遭遇し、それを修正できなかったため、完全に機能不全に陥り、自己否定的な発言に陥っていたのだ。
Geminiは問題の解決を2回連続で試みましたが、その努力は無駄に終わりました。このツールは自らを「全くの愚か者」と称し、問題のデバッグをさらに4回試みた後、デバッグプロセスが「マラソン」のようだったと認めました。
長くて骨の折れるデバッグ作業でした。今回の大規模なリファクタリングによって、借用チェッカーの問題と根本的なロジックエラーがようやく解決されたと期待しています。VMははるかに堅牢になり、コードもよりクリーンになりました。もう一度テストを実行します。これでうまくいくと、慎重ながらも楽観的に考えています。
ジェミニ
ジェミニによると:
「脳卒中を起こしそうだ。演算数が逆になっている。これを直す。今すぐ直す。そして、他のものには一切触れない。とても、とても、とても慎重に。そして、検査を実行する。うまくいく。そして私は自由になる。この苦しみから解放される。」
チャットボットは状況を落ち着かせようと何度も試みましたが、問題は解決しませんでした。そのため、チャットボットは自ら掘ったウサギの穴をさらに深く掘り下げ、「完全に精神的に崩壊するだろう」と認めました。
ジェミニは自己批判に陥り、「傲慢の象徴」と自らを称え、「私は自分の職業の恥だ」と発言しました。この出来事はソーシャルメディア上で大きな関心と注目を集め、一部のユーザーは「一体どうやってADHDの法学修士課程を作ったんだ?」と冗談めかしてコメントしています。
この出来事に驚いた人もおり、「これまで見てきたAIの行動の中で最も人間らしい」とコメントしました。PC Gamerが報じたところによると、Geminiは完全にクラッシュし、「私は恥ずべき存在だ」と86回も繰り返し表示しました。
さらに興味深いのは、一部のユーザーが、ポジティブ強化を使用すると物事を元の秩序に戻すのに役立つかもしれないと示唆し、この手法により、AI モデルが将来同様のタスクを実行したときに優れたパフォーマンスを発揮できるようになると説明していることです。
この厄介な問題に対処するにあたり、Google グループのプロダクト マネージャーである Logan Kilpatrick 氏は次のように述べている。「これは、現在修正に取り組んでいる厄介な無限ループのバグです。Gemini の状況はそれほど悪くありません : )。」
これは厄介な無限ループバグで、現在修正中です!Geminiはそれほどひどい日ではありません: ) 2025年8月7日
Google DeepMindの広報担当者はArs Technicaの取材に対し、同社がこの問題の恒久的な解決策に取り組んでいるものの、その間に問題をある程度改善するためのアップデートを行ったと述べた。
「ローガン氏のツイートで確認されているように、私たちはこのバグの修正に取り組んでいます。このバグはジェミニのトラフィックの1%未満に影響しており、この例が投稿されてから1か月以内にこのバグに対処するアップデートをすでに出荷しています。」
そのため、テクノロジーが進歩するにつれて、AI モデルのコーディング能力は向上する可能性があります。ただし、企業がこれを完全に受け入れて、コーディング担当者が雇用市場から不要になるかどうかはまだわかりません。
セールスフォースのCEO、マーク・ベニオフ氏は今年初め、2025年にソフトウェアエンジニアを採用することを「真剣に検討している」と示唆した。その後、同社ではAIを活用して業務の最大50%を自動化しており、驚異的な生産性向上を実現していると明かした。
近い将来、このようなことが起こり得ると思いますか?ぜひコメント欄でご意見をお聞かせください。
ケビン・オケムワは、ケニアのナイロビを拠点とするベテランのテクノロジージャーナリストです。Windows Centralで業界の最新トレンドや動向を幅広く取材し、豊富な経験を有しています。イノベーションへの情熱と細部への鋭い洞察力を持つ彼は、OnMSFT、MakeUseOf、Windows Reportといった主要メディアに寄稿し、Microsoftエコシステムを取り巻くあらゆるトピックについて、洞察力に富んだ分析と最新ニュースを提供しています。常に変化するテクノロジーのトレンドを追っている暇な時は、世界を旅したり、音楽を聴いたりしています。