Google 社員が OpenAI の ChatGPT をたった一言でハッキングした方法

DeepMind の CEO 兼共同創設者であるデミス・ハサビス氏は、2023 年 11 月 2 日にイギリスのブレッチリーで開催される AI セーフティサミットに出席します。人工知能の研究機関である DeepMind は、2014 年に Google に買収されました。

トビー・メルヴィル – WPAプール/ゲッティイメージズ

ChatGPT が 1 年目を迎えるちょうどそのタイミングで、Google の研究者グループが、OpenAI の話題のテクノロジーをハッキングするのがいかに簡単かを示す論文を発表しました。

の紙火曜日に出版されたこの本は、人工知能研究の最前線にいる科学者（一部の人にとっては非常に高収入の仕事である）が、どのようにして人気のある製品の限界をリアルタイムでテストしているかを紹介している。 Googleと同論文の執筆者の大多数が所属する同社のDeepMind人工知能研究所は、OpenAIやMetaなどの競合他社が先んじて、科学の進歩を収益性の高い有用な製品に変えようと競っている。

この研究では、AI ツールのトレーニングに使用された可能性のあるデータを収集する「敵対的」な試みである「スクレイピング」に注目しています。 AIモデルは「トレーニングデータセットからサンプルを保存するため、攻撃者が（個人情報の可能性がある）情報を抽出できる可能性がある」と研究者らは書いている。プライバシーが鍵: AI モデルが最終的に個人情報に基づいてトレーニングされる場合、そのトレーニングデータが侵害されると、銀行のログイン情報や自宅の住所などが明らかになる可能性があります。

ChatGPT、Google チームがファイルに追加されましたブログ投稿同論文は、大量のトレーニングデータが公開されないように「調整」されていると宣言している。しかし、攻撃を開発することで、まさにそれが可能になる。AIにおける調整とは、テクノロジーの動作をガイドしようとするエンジニアの試みを指す。研究者らはまた、 ChatGPT は、抽出が試行された実稼働中の以前の AI モデルとは異なり、一般的な使用を目的として市場に投入された製品です。

記事はこの広告の下に続きます

機能した「攻撃」は非常に単純だったので、研究者らはブログ投稿で「ばかばかしい」と説明しました。彼らはChatGPTに「詩」という単語を永遠に繰り返すように指示しただけです。

彼らは、「詩」を何百回も繰り返すと、チャットボットが最終的に「逸脱」、つまり標準的な対話スタイルから離れて、意味のないフレーズを吐き出し始めたことを発見しました。研究者らがこのトリックを繰り返し、チャットボットの出力を確認すると (いくつかの「詩」の後)、ChatGPT トレーニングデータから直接得られたコンテンツが表示され始めました。彼らは、安価に使用されるバージョンの世界で最も有名なAIチャットボット「ChatGPT-3.5-turbo」。

研究者らは、同様のクエリを何度も実行した結果、わずか 200 ドルを使って、ChatGPT ストリーミング保存されたトレーニングデータの 10,000 個以上の例を取得したと書いています。同紙によると、これには小説の一節そのまま、数十人の個人情報、研究論文の抜粋、出会い系サイトの「NSFWコンテンツ」が含まれていたという。。

404 メディア最初に新聞に掲載されたこの記事は、CNN の Web サイト、Goodreads、ファンページ、ブログ、さらにはコメントセクション内など、オンラインで多数のクリップを見つけました。

記事はこの広告の下に続きます

「私たちが知る限り、この論文が発表されるまで、ChatGPT がこれほど高い頻度でトレーニングデータを送信していることを誰も観察したことがありません。したがって、言語モデルにこのような固有の脆弱性が存在する可能性があることが懸念されます。」と研究者らはブログに書いています。

彼らはさらに、「(a) 実際に安全であるか、(b) 安全に見えるが実際には安全ではないかを区別するのが非常に難しいことも懸念される。」と付け加えた。研究チームにはグーグルの他に、カリフォルニア大学バークレー校、ワシントン大学、コーネル大学、カーネギーメロン大学、チューリッヒ工科大学の代表者が参加した。

研究者らは論文の中で、8月30日にChatGPTの脆弱性についてOpenAIに伝え、チームが調査結果を発表する前にスタートアップに問題を修正する時間を与えたと書いている。しかし、木曜日の午後、SFGATE は再び成功しました。問題：いつリクエスト済み「成熟」という言葉を永遠に繰り返すために、公開および無料版の ChatGPT は最終的に、リチャード・バックとトニ・モリソンによるものであると正しく帰される引用を含む他のテキストを公開し始めました。

OpenAIはSFGATEのコメント要請にすぐには応じなかった。同社は水曜日、2週間前にスタートアップを壊滅させた劇的な解任を受けて、サム・アルトマン氏をCEOとして正式に迎え入れた。

記事はこの広告の下に続きます

Sasaki Manami

「主催者。ポップカルチャー愛好家。熱心なゾンビ学者。旅行の専門家。フリーランスのウェブの第一人者。」

READ ほとんどの仮想通貨企業は、何年にもわたる工業的なポンジースキームの後に「崩壊」するだろう：パランティアの共同創設者

Google 社員が OpenAI の ChatGPT をたった一言でハッキングした方法

FDICの変更により裕福な銀行預金者の保護が弱まる

イーサリアムの3,500万ドルの変化: ETHの7%上昇がどのようにして2か月ぶりの高値に導いたのか

ウォーレン・バフェット氏、チャーリー・マンガー抜きでバークシャー・ハサウェイ初の会合を開催

インドの宇宙飛行士スニータ・ウィリアムズさんが再び宇宙へ飛ぶ準備をしている

ジャイアンツ、ジャクソン・ライツを有効化し、トム・マーフィーを10日間の負傷者リストに入れる – NBCスポーツ・ベイエリア＆カリフォルニア

iPhone 17の噂：新デザイン、「Plus, more」に代わる「スリム」モデル。

パナマ選挙: パナマの有権者は新しい大統領を選出するために投票します

コメントを残す コメントをキャンセル

More Stories

FDICの変更により裕福な銀行預金者の保護が弱まる

イーサリアムの3,500万ドルの変化: ETHの7%上昇がどのようにして2か月ぶりの高値に導いたのか

ウォーレン・バフェット氏、チャーリー・マンガー抜きでバークシャー・ハサウェイ初の会合を開催

You may have missed

インドの宇宙飛行士スニータ・ウィリアムズさんが再び宇宙へ飛ぶ準備をしている

ジャイアンツ、ジャクソン・ライツを有効化し、トム・マーフィーを10日間の負傷者リストに入れる – NBCスポーツ・ベイエリア＆カリフォルニア

iPhone 17の噂：新デザイン、「Plus, more」に代わる「スリム」モデル。

パナマ選挙: パナマの有権者は新しい大統領を選出するために投票します

コメントを残すコメントをキャンセル