4月 19, 2024

FUTSALNET

日本からの最新ニュースと特集:ビジネス、政治、解説文化、ライフ&スタイル、エンターテインメント、スポーツ。

BLOOMChat のご紹介: BLOOM モデル上に構築されたオープンソースの大規模言語会話多言語および多言語モデル (LLM)

BLOOMChat のご紹介: BLOOM モデル上に構築されたオープンソースの大規模言語会話多言語および多言語モデル (LLM)

Midjourney で作成されたイメージ

人工知能の分野で大きな進歩が見られる中、自然言語システムも急速に進歩しています。 言語ラージ モデル (LLM) は、アップグレードやイノベーションのたびに大幅に改善され、人気が高まっています。 新しい機能や MOD がほぼ毎日追加され、LLM がほぼすべての分野のさまざまなアプリケーションで動作できるようになります。 LLM は、機械翻訳やテキストの要約から感情分析や質問応答に至るまで、あらゆるところで利用されています。

オープンソース コミュニティは、チャットベースの LLM の開発において顕著な進歩を遂げてきましたが、その開発のほとんどは英語で行われています。 LLM での同様のタイプの多言語チャット機能の開発にはあまり重点が置かれていません。 これに対処するために、生成 AI ソリューションに注力するソフトウェア会社である SambaNova は、BLOOMChat と呼ばれるオープンソースの多言語 LLM 会話を導入しました。 オープンでスケーラブルな分散型 AI クラウドである Together と協力して開発された BLOOMChat は、BLOOM モデルに基づいて構築された 1,760 億変数の多言語 LLM チャットです。

BLOOM モデルは、46 の自然言語と 13 のプログラミング言語でテキストを生成する機能を備えています。 スペイン語、フランス語、アラビア語などの言語の場合、BLOOM は 1,000 億を超えるパラメーターを使用して作成された最初の言語モデルを表します。 BLOOM は、1,000 人を超える研究者の国際協力である BigScience によって開発されました。 OpenChatKit、Dolly 2.0、OASST1などのプロジェクトからの会話および位置合わせデータセットを開くようにBLOOMを調整することで、BLOOMのコア機能がチャットドメインに拡張されました。

多言語チャットを開発するために、LLM、BLOOMChat、SambaNova、Togetter は、トレーニング プロセスに SambaNova 独自の再構成可能なデータ フロー アーキテクチャを使用する SambaNova DataScale システムを使用しました。 合成会話データと人間が書いたサンプルを組み合わせて、BLOOMChat を作成しました。 OpenChatKit と呼ばれる大規模な合成データセットがチャット機能の基盤として使用され、Dolly 2.0 や OASST1 などの人間が生成した高品質のデータセットがパフォーマンスを大幅に向上させるために使用されました。 OpenChatKit および Dolly-v2 データセットのヘルプを設定するために使用されるコードとスクリプトは、SambaNova の GitHub で提供されています。

6 つの言語にわたって人間による評価を実施したところ、45.25% の確率で BLOOMChat の回答が GPT-4 の回答よりも好まれました。 同じ 6 つの言語を使用した他の 4 つのオープンソース チャット調整モデルと比較すると、BLOOMChat の応答は 65.92% の確率で最高のランクにランクされました。 この成果は、オープンソース市場における多言語チャット機能のギャップを埋めることに成功しました。 WMT ローカリゼーション テストでは、BLOOMChat は、BLOOM モデルの追加反復や一般的なオープンソース チャット モデルよりも優れたパフォーマンスを示しました。

BLOOMChat には、他の LLM と同様に制限があります。 不正確または事実と無関係な情報が提供されたり、誤って言語が変更される可能性があります。 彼はフレーズを繰り返すことさえできますが、コーディングや数学の能力は限られており、有害なコンテンツを生成することもあります。 これらの課題に対処し、使いやすさを向上させるために、さらなる研究が進められています。

結論として、BLOOMChat はオープンソース コミュニティの広範な成果に基づいて構築されており、非常に便利な多言語 LLM のリストに追加するのに最適です。 オープンソース ライセンスの下でリリースされた SambaNova と Together は、高度な多言語チャット機能へのアクセスを拡大し、AI 研究コミュニティのさらなる革新を促進することを目指しています。


をスキャンします 計画参考記事。 忘れずに参加してください 21,000+ML サブ Redditディスコードチャンネルメールマガジンでは、最新の AI 研究ニュースやクールな AI プロジェクトなどを共有します。 上記の記事に関してご質問がある場合、または何か見逃している場合は、お気軽にメールでお問い合わせください。 Asif@marktechpost.com

🚀 AI ツール クラブで 100 年代の AI ツールをチェックしてください

タニア・マルホトラは、デラドゥンの石油エネルギー研究大学の最終学年で、人工知能と機械学習を専門とするコンピューター サイエンス エンジニアリングの学士号を取得しています。
彼女はデータサイエンスに情熱を持っており、優れた分析的思考と批判的思考を持っており、新しいスキルの習得、グループの指導、組織的な方法での仕事の管理にも強い関心を持っています。

READ  英国の警察は、オクタ侵入者の容疑者を逮捕しました