Image Credit:OpenAI makes GPT-4 generally available

OpenAIは、最新のテキスト生成モデルであるGPT-4をAPIを通じて一般公開したと発表しました。
現在、支払いの成功した履歴のあるOpenAI APIの開発者は、今日からGPT-4にアクセスできます。同社は、今月末までに新しい開発者にアクセスを開放し、その後は「コンピュータの利用可能性に応じて」利用可能な制限を引き上げる予定です。
OpenAIはブログ投稿で「GPT-4 APIへのアクセスを3月から数百万の開発者が要求し、GPT-4を活用した革新的な製品の範囲は毎日拡大しています」と述べました。「私たちは、チャットベースのモデルがどんな用途でもサポートできる未来を想像しています」。
GPT-4は、テキスト(コードを含む)を生成し、画像やテキストの入力を受け入れることができます。これは前作のGPT-3.5よりも進化しており、さまざまなプロフェッショナルや学術のベンチマークで「人間レベル」の性能を発揮します。OpenAIの以前のGPTモデルと同様に、GPT-4は公開されたウェブページのデータやOpenAIがライセンスを取得したデータを利用して訓練されました。
画像理解の機能はまだすべてのOpenAIの顧客には利用できません。OpenAIは、最初にBe My Eyesという1つのパートナーとテストしています。ただし、それを一般の顧客に公開する予定は明示されていません。
今日のアナウンスでは、最高の生成AIモデルであっても、GPT-4も完璧ではないことに注意が必要です。GPT-4は「幻視」の事実や推論のエラーを時折自信を持って生成することがあります。また、経験から学習することはできず、生成したコードにセキュリティの脆弱性を導入するなどの困難な問題に失敗することがあります。
将来的には、OpenAIは開発者が独自のデータでGPT-4やGPT-3.5 Turbo(ChatGPTの元となっている他のテキスト生成モデル)を微調整できるようにする予定です。この機能はOpenAIの他のテキスト生成モデルで長い間可能でした。OpenAIによると、この機能は年内に提供される予定です。
GPT-4の発表以来、生成AI競争は激化しています。最近、Anthropicは、プレビュー段階のフラグシップのテキスト生成AIモデルであるClaudeのコンテキスト・ウィンドウを9,000トークンから100,000トークンに拡張しました。コンテキスト・ウィンドウとは、モデルがテキスト生成前に考慮するテキストの範囲であり、トークンは生のテキストを表します(例えば、「fantastic」という単語は「fan」、「tas」、「tic」のトークンに分割されます)。
コンテキスト・ウィンドウの点で先行していたGPT-4は、最大で32,000トークンの容量を持ちます。一般的に、コンテキスト・ウィンドウが小さいモデルは、非常に最新の会話の内容を「忘れてしまい」、話題からそれる傾向があります。
関連するアナウンスでは、OpenAIはDALL-E 2とWhisperのAPIを一般公開すると発表しました。DALL-E 2はOpenAIの画像生成モデルであり、Whisperは同社の音声テキスト変換モデルを指します。また、OpenAIは、APIを通じて提供される古いモデルを廃止し、その計算能力を最適化する予定であるとも述べました(ChatGPTの人気の急速な拡大により、OpenAIは過去数ヶ月間、生成モデルの需要に対応するのに苦労しています)。
2024年1月4日から、古いOpenAIモデル(具体的にはGPT-3およびその派生モデル)は利用できなくなり、新しい「base GPT-3」モデルに置き換えられる予定です。旧モデルを使用している開発者は、2024年1月4日までに手動で統合をアップグレードする必要があります。また、2024年1月4日以降も古いモデルを使用し続けたい場合は、新しいbase GPT-3モデルの上に置き換えを微調整する必要があります。
OpenAIは「可能な限りスムーズな移行を支援します」と述べています。「数週間以内にこれらの古いモデルを使用した開発者に連絡し、新しい補完モデルが早期テストに利用できるようになった時点でさらなる情報を提供します」。


Pexelsによる写真提供

OpenAIは、最新のテキスト生成モデルであるGPT-4をAPI経由で一般提供することを発表しました。既存のOpenAI API開発者は、今日からGPT-4にアクセスできます。新しい開発者へのアクセス拡大は今月末までに予定されており、その後はコンピュータの利用可能性に応じて利用可能な制限が引き上げられる予定です。「2021年3月以来、数百万の開発者がGPT-4 APIへのアクセスをリクエストしており、GPT-4を活用した革新的な製品の範囲が毎日増えています」とOpenAIはブログ記事で述べています。GPT-4は、テキスト(コードを含む)を生成し、画像やテキスト入力も受け付けます。以前のGPTモデルと比べて、GPT-4はさまざまなプロフェッショナルおよび学術的な基準で「人間レベル」の性能を発揮します。画像理解機能はまだすべてのOpenAIの顧客には提供されていません。OpenAIは、まずはBe My Eyesという一つのパートナーとテストしていますが、一般の顧客に提供する時期については明示していません。また、GPT-4は完璧ではなく、最先端の生成型AIモデルであっても「幻覚」を見たり、推論のエラーを起こしたりすることがあります。OpenAIは将来的に、GPT-4やGPT-3.5 Turboなどのテキスト生成モデルを開発者が独自のデータで微調整することを可能にする予定です。また、OpenAIは2024年1月4日以降、古いモデルを廃止し、新しい「base GPT-3」モデルに置き換える計画です。

引用元記事はこちら
OpenAI makes GPT-4 generally available

error: Content is protected !!