八木編集長FOCUS

テックジャイアントとOpenAIの開発競争

米OpenAIは13日、新型AI「GPT-4o(フォーオー)」を発表。GPT-4oの「o」は、omni(オムニ)から来ていて、「全て、あまねく」という意味である。私自身も以前より「GPT-4」を活用していたため、上部のタブからワンクリックで「GPT-4o」への切り替えはできた。リリースから間もないため全ての機能を試せているわけではないものの、さまざまな機能があまねく向上していることは実感できる。特に個人的に実感できる進化は「音声機能」「視覚機能」「処理速度」の3つ。

 音声機能はノイズの多い環境でも正確に認識できる精度まで進化しており、発表とともに公開された動画では「GPT-4o」を使った同時通訳のデモが動画内に収められていた。翻訳と出力の処理速度もさることながら、AIの翻訳時の音声はほぼ人の声だった。正直なところ翻訳の制度や速さよりも極めて人の声に近い声色が最も驚いた。

視覚機能は画像をみせると内容を理解し要約することができる。たとえば、漫画のようなイラストとテキストが入っているクリエイティブの内容を理解して要約することが可能だ。これによって、バナーやポスターを読み込ませるだけで訴求ポイントや内容をまとめることができる。また複数の画像から3Dモデルを出力することもできるため、活用方法によっては業務効率向上に一役買ってくれそうだ。

処理速度に関しては誰もが実感する向上だと感じる。TPUやNVIDIAの最新GPUを利用し、複数のプロセッサで並列に処理することによって向上しているとのことだ。約2倍になっていると謳われているが、個人的には2倍よりも早く感じるほどの進歩があった。

 OpenAI vs Google

OpenAI vs Google

同時期にはGoogleが開催する年次開発者会議Google I/O2024があり、最新の技術革新や製品発表が行われた。「Search Generative Experience」という生成AI機能がついたGoogleの検索エンジンが「AI Overview」へと改名し改良される発表や、テキストから1,080pの高画質動画を生成する「Veo」の発表等、GoogleもAI領域への投資を惜しまず行い、徹底抗戦の構えのようだ。

 現時点ではブロックチェーンやWeb3.0よりもAIが世間の注目の的にされているように感じる。幸か不幸かIoliteは次世代のテクノロジーのトピックを扱う、というコンセプトが故にAIという題材も取り扱えるが、正直なところ利活用のイメージが湧きやすいか否かが両者の大きな違いなのではないだろうか。

ブロックチェーンはあくまでインフラであり、ビットコインは特殊な扱われ方をされつつあるものの、そのほかの暗号資産が実生活に溶け出すにはまだまだいくつものブレイクスルーを起こさなければならない。NFTが一時隆盛を極めて、現在は用途の選択肢の1つとして認識され始めたような結末ではなく。絶対的な必要性と実用性がWeb3.0領域に生まれるツールに必要なのではないだろうか。

【NEWS】OpenAIが新型AI「GPT-4o」を発表 処理速度2倍に

[Iolite記事]
【NEWS】OpenAIが新型AI「GPT-4o」を発表 処理速度2倍に