2024年5月生成AIの最新情報まとめ

更新日

Dec 7, 2024 12:37 AM

作成者

吉田塁

編集者

吉田塁

本記事は、2024年5月24日に行われたオンラインイベント「教育で活用できるプロンプト共有会」にて紹介された最新情報をもとに、生成AIを活用して記事を作成しています。オンラインイベントの詳細: https://edulab.t.u-tokyo.ac.jp/2024-05-24-event-report/

OpenAI Spring Update (2024年5月13日)

OpenAIは、GPT-4のアップデート版であるGPT-4oを発表しました。このアップデートでは、テキスト、音声、画像のマルチモーダルへのネイティブ対応が大きな特徴です。以前は音声の処理に別のモデルを使用していましたが、GPT-4oはモデル自体で音声を扱えるようになりました。これにより、遅延がほぼなくなり、より自然な会話が可能になっています。

その他、応答スピードの向上とコストダウン、無料ユーザーの利用可能化、デスクトップアプリの提供、ユーザーインターフェースの改善なども行われています。デモ動画: https://youtu.be/nSmkyDNulk

Google I/O 2024 (2024年5月14日)

Google I/O 2024では、複数の生成AI関連の発表がありました。

Gemini 1.5 Pro, Flash: Googleの生成AIモデルであるGeminiのアップデート版が開発者向けに公開されました。検索、写真、ワークスペースなどへの統合も予定されています。
Project Astra: AIエージェントの構築プロジェクトで、ユーザーと自然な会話を行い、マルチモーダルな情報を理解してリアルタイムにフィードバックを返すことができます。デモ動画: https://www.youtube.com/watch?v=VYsK-_NksEY
Gems: カスタマイズ可能なGeminiが発表されました。
PaliGemma / Gemma 2: オープンソースのビジョン言語モデルと言語モデルが公開されました。
LearnLM: 学習に特化したモデルで、Google検索での複雑なトピックの理解や、YouTube動画での質問やクイズへの対応などが可能になります。

これらのアップデートにより、生成AIが様々な場面で活用されることが期待されています。

吉田のまとめ

生成AIに関する進展は非常に速く、OpenAIのGPT-4oやGoogleのGeminiなど、様々なモデルがアップデートされています。特に、マルチモーダルへの対応や学習に特化したモデルの登場は、教育分野での活用に大きな可能性をもたらすと考えられます。これらの最新情報を踏まえ、今後の生成AIの動向に注目していく必要があります。

2024年5月 生成AIの最新情報まとめ

OpenAI Spring Update (2024年5月13日)

Google I/O 2024 (2024年5月14日)

吉田のまとめ

2024年5月生成AIの最新情報まとめ