作成者
吉田 塁
編集者
吉田 塁
更新日
Dec 7, 2024 12:37 AM
本記事は、2024年5月24日に行われたオンラインイベント「教育で活用できるプロンプト共有会」にて紹介された最新情報をもとに、生成AIを活用して記事を作成しています。 オンラインイベントの詳細: https://edulab.t.u-tokyo.ac.jp/2024-05-24-event-report/
OpenAI Spring Update (2024年5月13日)
OpenAIは、GPT-4のアップデート版であるGPT-4oを発表しました。このアップデートでは、テキスト、音声、画像のマルチモーダルへのネイティブ対応が大きな特徴です。以前は音声の処理に別のモデルを使用していましたが、GPT-4oはモデル自体で音声を扱えるようになりました。これにより、遅延がほぼなくなり、より自然な会話が可能になっています。
その他、応答スピードの向上とコストダウン、無料ユーザーの利用可能化、デスクトップアプリの提供、ユーザーインターフェースの改善なども行われています。 デモ動画: https://youtu.be/nSmkyDNulk
Google I/O 2024 (2024年5月14日)
Google I/O 2024では、複数の生成AI関連の発表がありました。
- Gemini 1.5 Pro, Flash: Googleの生成AIモデルであるGeminiのアップデート版が開発者向けに公開されました。検索、写真、ワークスペースなどへの統合も予定されています。
- Project Astra: AIエージェントの構築プロジェクトで、ユーザーと自然な会話を行い、マルチモーダルな情報を理解してリアルタイムにフィードバックを返すことができます。 デモ動画: https://www.youtube.com/watch?v=VYsK-_NksEY
- Gems: カスタマイズ可能なGeminiが発表されました。
- PaliGemma / Gemma 2: オープンソースのビジョン言語モデルと言語モデルが公開されました。
- LearnLM: 学習に特化したモデルで、Google検索での複雑なトピックの理解や、YouTube動画での質問やクイズへの対応などが可能になります。
これらのアップデートにより、生成AIが様々な場面で活用されることが期待されています。
吉田のまとめ
生成AIに関する進展は非常に速く、OpenAIのGPT-4oやGoogleのGeminiなど、様々なモデルがアップデートされています。特に、マルチモーダルへの対応や学習に特化したモデルの登場は、教育分野での活用に大きな可能性をもたらすと考えられます。これらの最新情報を踏まえ、今後の生成AIの動向に注目していく必要があります。