本記事は、2025年2月28日に行われたオンラインイベント「生成AIの最新情報の提供と生成AI講座の簡易ガイダンス」にて紹介された最新情報をもとに、生成AIを活用して記事を作成しています。
オンラインイベントの詳細: https://edulab.t.u-tokyo.ac.jp/2025-02-28-event-report/
OpenAI o3-mini 公開(2025年1月31日)
OpenAIの推論モデル「o3」の廉価版として「o3-mini」が公開されました。ポイントは「推論(考えるプロセス)を挟むタイプのモデル」が、より使いやすい価格帯・運用感で利用できるようになってきたことです。
これまで生成AIは「文章生成は得意でも、数学や厳密な推論は弱い」と言われがちでしたが、推論モデルの系統が伸びることで、数学や科学のように思考プロセスが重要な領域でも性能が上がってきています。
OpenAI Deep Research 公開(2025年2月2日)
「OpenAI Deep Research」が公開されました。これは一言でいうと、複雑な調査タスクを自動化するエージェント機能です。
特徴は、ユーザーがざっくりした依頼をしても、AI側が「何を調べ、どう整理するか」を立て付けた上で、情報を収集・整理し、レポートとして提示してくれる点です。実際、翻訳アプリの市場分析、曖昧な記憶からテレビ番組エピソードを特定する、研究の論点整理、買い物(スノーボード選び)など、用途の幅が示されています。
利用面では、ChatGPT Pro / Plus ユーザーが月120回/10回で利用可能で、Plusユーザーは2025年2月26日から利用可能になります。今後は無料ユーザーにも提供予定とされています。
教育・研究の現場で特にインパクトが大きいのは、「短時間で全体像を作る→人間が重要箇所を精査して意思決定する」という流れが現実的になってきたことです。調査研究の入口、政策動向の把握、先行研究の当たり付けなどで、やり方そのものが変わりうると感じています。
Gemini 2.0 全体公開(2025年2月5日)
GoogleのGemini 2.0関連のアップデートも公開されています。具体的には、Gemini 2.0 Flash Thinking Experimental の性能向上と、Gemini 2.0 Pro 試行版の公開です。
ここで注目なのは、「推論(Thinking)」を前提にしたモデル設計にシフトしてきている点です。単に会話ができるだけではなく、タスクに応じて考える深さ・プロセスをどう扱うかが競争軸になっています。
Grok 3 Beta 公開(2025年2月19日)
xAIが最新モデル「Grok 3 Beta」を公開しました。モデル競争が激しい中で、xAIも推論性能を強く打ち出してきています。
Claude 3.7 Sonnet 公開(2025年2月25日)
Anthropicが「Claude 3.7 Sonnet」を公開しました。特徴は、ハイブリッド推論モデルとして、通常モードと思考モードを使い分けられる点です。
推論モデルは一般に、思考を挟む分だけ時間や計算資源が必要になります。そこで「速く返すモード」と「じっくり考えるモード」を場面で切り替えられるのは、実務的に非常に大きいです。教育現場でも、雑談的なQ&Aやアイデア出しは即時モード、レポート構成や評価基準の検討、教材設計のたたき台は思考モード、というように使い分けが効いてきそうです。
GPT-4.5 公開(2025年2月27日)
OpenAIの最新基盤モデルとして「GPT-4.5」が公開されました(GPT-4oに対する最新モデルという位置づけです)。ポイントとして、深い世界知識、より自然な対話、高い「EQ」が掲げられています。
ここでいう「EQ」は、単に正しい情報を列挙するだけではなく、ユーザーの状況や感情に配慮した言い回し・対話設計が改善している、という方向性です。教育文脈では、学習者支援(声かけ、振り返りの促し、学習計画の伴走)で体験が変わりやすい一方で、過度に人間らしい応答が逆に誤信を招く可能性には注意が必要かもしれません。
また、ハルシネーション(もっともらしい誤り)についても改善が示されており、ここは教育現場にとって重要です。ただし、ゼロにはならないため、最終的な責任は人間側が持つ、という前提は引き続き大切です。
Veo2 が日本で公開(2025年2月23日)
2Googleの動画生成AI「Veo 2」が日本で公開されました。動画生成AIの競争も一段と激しくなっています。
動画生成は、教材・広報・探究学習のアウトプット(例:短い解説動画、歴史の再現、理科の概念説明)など教育用途が想像しやすい一方で、誤情報・捏造(もっともらしい映像)や著作権、肖像権などのリスクが一気に高まる領域でもあります。教育現場では特に扱い方(目的、検証、出典、利用範囲)を丁寧に設計する必要があると考えています。
Wan 2.1 が公開(2025年2月26日)
Alibabaの動画生成AI「Wan 2.1」が公開されました。特徴としては、オープンソースである点が挙げられます。このような動画生成モデルが増えると、研究・開発の裾野も広がりそうです。
吉田のまとめ
今回お伝えしたかったのは大きく3点です。
1点目は、生成AIの基盤モデルが次々と公開され、全体の性能が底上げされ続けているということです。Gemini 2.0、Claude 3.7 Sonnet、GPT-4.5のように、各社がアップデートを連続的に投入しています。
2点目は、推論モデルの発展・応用が目覚ましいということです。推論モデルは、いきなり答えを出すのではなく、モデル内部で思考を重ねてから出力します。これによって、数学・科学・複雑な意思決定のように「考える手順」が重要な領域で性能が上がりやすくなります。さらに、その延長線上に「Deep Research」のような調査特化のエージェントが出てきており、複雑なタスクの自動化が現実のものになってきました。特にDeep Researchのレポート品質は非常に高水準で、調査・研究・企画の進め方そのものに影響を与えうると感じています。
3点目は、動画生成AIの競争が激しくなってきているということです。Veo2やWan 2.1のように動画生成の選択肢が増え、教育用途の可能性も広がります。「何ができるか」だけでなく、「どう使うか」「どう検証するか」「どう教えるか」をセットで考え、リスクを抑えながら使っていくことが重要です。