本記事は、2025年1月31日に行われたオンラインイベント「生成AIの最新情報の提供と文部科学省のガイドライン紹介」にて紹介された最新情報をもとに、生成AIを活用して記事を作成しています。 オンラインイベントの詳細: https://edulab.t.u-tokyo.ac.jp/2023-05-13-report-event-chatgpt-course/
DeepSeek R1 (2025年1月20日)
DeepSeek R1は、OpenAIのo1モデルに匹敵する性能を持つとされ、その登場は大きな驚きをもって迎えられました。
このモデルの特筆すべき点は以下の通りです。
- オープンソースであること: これまでの高性能な生成AIモデルは、その構造やソースコードが公開されないクローズドなものが主流でした。しかし、DeepSeek R1はソースコードが公開されており、誰でも利用・改変が可能です。
- 商用利用可能なライセンス: MITライセンスという緩やかなライセンス形態を採用しており、商用利用も可能です。これにより、研究者だけでなく、サービス提供事業者にとっても大きなメリットがあります。
- 詳細なレポートの公開: DeepSeek R1の構築方法や、そのベースとなるDeepSeek V3モデルに関する詳細なレポート(論文のようなもの)が公開されています。技術的な詳細が記述されており、これまでの生成AIモデルよりも圧倒的に情報が開示されています。
- 従来の学習方法とは異なる工夫: 従来の学習方法とは異なる工夫が凝らされており、生成AI業界において特異な存在となりつつあります。
- Webブラウザでの利用: Webブラウザ上でChatGPTのように利用できます。ただし、入力データは学習に利用される可能性があるため、機密情報や個人情報の入力は避けるなど、注意が必要です。
参考リンク:https://api-docs.deepseek.com/news/news250120
OpenAI Operator (2025年1月23日)
OpenAI Operatorは、指示に応じてブラウザを操作するAIエージェントです(米国のみ利用可能)。
このエージェントの登場は、今年のAIエージェント元年を象徴する出来事の一つと言えるでしょう。
主な特徴は以下の通りです。
- ブラウザ操作の自動化: ユーザーの指示に基づき、レシピの検索、ショッピングカートへの材料追加など、ブラウザ上での様々な操作を自動的に行ってくれます。
- 使い勝手の良さ: デモ動画だけでなく、実際に機能するサービスとして提供されており、使い勝手の良さが期待されます。
参考リンク:https://openai.com/index/introducing-operator/
Google Gemini (2025年1月30日)
Googleは、Gemini 2.0 Pro ExperimentalをGemini Advancedユーザーに対して提供開始しました。
主な特徴は以下の通りです。
- 高性能モデルの提供: Gemini 2.0 Pro Experimentalは、チャットボットアリーナなどの指標で高いランキングを獲得しており、高性能なモデルであることが示されています。
参考リンク:https://lmarena.ai/
吉田によるまとめ
今回の最新情報をまとめますと、DeepSeek R1の登場は非常に大きなインパクトがあります。オープンモデルでありながらトップレベルの性能を持ち、詳細な情報が記載されたレポートが公開されているため、事業者や研究に大きな影響を与える可能性があります。また、今年はAIエージェントにも注目が集まっており、OpenAI Operatorのような使い勝手の良いサービスが登場し始めています。生成AIの性能の発展はまだまだ止まらないでしょう。