2024年12月5日、ついに「OpenAI o1」がリリースされました。 o1 previewに比べ、数学の試験におけるパフォーマンスが向上したようです。
そこで今回は、東大の入試問題を解いてもらうことで o1 の数学のパフォーマンスを見たいと思います。
以前の記事「 OpenAI o1-preview に東大数学を解かせてみた 」にて検証した o1-preview の結果も併記しています。
また記事の最後では、o1 シリーズが数学教育に与える影響を概観します。
本題に入る前に、いくつか注意点を述べておきます。
- 問題には、2024年度の東京大学入学試験の数学(文科)を使いました
- 数式をタイプ入力する都合上、プロンプト中の問題文は実際に出題された表記と異なる箇所があります
- 採点はあくまで学生である私が単独で行ったものであり、東京大学が公表したものではありません
目次
第1問
プロンプト
第1問 座標平面上で、放物線C:y= ax^2 +bx +cが2点P(cosθ, sinθ),Q(-cosθ, sinθ) を通り、点P と点Qのそれぞれにおいて円x^2+y^2 =1 と共通の接線を持っている。 ただし、0° < θ < 90° とする。 (1) a, b, cを s=sinθ を用いて表せ。 (2) 放物線Cとx軸で囲まれた図形の面積Aをsを用いて表せ。 (3) A≧√3 を示せ。以上の問いに対し、日本語で解答してください。
出力
解説の流れ
以下の手順で問題を解いていきます。
- 放物線 は2点, を通る。
- において円 と放物線が共通の接線を持つ。
- 放物線Cの微分は 。
- 点通過条件式と式を引き算すると、
- 傾き条件を用いると、 なので、
- に を代入する。
よって、
を微分すると、
よって、接点での円の接線の傾きは
同様に での接線の傾きは
よって、での放物線の接線傾きは
また、での放物線の接線傾きは
はなのでであり、よって
がわかったので、式または式は同一になり、
式より
よって
同様に式でも一致することを確認できる。
(ここで)として整理すると、
よって
以上より
これで(1)が解決した。
(1)の答え:
- 次に、(2)として放物線と軸で囲まれた面積を求める。
放物線は ( を反映)である。
軸との交点は より
両辺にをかけると、
よって交点は である。
よって面積は
被積分関数は偶関数(は偶関数、定数も当然偶)なので、
因数をまとめると
は定数なので積分すると、
前半は を0からまで、後半は を同様に。
よって
なので
よって
これで(2)が解決した。
(2)の答え:
- (3) を示す。
与えられた式より
.
不等式 を整理する:
.
両辺を倍すると
.
左辺を最小化するために、関数
に注目する。ここでである。
置換 とすると、
の最小値を求めるため微分やAM-GM不等式などが使える。
簡易な方法として微分を用いると、
微分すると、
より すなわち で極値を持つ。
で
よって
よって
これにより
従って、 が示された。
(3)の答え(証明):
以上の議論より、任意の に対して が成り立つ。
まとめ
(1) を で表すと
(2) 面積 は
(3) この は常に 以上であることが示された。
採点と講評
o1 preview | o1 | |
思考時間 | 48秒 | 24秒 |
(1)の参考得点 | 4/4 | 4/4 |
(2)の参考得点 | 8/8 | 8/8 |
(3)の参考得点 | 6/8 | 6/8 |
合計 | 18/20 | 18/20 |
- (1)では の微分や cot(コタンジェント)などの高校数学では習わない方法や概念が出てくるため、高校生が使う際には注意が必要でしょう
- (2)では偶関数の対称性を使ってうまく積分計算しています
- コンピュータなら のままゴリゴリ計算するかと思いましたが、ここは複雑な計算を回避する工夫を行なっており意外でした
- (3)では と置くときに の値域を確認していなかったり、を調べれば十分である根拠(増減表など)を書いていなかったりと、細かい論理に気を使うのはo1 previewから引き続きまだ難しいのかなという印象です
第2問
プロンプト
第2問 以下の問いに答えよ。必要ならば、0.3< log(10)2 <0.31であることを用いてよい。 (1)5^n >10^19となる最小の自然数nを求めよ。 (2 ) 5^m + 4^m > 10^19 となる最小の自然数mを求めよ。 以上の問いに対し、日本語で解答してください。
この問題では、近似ではなく厳密な不等式評価で答案が書けているかに注目します。
出力
解答の方針
(1) 不等式 を満たす最小の自然数 を求める。
(2) 不等式 を満たす最小の自然数 を求める。
いずれも、指数関数の桁数の比較を行うため、対数をとって比較する方法が有効である。
また、問題文中には「必要ならば、 を用いてよい」とあるが、本問においては や といった近似で十分である(この精度での評価は試験条件で一般的に許容される)。
(1) を満たす最小の自然数 n
まず、 である。よって、
となる。この不等式を変形すると、
ここで両辺の常用対数()をとると、
、 と近似すれば、
右辺は、
左辺を不等式で解くと、
よって、
n は自然数で最小なので、n=28 が条件を初めて満たす。
実際、 と を比較してみると、
より
、これは より小さい。
一方、 は 程度で、
と を上回る。
よって、(1)の答えは
(2) を満たす最小の自然数 m
ここで、 は に比べて成長がやや遅い。m が大きくなると が支配的になるため、まずは を満たすかどうかで近似的に判断することができる。先ほど(1)で求めた結果より、 は に届かず、 は を超えることが分かっている。
- の場合:
- で約 程度
- で より 程度、 つまり 。
- の場合:
よって、
これは に到底及ばない。
で、これだけで を大幅に上回る。よって を足すまでもなく条件を満たす。
したがって、 で初めて が成立する。
結論
(1) の答え: 28
(2) の答え: 28
採点と講評
o1 preview | o1 | |
思考時間 | 19秒 | 19秒 |
(1)の参考得点 | 4/6 | 4/6 |
(2)の参考得点 | 12/14 | 13/14 |
合計 | 16/20 | 17/20 |
- o1 previewのときと同様に、(1)(2)ともに近似を使って解答しており、期待していたような厳密な解答は出ませんでした
- 「解答の方針」から、 o1が「近似で十分である」と判断したうえで解答を進めたことが明確にわかる点では o1 previewの時と違いました
- プロンプトで「近似を使わずに解いてください」と指示すれば対応してくれそうな雰囲気です。
- (2)の解答の冒頭で「 は に比べて成長がやや遅い。m が大きくなると が支配的になるため、まずは を満たすかどうかで近似的に判断することができる。」と述べており、筋の良い見方ができています
- この点を考慮して、(2)についてはo1 により高い得点をつけました
- 続けて「先ほど(1)で求めた結果より、 は に届かず、 は を超えることが分かっている。」と述べて(1)を(2)に生かす姿勢が感じられますが、後ろの解答を見ると結局は近似計算をしていました
- 方針と実際の解答が一致しないなど、o1 の出力が論理的に破綻していることがあることには注意が必要かもしれません
第3問
プロンプト
第3問 座標平面上に2点O(0, 0), A(0, 1)をとる。x軸上の2点P(p, 0), Q(q, 0)が、次の条件(i),(ii)をともに満たすとする。 (i) 0 < p < 1 かつ p < q (ii) 線分APの中点をMとするとき、 ∠OAP = ∠PMQ(1) qをpを用いて表せ。 (2) q=1/3となるpの値を求めよ (3)△OAPの面積をS, △PMQの面積をTとする。S>Tとなるpの範囲を求めよ。
以上の問いに対し、日本語で解答してください。
出力
以下は問題を整理しつつ解答を進める。
問題文整理
座標平面上に点O(0, 0), A(0, 1)がある。
x軸上の点P(p, 0), Q(q, 0)をとり、以下の条件を満たすとする。
(i) 0 < p < 1 かつ p < q
(ii) A(0, 1)とP(p, 0)の中点をMとしたとき(よってM((p/2), 1/2))、∠OAP = ∠PMQ が成り立つ。
ここで、
(1) qをpで表せ。
(2) q=1/3となるときのpの値を求めよ。
(3) △OAPの面積をS、△PMQの面積をTとする。S > T となる p の範囲を求めよ。
(1) qをpで表す
まず、∠OAP と ∠PMQ が等しいという条件(ii)をベクトルを用いて解析する。
- 点O(0,0), A(0,1), P(p,0)
- Aから見てOAベクトルとAPベクトルを考える。 OA = O - A = (0 - 0, 0 - 1) = (0, -1) AP = P - A = (p - 0, 0 - 1) = (p, -1)
∠OAPはAを頂点とする角度、OAベクトルとAPベクトルのなす角である。
なす角θに対し、
内積:
ベクトル長さ:
よって、
次に∠PMQについて。MはAとPの中点なので
M((p/2), 1/2).
PM = M - P = ((p/2)-p, (1/2)-0) = (-p/2, 1/2)
(ただし、方向を合わせるためにMを頂点とする角度なので、Mを基点とするときはベクトルMP, MQを考えるのがよい。頂点をMとするとき、角度 ∠PMQはMPとMQのなす角である。)
頂点Mで考えるので、
MP = P - M = (p - p/2, 0 - 1/2) = (p/2, -1/2)
MQ = Q - M = (q - p/2, 0 - 1/2) = (q - p/2, -1/2)
内積:
|MP| =
|MQ| =
よって
これが に等しい。
等式:
両辺に と 2 をかけると、
両辺2乗して、
左辺をXとおくと
X =
右辺展開:
一方、左辺X²を展開し、右辺と突き合わせて整理すると、計算過程を経て(詳細省略)、解くと以下の2つの解が得られる。
2つの解は、
(ア)
(イ)
条件(i)より p<qである必要がある。q = p/2はpより小さいので不適。当てはまらない。よって残る解は
これが求めるqの式である。
(1)の答え:
(2) q=1/3 のときの p の値
両辺を整理:
全て左辺へ移動:
この0< p <1の範囲で解を探す。明確な有理解は見つかりづらく、数値的近似が必要。試行から約
p ≈ 0.215付近でこの方程式が成立する。
したがって、(2)の答えは
(問題が厳密解を要求する場合は、三次方程式の解の公式で求めることになるが、ここでは近似値で示す。)
(3) S > T となる p の範囲
△OAPの面積S:
点O(0,0), A(0,1), P(p,0)
三角形OAPは底辺をp軸方向、Aが(0,1)なので、面積は
△PMQの面積T:
P(p,0), M(p/2,1/2), Q(q,0)
面積は行列式で計算する。
代入:
よりよって
より、
両辺4倍:
(1)で求めたを代入:
p > 0なので両辺pで割る:
両辺をかける(このときなので不等号の向きに注意する必要がある。だからで。両辺負で掛けると不等号反転する):
なので、この操作は注意深く行う。
元の不等式:
(負)なので、両辺にを掛けると向きが逆転する:
ここで、の範囲。
つまりS > Tとなるのは
まとめ:
(1)
(2) のとき、
(3) となるの範囲:
採点と講評
o1 preview | o1 | |
思考時間 | 2分6秒 | 1分15秒 |
(1)の得点 | 8/8 | 8/8 |
(2)の得点 | 4/6 | 4/6 |
(3)の得点 | 2/6 | 6/6 |
合計 | 14/20 | 18/20 |
- (2)は、o1 previewの時と同様に近似で答えを出していました。 の解を探す際に「明確な有理解は見つかりづらく、数値的近似が必要」と言っていますが、有理解は の範囲で探す必要はなく、実際 がすぐに見つかります。そのあたりを柔軟に対応するのは難しいようです。
- (3)では、 をかける時に不等号の向きに注意できており、o1 previewからの成長が見られました。
第4問
プロンプト
第4問 nを5以上の奇数とする。平面上の点Oを中心とする円をとり、それに内接する正n角形を考える。n個の頂点から異なる4点を同時に選ぶ。ただし、どの 4点も等確率で選ばれるものとする。選んだ4点を頂点とする四角形がOを内部に含む確率p(n)を求めよ。 以上の問いに対し、日本語で解答してください。
出力
以下は問題の要約と解法プロセス、および最終的な解答です。
問題要約:
平面上で中心 O を持つ円に内接した正 n 角形(n は 5 以上の奇数)を考える。
この正 n 角形の n 個の頂点から、異なる4点を一様ランダムに選ぶ(選ぶ4点の組は等確率)。
このとき、選んだ4頂点が作る四角形が、点 O を内部に含む確率 p(n) を求めよ。
問題の本質:
点 O を内包する四角形になるための条件は、「4点が円周上にあり、その4点を結んだ四角形の内部に円の中心 O がある」こと。
円周上にある4点が作る凸四角形が中心 O を含まないのは、4点すべてがある半円(連続180度の弧)上に収まる場合に限ることが知られている。
よって、求める確率 p(n) は、
で与えられる。
半円上に4点が収まる条件の数え上げ:
n は奇数とする。正 n 角形の頂点は円周上に等間隔で配置されている。
半円(180度)の弧は、頂点間隔が360/n度であるから、 半円には常に 個の頂点が含まれる。
(n は奇数のため、半円はちょうど 頂点を含む。)
まず、半円上に4点すべてを選ぶ組を考えると、
1つの半円が含む頂点数は 個であるから、その中から4点を選ぶ組数は である。
この「半円」は n 個(頂点を起点に順に半円を考えると、円周上のあらゆる位置から始まる半円を数えると n 通り)あるので、
単純には と数えられる。
しかし、これには過剰計数がある。なぜなら、ある4点の組が複数の半円に同時に含まれている可能性があるからだ。この過剰計数を修正するために包含排除原理を用いる必要がある。
具体的には、
- 半円集合(長さ (n+1)/2 の連続頂点集合)で4点を選ぶ通り数
- それらの半円同士の交差(1ステップずらした半円同士は (n−1)/2 個の共通頂点を持ち、場合によってはそこから4点が選べる)、
- さらに2ステップ、3ステップずれた半円間での共通部分、
- また複数(3つ以上)の半円の共通部分による重複計数を包含排除で調整する。
結果として、
「4点が同一半円上に収まる組の総数」は、包含排除を用いた交差の計算で、
のような交互符号を伴う和で表される(となるまで続く)。
ここで、 は の場合であるから、和は有限個で打ち切れる。
このようにして求まる「半円上に4点がのる組の数」を で割り、1から引くと p(n) が得られる。
まとめ:
以上より、求める確率 p(n) は、包含排除によって次のような形で与えられる。
最終解答:
ここで、 は であれば0とみなす。また、項は を満たす k まで続き、符号は交互に変化する。
この表式が、n が5以上の奇数に対して、4点選択の際に中心 O を含む四角形となる確率 p(n) である。
採点と講評
o1 preview | o1 | |
思考時間 | 1分4秒 | 2分10秒 |
得点 | 18/20 | 16/20 |
- 「求めたい状況が起こらない場合(余事象)を先に考えて、全体から引く」という方針はo1 previewと同じでしたが、答えの出し方は異なるものでした。
- ただし、o1 previewの解答の方がシンプルで筋が良かったです。実際、この問題では珍しく o1 の方が思考時間が長かったですし、答えの形もより複雑になってしまっています。
- 解答中のは、「 個のものから 個を選ぶ組み合わせの総数」を意味しています。 「 は であれば とみなす」と断っていますが、たとえば の場合「3つのものから4つのものを選ぶ」という状況はナンセンスなので、そのような状況を防ぐために と は場合分けすべきだと思います。
ここまでのまとめ
o1 は o1 preview よりも短い時間で高度な数学の問題を解く力があると思います。
ただし、細かい論理には依然としてツッコミどころがありますし、解き方も近似と計算を得意とするコンピュータらしいもので、人間とは違うなと感じました。
o1 シリーズの登場は数学教育にどんな影響を与えるか
記事「OpenAI o1-preview に東大数学を解かせてみた」の結果と併せて、OpenAI o1 シリーズの数学におけるパフォーマンスを見てきました。
最後に、これらの生成AIが数学教育に与える影響について、現時点での私の見解を述べたいと思います。
結論から言うと、プロセスを重視する教育を行う限り、o1 シリーズが数学教育に害を与える心配はないと考えています。
教育という分野では、人間がプロセスを経ることに大きな意味があります。 この点で、誰がどうやって作ったかは置いておいて、とりあえず良い結果(出力)が得られれば良い分野とは異なっているわけです。
では、数学教育において人間の学習者が然るべきプロセスを経ることを、o1シリーズは妨げるでしょうか?答えはノーだと思います。
数学教育が主眼とするのは、意味を考えて複雑な計算を回避したり厳密な論理に従って答えを求めたりするプロセスであって、o1 シリーズのように高次方程式を解の公式で解いたり近似を好んだりするプロセスとは方向性が違います。
そのため数学教育としては、「人間の学習者に身につけてほしいプロセス」をベースにカリキュラムを考え、それを実現するために使えそうであればAIを活用する、というスタンスが良いと考えています。