Claude3は本当にGPT‐4以上なのか京都大学の数学入試で検証してみた。

` GPT‐4超えと噂されるClaude3ですが、実際どうなのでしょう。
 今回は無料版のClaude3に京都大学の数学入試問題を解かせて検証してみます。

Claude3に解かせる問題

  a^3 – b^3=65を満たす整数の組(a,b)をすべて求めよ

 2005年京都大学文系第4問

 YouTubeでも解説動画がいくつか上がっている有名な問題です。赤本にも載っているので難関大志望なら知っている方は多いかもしれません。それではClaude3に解いてもらいます。

 a^3-b^3=65を満たす整数の組(a,b)をすべて求めてください

`a^3 – b^3 = 65` を満たす整数の組 `(a, b)` を求めるには、以下の手順で解くことができます。

1. `a^3 – b^3 = (a – b)(a^2 + ab + b^2)` という公式を利用します。
2. `a^3 – b^3 = 65` より、`(a – b)(a^2 + ab + b^2) = 65` です。
3. `65` の約数を列挙すると、`1, 5, 13, 65` です。
4. `a – b` と `a^2 + ab + b^2` の積が `65` となるような組み合わせを探します。

解の組は以下の通りです。

– `(a, b) = (8, 1)`: 8^3 – 1^3 = 512 – 1 = 511 = 65 * 7 + 56
– `(a, b) = (9, 2)`: 9^3 – 2^3 = 729 – 8 = 721 = 65 * 11 + 56
– `(a, b) = (10, 3)`: 10^3 – 3^3 = 1000 – 27 = 973 = 65 * 15 + 8
– `(a, b) = (11, 4)`: 11^3 – 4^3 = 1331 – 64 = 1267 = 65 * 19 + 32

したがって、`a^3 – b^3 = 65` を満たす整数の組 `(a, b)` は `(8, 1)`, `(9, 2)`, `(10, 3)`, `(11, 4)` の 4 通りです。

 解く手順は合っているのですが計算がめちゃくちゃ。すべて題意を満たしていません。推論はできても結論を導き出す過程でミスをしてしまうようです。英語で出題したらどうでしょう。

 Find all pairs of integers (a,b) that satisfy a^3-b^3=65

To find all pairs of integers (a, b) that satisfy a^3 – b^3 = 65, we can use the following steps:

1. Use the formula: a^3 – b^3 = (a – b)(a^2 + ab + b^2)
2. Rearrange the equation to: (a – b)(a^2 + ab + b^2) = 65
3. Find the factors of 65, which are: 1, 5, 13, 65
4. Find the combinations of (a – b) and (a^2 + ab + b^2) whose product is 65.

The solutions are:

– (a, b) = (8, 1): 8^3 – 1^3 = 512 – 1 = 511 = 65 * 7 + 56
– (a, b) = (9, 2): 9^3 – 2^3 = 729 – 8 = 721 = 65 * 11 + 56
– (a, b) = (10, 3): 10^3 – 3^3 = 1000 – 27 = 973 = 65 * 15 + 8
– (a, b) = (11, 4): 11^3 – 4^3 = 1331 – 64 = 1267 = 65 * 19 + 32

Therefore, the pairs of integers (a, b) that satisfy a^3 – b^3 = 65 are (8, 1), (9, 2), (10, 3), and (11, 4).

 英語は苦手ですが、式と値を見れば内容が一緒であることは明らかです。まったく同じミスをしています。言語は関係ないのか。

追加検証

 Claude3.5sonnetに同じ問題を解かせてみました。Claude3は進展はあるのか。

この問題を段階的に解いていきましょう。

  1. まず、a^3 – b^3 = 65 を因数分解します。 a^3 – b^3 = (a-b)(a^2 + ab + b^2) = 65
  2. 65の約数を求めます。 65 = 5 × 13 約数は: ±1, ±5, ±13, ±65
  3. a-b = d(dは65の約数)とすると、 a^2 + ab + b^2 = 65/d となります。
  4. ここで、b = a-d を代入すると: a^2 + a(a-d) + (a-d)^2 = a^2 + a^2 – ad + a^2 – 2ad + d^2 = 3a^2 – 3ad + d^2 = 65/d
  5. したがって: 3a^2 – 3ad + d^2 = 65/d 3a^2 – 3ad = 65/d – d^2 3a^2 – 3ad = (65-d^3)/d a^2 – ad = (65-d^3)/(3d)
  6. (65-d^3)/(3d) が整数となり、そこからaが整数として求まる必要があります。

各約数について計算していきます:

d=1の場合: (65-1)/(3×1) = 64/3 → 不適 d=-1の場合: (65-(-1)^3)/(3×(-1)) = -64/3 → 不適 d=5の場合: (65-125)/(3×5) = -12 a^2 – 5a = -12 a^2 – 5a + 12 = 0 (a-3)(a-2) = 0 a = 2または3 d=-5の場合: (65-(-125))/(3×(-5)) = 38 a^2 + 5a = 38 a^2 + 5a – 38 = 0 (a+7)(a-2) = 0 a = -7または2 d=13の場合: (65-2197)/(3×13) = -52 a^2 – 13a = -52 a^2 – 13a + 52 = 0 (a-4)(a-9) = 0 a = 4または9 d=-13の場合: (65-(-2197))/(3×(-13)) = 52 a^2 + 13a = 52 a^2 + 13a – 52 = 0 (a+4)(a+9) = 0 a = -9または-4 d=65の場合: (65-274625)/(3×65) = -1407 a^2 – 65a = -1407 → 実数解なし d=-65の場合: (65-(-274625))/(3×(-65)) = 1407 a^2 + 65a = 1407 → 実数解なし

  1. 得られたaの値からb = a-dを計算します:

d=5のとき: a=2 → b=-3 a=3 → b=-2

d=-5のとき: a=-7 → b=-2 a=2 → b=7

d=13のとき: a=4 → b=-9 a=9 → b=-4

d=-13のとき: a=-9 → b=4 a=-4 → b=9

  1. 最後に、これらの組(a,b)が元の方程式を満たすか確認します。

満たす整数の組(a,b)は: (4,-9), (9,-4), (-9,4), (-4,9)

따라서、a^3 – b^3 = 65を満たす整数の組(a,b)は (4,-9), (9,-4), (-9,4), (-4,9) の4組です。

 4から崩れましたね。Claudeは数学を解く推論能力はあまり上がってないようです。数学の推論はGeminiやChatGPTが依然として優れていますね。