生成AIによる答案(5) ・・・『できること』と『傾向』の実演レポート
※このページの内容は,2025年2月現在で,無料利用可能な日本語対応の生成AI
1. 「ChatGTP」 , 2. 「Copilot」 , 3. 「Gemini」 を用いて,数学の答案を引き出すための質問の仕方を考えたもので,「単なる個人の感想」です. 《このページの要約》 ◎:使いやすい,▼:当たりはずれあり,×:まだ期待できない(2025.2月現在の「単なる個人の感想」です)
与えられた2つの自然数の最大公約数を求める方法として,ユークリッドの互除法が知られている.そこで,2つの整数から最大公約数として3桁,4桁の素数を当てられるかどうかをチェックしてみる.(353×613=216389,353×721=254513の最大公約数は353)(3449×7507=25891643, 3449×8609=29692441の最大公約数は3449)
|
《例1》
入力欄に次のように書き込んで,Enterキーを押す 結果は次のようになる
@
ChatGTP数字として答は示されず,代わりに次のpythonプログラムが示される. import math print(math.gcd(216389, 254513))これを実行すれば,正しい結果(353)が得られる. Copilotでは,ユークリッドの互除法を用いた途中経過が18ステップで示されるが,第2ステップで余りの計算に間違いがあって,最大公約数は1という誤答が示される.(6桁の割り算は怪しいことがある) Geminiでは,ユークリッドの互除法を用いた途中経過が11ステップで示されるが,第4ステップで余りの計算に間違いがあって,最大公約数は5という誤答が示される.(6桁の割り算は怪しいことがある)
A
\(\Longrightarrow\)ChatGTP数秒で答えが出て,3449が示される Copilotでは,ユークリッドの互除法を用いた途中経過が20ステップで示されるが,第2ステップで余りの計算に間違いがあって,最大公約数は1という誤答が示される.(8桁の割り算は怪しいことがある) Geminiでは,ユークリッドの互除法を用いた途中経過が15ステップで示されるが,第3ステップで余りの計算に間違いがあって,最大公約数は3という誤答が示される.(8桁の割り算は怪しいことがある) (ここまでの感想)6桁や8桁の整数の割り算を行うときに,ChatGPTは強いがCopilot,Geminiは余りの計算で間違うことがある.ただし,ChatGPT無料版は数回の試用で「次回は何時間後」という形の使用制限になる. |
(T) 整数問題を生成AIで解くには?(2) 《例2》 入力欄に次のように書き込んで,Enterキーを押す(累乗は ^ で示せばよい.積は * を書かなくても認識される) 結果は次のようになる
@
ChatGTPでは,正解 (x + y + 1)(x + 2y + 3) が示される. Copilotでは,できない. Geminiでは,正解 (x + y + 1)(x + 2y + 3) が示される.
A
\(\Longrightarrow\)ChatGTPでは,誤答 (2x+y-1)(x+3y) が示される. Copilotでは,できない. Geminiでは,正解 (2x + y + 1)(x + 3y - 1) が示される. (ここまでの感想) 因数分解は得意分野でないかもしれない.Geminiでは「日よって答えが変わる??かもしれない」
4次の実係数方程式は,実数解または共役複素数の解を持ちます.5次以上の方程式の解の公式はありませんが,5次方程式には少なくとも1つの実数解があり,ニュートン近似などの方法で近似解が求められる.
《例3》
入力欄に次のように書き込んで,Enterキーを押す結果は次のようになる
@
ChatGTPでは,近似解とこれに近い厳密解もされる. Copilotでは,1つは正解,残り3つは数学用ソフトを使なさいと言われる. Geminiでは,x = 1/3, -1, (-3 + i√15) / 4, (-3 - i√15) / 4となって,1つは正解,残り3つは誤答になる.
A
\(\Longrightarrow\)ChatGTPでは,正解 x≒0.9633 が示される.(残り4個は虚数解) Copilotでは,近似解が示されるが,誤答になる. Geminiでは,誤答 x≒1.54209 が示される. (ここまでの感想) 多項式で書かれる方程式については,ChatGPTは強いようです.他は,やや弱い. @の詳しい解答は\(\displaystyle x=-\frac{3}{2}, x=\frac{1}{3} , x=\frac{-1+\sqrt{3}i}{2},x=\frac{-1-\sqrt{3}i}{2}\) Aの詳しい解答は x=0.96326・・・,残り4個は虚数解 |
(U) 分数計算を生成AIで解くには?(1) 《例4》 入力欄に次のように書き込んで,Enterキーを押す(割り算は,スラッシュの記号 / で示せばよい.累乗は ^ で示せばよい.ただし,2文字以上の指数になるときは,3^{-2}のように中かっこで囲めばよい) 結果は次のようになる
@
ChatGTPでは,正しい結果 \(\frac{5}{6}\) が得られる Copilotでは,正しい結果 \(\frac{5}{6}\) が得られる Geminiでは,正しい結果 \(\frac{5}{6}\) が得られる
A
ChatGTPでは,正しい結果 \(\frac{7}{60}\) が得られる Copilotでは,正しい結果 \(\frac{7}{60}\) が得られる Geminiでは,正しい結果 \(\frac{7}{60}\) が得られる
B
ChatGTPでは,正しい結果 \(\frac{159}{140}\) が得られる Copilotでは,正しい結果 \(\frac{159}{140}\) が得られる Geminiでは,正しい結果 \(\frac{159}{140}\) が得られる
C
ChatGTPでは,正しい結果 \(\frac{8}{9}\) が得られる Copilotでは,正しい結果 \(\frac{8}{9}\) が得られる Geminiでは,正しい結果 8/9 が得られる
\(\Longrightarrow\)
(ここまでの感想)分母と分子が1桁までの分数計算(加減乗除と累乗)は,普通にできる.Aのように,明示的に作業内容を書かずに,式だけを示しても計算は行われる. |
《例5》
入力欄に次のように書き込んで,Enterキーを押す(割り算は,スラッシュの記号 / で示せばよい.累乗は ^ で示せばよい.ただし,2文字以上の指数になるときは,3^{-2}のように中かっこで囲めばよい) 結果は次のようになる
D
ChatGTPでは,\(\frac{17089}{220713}\)が示される・・・分母も分子も正確ではない Copilotでは, \(\frac{170529}{220731}\)が示される・・・分母も分子も正確ではない Geminiでは,「この機能はサポートされていません。」と表示される
E
ChatGTPでは,「後日試してください」という意味の英語が返答となる Copilotでは, \(\frac{169811}{220731}\)が示される・・・分母も分子も正確ではない(分母はDと同じ,分子は違う) Geminiでは,「この機能はサポートされていません。」と表示される
F
ChatGTPでは,「現在、計算ツールを使用できないようです。」となって計算できない Copilotでは,\(\frac{169811}{220731}\)が示される・・・分母も分子も正確ではない(Eと同じ) Geminiでは, \(\frac{168657}{220899}\)が示される・・・分母も分子も正確ではない(2桁の数3個の積が分母も分子も全て間違っている.)・・・翌日に同一問題を尋ねたら,「この機能はサポートされていません。」となった
G
ChatGTPでは,正解の \(\frac{169873}{220719}\) が示される Copilotでは,\(\frac{169811}{220731}\)が示される・・・分母も分子も正確ではない(EFと同じ) Geminiでは, \(\frac{169873}{220539}\)が示される・・・分母が違う.・・・翌日に同一問題を尋ねたら,「この機能はサポートされていません。」となった
\(\Longrightarrow\)
(ここまでの感想) GのようにTeXで分数を表す形式で入力すると,ChatGPT, Copilot, Geminiとも問題を正確に認識する.GeminiではFのように分母と分子を小かっこで囲んだ場合にも数式として認識される. 無料版に文句を言ってはいけないが,結果は「∃♠∀〜びっくり答案〜∅♣"」になる. 正解は \(\frac{169873}{220719}\) となるはずだが,分母が6桁になる分数の和差では,とても信頼できる結果は得られない.ChatGTPは比較的ましな結果を出すことがあるが,数回行うと利用できなくなる. \(\Longrightarrow\) 分母や分子が6桁程度になる分数計算について,2025.2月現在では,まだ安定的に信頼できる結果は得られないようだ |
(V) 証明問題を生成AIで解くには?(1) 《例6》 入力欄に次のように書き込んで,Enterキーを押す
@は京都大学[2021年],Aは富山大医学部[2016年]Bは愛知教育大[2016年]の入試問題
結果は次のようになる
@
ChatGTPでは,16の剰余類に分けた答案が示されるが,途中経過に疑問がある. Copilotでは,3の剰余類に分けた答案が示される. Geminiでは,背理法を用いた模範解答になる.
A
ChatGTPでは,背理法を用いた模範解答になる. Copilotでは,背理法を用いた模範解答になる. Geminiでは,背理法を用いた模範解答になる.
B
ChatGTPでは,数学的帰納法を用いて示されるが,合同式やフェルマーの小定理など高校では必ずしも扱われない事柄を使って答案が書かれる. Copilotでは,答案としては正しいようだが,途中経過は分かりにくい. Geminiでは,答案がすらすらと書かれる
\(\Longrightarrow\)
(ここまでの感想) 生成AIは,言語処理は得意で,数学的帰納法,背理法,対偶証明などの答案は概ねスムーズに書けるようである.(上記の@ChatGPTの答案は??) |
(W) 中学校の連立方程式の文章題を生成AIで解くには?(1) 《例7》 入力欄に次のように書き込んで,Enterキーを押す 結果は次のようになる
@
ChatGTPでは,連立方程式を使って,直ちに正解に達する.家から橋まで6分,橋から学校まで Copilotでは,連立方程式を使って,直ちに正解に達する.家から橋まで6分,橋から学校まで Geminiでは,連立方程式を使って,直ちに正解に達する.家から橋まで6分,橋から学校まで
A
ChatGTPでは,合同式を使って途中経過が書かれるので,中学生には読めない.お菓子10個となって,間違い. Copilotでは,合同式を使って途中経過が書かれるので,中学生には読めない.お菓子10個となって,間違い. Geminiでは,連立方程式を使って途中経過が書かれ,お菓子30個となって,正解
B
ChatGTPでは,合同式を使って途中経過が書かれ,A組の生徒は14人となって間違い Copilotでは,合同式を使って途中経過が書かれ,A組の生徒は14人となって間違い Geminiでは,連立方程式を使って途中経過が書かれ,A組の生徒は38人となって正解
\(\Longrightarrow\)
(ここまでの感想) Gemini→連立方程式として解くと,正解に達する. ChatGPT,Copilot→合同式を使って解くときに,割る数よりも余りが多く見える場合や,余りが負の数に見える問題で間違う. |
(X) 図形問題を文章だけで書いたものを生成AIで解くには? 《例8》 入力欄に次のように書き込んで,Enterキーを押す ![]() 結果は次のようになる
@
ChatGTPでは,∠BAD=120°と間違え,また錯角を読み間違えて,誤答70°になる Copilotでは,二等辺三角形から∠BAD=50°と間違え,また同位角を読み間違えて,誤答70°になる Geminiでは,2つの三角形の内角の和を使って,正解55°に達する.
A
ChatGTPでは,ABCDが四角形だと考えて、誤答65°になる. Copilotでは,2つの三角形の内角の和を使って,正解115°に達する. Geminiでは,2つの三角形の内角の和を使って,正解115°に達する.
B
ChatGTPでは,AD=BDの条件の使い方を間違えて,誤答0°になる Copilotでは,∠ADBとその外角を混同して,結果は誤答15°になる. Geminiでは,2つの三角形の内角の和から計算していくが,誤答34.5°になる.
\(\Longrightarrow\)
(ここまでの感想) 三角形2個の組み合わせ図形になると,間違いが出てくる |