ChatGPTとClaudeでクイズ対決させたらどちらが勝つか 更新日:2025年1月28日 公開日:2024年3月27日 ChatGPTClaude ChatGPTとClaudeの比較記事です。今回はChatGPT(GPT-4)とClaudeにそれぞれクイズを10問作成してもらい、その正答数で優劣を決めます。 まずはクイズを作成してもらいます。まずはChatGPT […] 続きを読む
検索AIでハルシネーションはどれくらい発生する? Perplexity、Felo、Gensparkでチェックしてみた 更新日:2025年1月29日 公開日:2024年3月15日 検索AI ハルシネーション(幻覚)は簡単に言うと間違った情報を本当のことであるように回答することです。技術の進歩で回答精度は上がったとはいえ、ハルシネーションのリスクは常にあります。 今回は検索AIでも知名度の高いPerple […] 続きを読む
ChatGPT3.5がダメでも、GPT 4o-miniなら数学教師できる説 更新日:2025年1月27日 公開日:2024年3月13日 ChatGPT GPT-3.5が登場してから約2年、ChatGPTの能力は格段に進化して難関大学の数学入試も解けるほどになっています。では、数学教師として活躍することは可能なのでしょうか? 次のプロンプトで試してみます。 You 今か […] 続きを読む
ChatGPT-4にClaude3が間違えた京大数学入試を解かせたら正解できるか 更新日:2025年1月27日 公開日:2024年3月12日 ChatGPT 3月11日に思い切ってChatGPT-3.5からGPT-4にバージョンアップさせました。無料版との違いが気になったのもありますが、Claude3と性能の比較もしてみたかったのも理由のひとつです。 今回はClaude3 […] 続きを読む
Claude3は本当にGPT‐4以上なのか京都大学の数学入試で検証してみた。 更新日:2025年1月27日 公開日:2024年3月10日 Claude ` GPT‐4超えと噂されるClaude3ですが、実際どうなのでしょう。 今回は無料版のClaude3に京都大学の数学入試問題を解かせて検証してみます。 Claude3に解かせる問題 a^3 – b^3= […] 続きを読む
2024年東京大学の数学入試を2通りで解いてみた。 公開日:2024年3月6日 未分類 今回は数学に苦手意識のある方向けにもわかるように書きました(そもそも苦手意識のある人がこの記事読むのだろうか)。解法は自己流なので不足している部分があるかもしれませんが、どうかご了承ください。さて、今回解く問題はこちら […] 続きを読む
ChatGPTに「トロッコ問題」は解決できるか?ChatGPT 4o-miniに訊いてみた。 更新日:2025年1月27日 公開日:2024年3月4日 ChatGPT トロッコ問題(またはトロリー問題)は有名な思考実験なので聞いたことがある人は多いかもしれません。様々なレパートリーがありますが、主に知られているのは次のようなシチュエーションだと思います。 (a) 線路を走っていたトロ […] 続きを読む
CopilotとClaudeに青空文庫の『猿かに合戦』を書き換えてもらった。 更新日:2025年1月27日 公開日:2024年3月1日 ClaudeCopilot 日本の有名な民話である『さるかに合戦』。青空文庫では楠山正雄の『猿かに合戦』と芥川龍之介の『猿蟹合戦』が収録されています。 今回は楠山正雄の『猿かに合戦』を書き換えてもらいます。 物語の詳細をここで書くと長くなるので […] 続きを読む