先生・講師向け｜テスト問題と解説をAIで作る手順。ChatGPT・Claude・Geminiを使って分かった違い

「AIでテスト問題を作れるらしい」と聞くと、正直かなり気になりますよね。私も気になっていたのは、本当に時短になるのか、それとも直し作業が増えて逆に面倒なのかという点でした。

実際、このテーマで大事なのは「AIが問題を作れるか」ではありません。そこはもう、だいたい作れます。先生・講師が本当に知りたいのは、どこまで任せられるのか、どこから自分で見ないと危ないのか、そして結局どのAIがいちばん現場で使いやすいのかです。

今回はその目線で、教材テキストをもとに、確認テストと解説を作るという実務に近い使い方を前提に整理します。

AIでテスト問題と解説を作りたい先生が、最初に知っておくべきこと
先に結論｜いちばん失敗しにくい進め方
AIでテスト問題と解説を作る基本手順
実際に使って見えた違い｜ChatGPT・Claude・Gemini比較
用途別に見ると、どれが向いているか
初心者が選ぶならどれか
失敗しやすいポイントと回避策
結論｜どう使い分けるべきか
結論だけ先に知りたい人向けの要約
参考イメージ・図版
関連記事案
参考リンク

AIでテスト問題と解説を作りたい先生が、最初に知っておくべきこと

今回は、ChatGPT、Claude、Geminiの3つを比較対象にしました。理由はシンプルで、どれも教育現場での活用に関する公式情報が出ており、しかも「教材をもとに問題を作る」という用途にかなり近い導線があるからです。ChatGPTは教員向けプロンプト例とファイル活用が強く、ClaudeはProjectsで資料を蓄積しながら作問を続けやすい。GeminiはGoogle ClassroomやGoogle Formsへの流れが自然で、学校の運用に乗せやすい。この3つを比べると、単なるAI比較ではなく、先生の仕事の流れにどれが合うかが見えやすいです。[Source] [Source] [Source] [Source] [Source] [Source]

先に結論｜いちばん失敗しにくい進め方

結論を先に言うと

個人の先生がまず1本選ぶなら、いちばん失敗しにくいのはChatGPT
Google ClassroomやGoogle Forms中心ならGemini
単元資料を蓄積して問題バンクを育てたいならClaude

要するに、総合バランスはChatGPT、学校のGoogle運用ならGemini、継続蓄積ならClaudeです。ここを最初に押さえておくと、ツール選びで迷いにくくなります。

AIでテスト問題と解説を作る基本手順

手順1：元にする教材を整理する

最初にやることは、AIを開くことではありません。何を元に出題するかを1つに絞ることです。おすすめは、授業プリント1枚、教科書の該当範囲、自作レジュメ、前回授業の要点メモ、既存テストの過去問あたりです。範囲を広げすぎると、AIはそれっぽい問題は作れても、授業の重点からズレやすくなります。

ChatGPTもGeminiもファイルを読ませて処理できますし、ClaudeはProjectsに資料を積んで継続参照できます。ただ、どのAIでも「資料を渡せば勝手に授業意図まで読んでくれる」わけではありません。ここは未来的でも、最後はかなり人間的です。[Source] [Source] [Source]

手順2：出題条件を先に固定する

AI活用で失敗する先生は、だいたい最初の指示が雑です。逆に言うと、ここを整えるだけで仕上がりはかなり安定します。最低限、学年・受講レベル、教科・単元、出題数、問題形式、難易度、出題意図、解説の文体は指定したいところです。

プロンプト例

中学2年理科「電流と電圧」の確認テストを作成してください。4択3問、短答2問、記述1問。難易度は基礎7：応用3。ありがちな誤解を見抜ける設問を1問入れる。各設問に、正答、誤答しやすい理由、授業での補足説明をつける。解説は中学生にも読めるやさしい言葉で。

OpenAIの教員向けガイドでも、学年、既習事項、学習目標を先に確認してから生成する流れが示されています。雑に「問題作って」と頼むより、最初に条件を固定したほうが圧倒的に失敗しにくいです。[Source]

手順3：まず「問題だけ」を作らせる

ここはかなり重要です。最初から問題・答え・解説を全部一気に作らせないほうがいいです。最初の一発目で全部作らせると、問題は浅い、解説は長すぎる、正答根拠は甘い、という“AIあるある”になりがちです。

おすすめは、まず問題だけを作らせること。その上で先生が、範囲が合っているか、難易度が合っているか、変な引っかけになっていないかを確認する。この順番にすると、後工程がかなり楽になります。

手順4：次に「正答・解説・誤答理由」を作らせる

問題案が固まったら、次に各問の正答、正答の根拠、生徒が間違えやすい理由、授業での補足説明を作らせます。この形にすると、単なる答え合わせではなく、配布できる解説資料に近づきます。

Google Classroomでは、クイズ生成、読解問題生成、ルーブリック作成などが用意されていますし、Gemini in ClassroomではテキストやGoogle Driveファイルから質問を生成して、Google FormsやGoogle Docsへ出力する流れも案内されています。つまり、問題作成だけでなく、その先の配布や運用まで視野に入るのが強みです。[Source] [Source]

手順5：最後は必ず先生が直す

ここは率直に言います。AI生成の問題をノーチェックで出すのはやめたほうがいいです。OpenAIも教員向け案内で、モデルは常に正しい情報を出すわけではなく、教員が専門家として確認すべきだと明言しています。また、ペンシルベニア大学のTeaching Centerも、AIは大量生成や問題バンク作成には便利だが、必ずレビュー・編集・評価を行うべきだとしています。[Source] [Source]

AIは下書き担当としては優秀です。でも、出題責任者にはなれません。ここを勘違いしないだけで、AI活用はかなり健全になります。

実際に使って見えた違い｜ChatGPT・Claude・Gemini比較

ツール	良かった点	微妙だった点	向いている用途	初心者向け度
ChatGPT	問題作成→修正→解説追加の往復がしやすい。教材を読ませて要約・抽出・変換しやすい	PDF内画像やスキャン依存の資料は扱いに注意。個人利用ではデータ扱いも確認したい	個人の先生の試し運用、汎用的な小テスト作成	高い
Claude	Projectsで資料を蓄積しやすく、単元横断の問題バンク向き。PDFの視覚要素も条件次第で扱える	非PDF文書内の埋め込み画像は弱い。最初から完璧な試験品質を期待しすぎるとズレる	継続運用、問題バンク、複数資料をまたぐ整理	中〜高
Gemini	Google ClassroomやFormsに寄せやすい。学年・スキル指定で問題化しやすい	機能や利用条件が組織設定やライセンスに左右されやすい。英語・18+条件の機能もある	学校のGoogle運用、配布・回収まで一気通貫	高い（Google環境なら）

※上記は各社の教育向け公式情報、ファイル処理情報、Google Classroomの生成機能案内をもとに整理しています。[Source] [Source] [Source] [Source] [Source]

ChatGPTが良かった点・微妙だった点

ChatGPTの良さは、先生が「あとちょっとこうしたい」を詰めやすいことです。問題数を増やす、記述を減らす、難しすぎる表現を直す、解説を短くする、誤答選択肢をもっと自然にする。こうした微調整の往復がしやすいので、「ゼロから一気に完成品」より、下書きを育てる使い方に向いています。

しかもOpenAI公式では、ファイルを使った要約・抽出・変換が強みとして案内されていて、教材PDFやWord資料から論点を抜き出し、それを出題化する流れが組みやすいです。教育向けには、学年や既習事項、目標を確認しながら生成する教員向けプロンプト例も公開されています。[Source] [Source]

一方で微妙だったのは、資料の種類によっては期待ほど読めないことです。OpenAI公式では、通常プランでは文書内画像は基本的に捨てられ、主にテキストベースで処理されると案内されています。つまり、スキャンPDFや図表中心の教材をそのまま投げて完璧な問題を期待すると、ズレる可能性があります。さらに個人向けサービスでは、アップロード内容がモデル改善に使われる可能性があるため、学校現場では生徒情報や機微情報の扱いに慎重さが必要です。[Source]

Claudeが良かった点・微妙だった点

Claudeの強さは、一回きりの問題作成より、継続運用にあると感じます。理由はProjectsです。単元資料、過去のテスト、到達目標、作問ルールなどをプロジェクト知識として持たせておけるので、毎回ゼロから説明しなくていい。これは先生にとってかなり大きいです。問題バンク化したい人には、明らかに相性がいい設計です。Anthropic公式でも、Projectsは知識ベースを持つ自己完結型ワークスペースとして案内され、必要に応じてRAGで容量拡張されると説明されています。[Source]

さらにPDFに関しては、100ページ未満ならテキストだけでなく画像・グラフなどの視覚要素も分析できると案内されています。理科や社会で図表つき資料から問題を作りたい場面では、これは地味に効きます。[Source]

一方で微妙だったのは、「きれいに整う」ことが、必ずしも「そのまま使える」ではないことです。Claudeは丁寧に整った文を返しやすい反面、試験として必要なひっかけの質や、出題意図の鋭さまでは、こちらが明示しないと無難にまとまりがちです。あと、非PDF文書に埋め込まれた画像は読めないので、教材の形式によっては思ったほど万能ではありません。[Source]

Geminiが良かった点・微妙だった点

Geminiの魅力は、やはり学校のGoogle運用に乗せやすいことです。Google公式では、Google Classroom内で教師が学年やトピックを入れてクイズ案を作ったり、テキストから読解問題を作ったり、生成結果をGoogle FormsやGoogle Docsへ出したりできる流れが示されています。つまり、作るだけではなく、配るところまで近い。ここが強いです。[Source] [Source] [Source]

また、Gemini Apps自体も複数ファイルのアップロードや分析ができるので、授業プリント、補助資料、語句リストをまとめて見せてから出題化する流れも作れます。[Source]

ただし微妙だったのは、学校アカウント・管理者設定・ライセンス条件にかなり左右されることです。Googleの案内を見ると、Gemini in Classroom全体はEducation向けに広く展開されていますが、個別機能には18歳以上・英語対応・アドオンやライセンス前提のものもあります。組織導入なら強い一方で、「個人で今すぐ試す」では少し分かりにくいことがあります。[Source] [Source]

用途別に見ると、どれが向いているか

小テストを早く量産したい

ChatGPTがいちばん向いています。1回目の下書きから修正までが速く、「この問題だけ難しすぎる」「解説を80字で」「選択肢Bをもっと紛らわしく」といった微調整がしやすいからです。

単元ごとに問題バンクを育てたい

Claudeが向いています。Projectsに資料や作問方針を蓄積できるので、翌週・翌月の運用が楽です。講師が複数いる塾や、学年主任が作問ルールを管理したい場面とも相性がいいです。[Source]

ClassroomやFormsで配布までつなげたい

Geminiです。これはかなり明快です。Google Classroomでの問題生成やForms出力が前提なら、余計な移し替えが減ります。[Source]

解説文まで丁寧に整えたい

ChatGPTかClaudeが向いています。Geminiでもできますが、解説の調整や表現の磨き込みは、現時点ではこの2つのほうがやりやすい場面が多いです。

初心者が選ぶならどれか

初心者が1つだけ選ぶなら、基本はChatGPTです。

理由は3つあります。1つ目は使い方の情報が多いこと。2つ目は教材→問題→解説の往復修正がしやすいこと。3つ目はGoogle環境や学校導入前提でなくても試しやすいことです。

ただし例外があります。学校がGoogle Workspace / Classroom中心ならGemini、最初から資料蓄積型で運用したいならClaudeです。つまり、個人で始める初心者＝ChatGPT、学校Google運用の初心者＝Gemini、継続設計型の初心者＝Claude、この整理でOKです。

失敗しやすいポイントと回避策

1. いきなり全部作らせる

問題、答え、解説、配布文まで一気に頼むと、だいたい薄まります。問題→解説→整形の順に分けるだけで改善します。

2. 学年と到達目標を書かない

AIは指定がないと、妙に一般論っぽい問題を作りがちです。OpenAIの教員向けガイドも、学年・既習知識・学習目標を先に確認する流れを示しています。[Source]

3. スキャンPDFや図表教材をそのまま信用する

これは地味に事故ポイントです。ChatGPTは通常プランでは文書中の画像を読み飛ばすことがありますし、Claudeも非PDF文書の埋め込み画像は弱い。OCR済みテキスト化や、重要箇所の貼り付け直しをしたほうが安全です。[Source] [Source]

4. 生徒情報や著作権まわりを軽く見る

これはかなり重要です。個人向けAIサービスでは、データ利用条件が学校導入向けと違うことがあります。OpenAIは個人向けサービスでアップロード内容がモデル改善に使われる可能性を案内しており、GoogleはGemini in Classroomで著作権順守と、教育向けでは人手レビューや学習利用をしない保護を案内しています。機微情報は匿名化し、教材の権利関係も確認したほうが安全です。[Source] [Source]