PRを含みます
面接対策読了時間: 20分

AIエンジニア面接でよく聞かれる質問30選

AIエンジニア・データサイエンティストの転職面接でよく出る技術質問・行動質問30問と模範解答を徹底解説。

面接対策の5つのポイント

  • STAR法(Situation・Task・Action・Result)で行動質問に答える
  • 技術質問は「定義→仕組み→実務での使い方→自分の経験」の4段階で答える
  • わからない質問は「詳しくはないですが、~の観点からは~と考えます」と正直に対処する
  • 数字・実績を具体的に示す(精度XX%・処理速度XX倍・コストXX%削減など)
  • 逆質問は3つ以上用意する(技術スタック・チーム構成・学習機会など)

機械学習・統計の基礎(10問)

Q1.過学習(Overfitting)とは何か説明してください。どのように対処しますか?

A.過学習とは、モデルが学習データに過度に適合し、未知データへの汎化性能が低下する現象です。対処法としては、①正則化(L1/L2)、②ドロップアウト、③交差検証、④学習データの増強、⑤早期終了(Early Stopping)、⑥モデルの複雑度を下げる(パラメータ削減)などがあります。

Q2.バイアスとバリアンスのトレードオフについて説明してください。

A.バイアスはモデルの予測値と真の値のずれ(モデルの単純化による誤差)、バリアンスは学習データの変動に対するモデルの感度(複雑すぎるモデルの不安定性)を表します。バイアスを下げるとバリアンスが上がり、逆も然りです。正則化・アンサンブル学習・適切なモデル選択でこのトレードオフを管理します。

Q3.精度(Precision)と再現率(Recall)の違いは?F1スコアとは?

A.Precisionは予測した陽性の中で本当の陽性の割合(TP/(TP+FP))、Recallは実際の陽性のうち正しく検出できた割合(TP/(TP+FN))です。F1スコアはPrecisionとRecallの調和平均で、両方のバランスを評価します。不均衡データやコスト非対称問題で特に重要な指標です。

Q4.勾配消失問題とはなんですか?どう対処しますか?

A.ニューラルネットワークの逆伝播で、層が深くなるほど勾配が小さくなり学習が停滞する問題です。対処法:①ReLU系活性化関数の使用(Sigmoid/tanhを避ける)、②Batch Normalization、③残差接続(ResNet)、④適切な重み初期化(Xavier/He初期化)、⑤グラジェントクリッピング。

Q5.決定木とランダムフォレストの違いを説明してください。

A.決定木は1本の木でデータを分割して予測するシンプルなモデル。過学習しやすい欠点があります。ランダムフォレストは多数の決定木(アンサンブル)をバギングで構築し、多数決/平均で予測します。特徴量のランダムサブセットを使うことでデータの多様性を確保し、高い汎化性能を実現します。

Q6.Transformerアーキテクチャを説明してください。

A.Transformerは自己注意機構(Self-Attention)をベースとしたニューラルネットワーク。エンコーダ・デコーダ構造で、各トークンが他の全トークンとの関係を注意重みで表現します。RNNと異なり並列処理が可能で、長距離依存関係を効率よく学習できます。BERT・GPT・LLaMAなどの現代LLMの基盤です。

Q7.教師あり学習・教師なし学習・強化学習の違いは?

A.教師あり学習はラベル付きデータで入出力のマッピングを学習(分類・回帰)。教師なし学習はラベルなしデータのパターンを発見(クラスタリング・次元削減)。強化学習はエージェントが環境との相互作用から報酬最大化を学習(ゲーム・ロボット制御)。実務では教師あり学習が最も多く使われます。

Q8.特徴量エンジニアリングで重要なことは何ですか?

A.①ドメイン知識の活用(業務理解から特徴量を設計)、②欠損値処理(削除/補完の使い分け)、③カテゴリ変数のエンコーディング(One-Hot/Target Encoding)、④外れ値処理、⑤スケーリング(正規化/標準化)、⑥特徴量の重要度分析と選択。Kaggleでは特徴量エンジニアリングがスコア差の大半を占めます。

Q9.クロスバリデーション(交差検証)とはなぜ重要ですか?

A.データを複数の分割(フォールド)に分けて、順番に検証データとして使い評価する手法です。単純なホールドアウト法より評価の信頼性が高く、データを無駄にしません。K-Fold・Stratified K-Fold・時系列データ用のTime Series Splitがあります。モデル選択・ハイパーパラメータチューニングで必須です。

Q10.A/Bテストの設計で重要なポイントは何ですか?

A.①統計的検出力とサンプルサイズの事前計算、②ランダム化によるバイアス排除、③メトリクスの事前定義(p値・有意水準・検出したい効果量)、④ノベルティ効果の考慮(新しい施策への一時的な反応)、⑤多重検定の補正(Bonferroni補正など)、⑥SRMチェック(Sample Ratio Mismatch)。

LLM・生成AI関連(8問)

Q1.RAG(Retrieval-Augmented Generation)を説明してください。

A.RAGは外部知識ベースからの検索と生成AIを組み合わせる手法です。ユーザーのクエリに関連する文書をベクトルDBから検索し、LLMのコンテキストに追加して回答を生成します。ハルシネーション低減・最新情報への対応・コスト削減の効果があります。LangChain・LlamaIndexで実装が容易です。

Q2.ファインチューニングとプロンプトエンジニアリングはどう使い分けますか?

A.プロンプトエンジニアリングはコスト低・スピード重視・汎用LLMで十分な場合に適します。ファインチューニングは特定ドメインの専門性が必要・大量の類似タスク・出力フォーマットの一貫性が重要な場合に適します。まずプロンプトで検証し、性能不足ならファインチューニングを検討するのが現実的なアプローチです。

Q3.LLMのハルシネーション(幻覚)をどう対処しますか?

A.①RAGで事実根拠となる文書を提供、②Chain-of-Thoughtプロンプティングで推論過程を明示させる、③出力の信頼度スコアを取得・閾値管理、④検索結果との矛盾チェック、⑤小さなタスクへの分解(タスク分割)、⑥人間によるレビューフローの組み込み。完全な解決は難しく、リスク管理が重要です。

Q4.Embeddingとはなんですか?どう活用しますか?

A.EmbeddingはテキストやデータをN次元の数値ベクトルに変換する技術。意味的に近いテキストはベクトル空間で近くに位置します。活用:①RAGのセマンティック検索、②類似文書検索・重複検出、③レコメンデーション、④クラスタリング・異常検知。OpenAI Embeddings・SentenceTransformersが代表的なライブラリです。

Q5.プロンプトエンジニアリングの主要なテクニックを教えてください。

A.①Zero-shot/Few-shot(例示なし・少数例)、②Chain-of-Thought(思考の連鎖)、③Role Prompting(役割付与)、④Self-Consistency(複数回答して多数決)、⑤Tree of Thought(思考ツリー探索)、⑥System Prompt設計(ペルソナ・制約の明確化)、⑦Output Format指定(JSON/Markdownなど構造化)。

Q6.LangChainのAgent機能とは何ですか?

A.LLMが自律的にツール(検索・計算・API呼び出し等)を選択・実行して目標を達成する仕組みです。ReAct(Reasoning + Acting)パターンで、LLMが「考える→行動→観察」を繰り返します。複雑な多ステップタスクの自動化に有効ですが、無限ループや誤操作のリスク管理が重要です。

Q7.LLMの推論速度・コスト最適化をどうやりますか?

A.①量子化(INT8/INT4)でモデルサイズ削減・速度向上、②KVキャッシュの活用、③バッチ処理・非同期APIコール、④小型モデルへの蒸留(タスク特化)、⑤プロンプトの短縮・システムプロンプトのキャッシュ、⑥ストリーミングレスポンス(知覚速度向上)、⑦エッジデプロイ(llama.cppなど)。

Q8.ベクトルDBの選定基準を教えてください。

A.①スケール要件(データ量・QPS)、②クラウド統合(マネージドか自己ホストか)、③ハイブリッド検索(ベクトル+キーワード)のサポート、④フィルタリング機能(メタデータでの絞り込み)、⑤コスト。Pinecone(クラウドネイティブ)・Weaviate(オープンソース・ハイブリッド検索)・Chroma(ローカル開発)・pgvector(PostgreSQL拡張)が代表的です。

実務・行動面の質問(12問)

Q1.今まで最も困難だったプロジェクトと、どう乗り越えたか教えてください。

A.STAR形式(状況・課題・行動・結果)で答えましょう。例:「データ品質が低く精度が出ない課題(状況)→ モデル精度が目標値に届かない(課題)→ データの前処理パイプラインを再設計し、ドメイン専門家と協力して特徴量を追加(行動)→ 精度がXX%向上し本番展開を達成(結果)」と具体的に。

Q2.なぜAI領域に転職したいのですか?

A.技術的な興味と事業インパクトの観点から答えましょう。「○○の業務でデータ分析を経験し、AIモデルで業務効率がXX%改善できることを実感。より専門性を高めてビジネス課題をAIで解決したい」など、実体験に基づく動機が効果的です。

Q3.機械学習モデルを本番環境に展開する流れを教えてください。

A.①モデル開発・評価(ローカル/実験環境)、②モデルの保存・バージョニング(MLflow/W&B)、③APIサービング(FastAPI/Flask + Docker)、④CI/CDパイプライン構築(GitHub Actions)、⑤A/Bテスト・シャドウデプロイ、⑥モニタリング(精度劣化・データドリフト検知)、⑦ロールバック手順の整備。

Q4.データドリフトとは何ですか?どう検出・対処しますか?

A.学習時のデータ分布と本番データの分布がずれる現象。モデル精度の劣化原因になります。検出:PSI(Population Stability Index)・KS統計量・コルモゴロフ・スミルノフ検定などの統計的手法。対処:定期的なモデル再学習・オンライン学習・アラートシステムの構築。Evidently・WhyLogsなどのツールが利用できます。

Q5.チームでのコード品質管理はどのようにやっていますか?

A.①GitHub/GitLabのPRレビュープロセス、②pytest/unittest によるテスト(カバレッジ80%以上)、③flake8/black/mypy によるコード静的解析(CI自動チェック)、④mlflow/DVC によるモデル・データのバージョン管理、⑤ドキュメント化(Docstring・README・ADR)。

Q6.AIプロジェクトのスコープ設定で気をつけることは?

A.①ビジネス目標の定量化(KPIの明確化)、②ML問題としての定義可能性の確認、③データ品質・量の事前評価、④ベースラインの設定(ルールベース・簡単なモデルとの比較)、⑤失敗リスクの明示(データ取得困難・性能目標未達)、⑥MVPと段階的スコープの設計。

Q7.非エンジニアのステークホルダーへのAI成果説明はどうやりますか?

A.①専門用語を避けてビジネス成果(売上・コスト削減・時間節約)に翻訳、②図解・可視化の活用(モデルの判断理由をXAIで説明可能にする)、③モデルの不確実性・限界の正直な開示、④PoC→パイロット→本番の段階的なコミュニケーション計画。LIME/SHAPでの説明可能性も重要です。

Q8.直近1年で最も勉強になった技術や経験は何ですか?

A.最新動向への学習姿勢を示しましょう。LLM/RAG・MLOps・新しいフレームワーク習得など具体的に。「Kaggleで○○コンペに参加し、上位XX%に入った経験から特徴量エンジニアリングの重要性を学んだ」のように実績を交えると印象的です。

Q9.データの倫理・AIバイアスについてどう考えますか?

A.①トレーニングデータのバイアス(代表性の欠如)の把握、②モデルの公平性指標の確認(統計的パリティ・均等機会)、③プロテクテッドアトリビュートの扱い、④AIの意思決定に対する説明責任の確保、⑤データプライバシー法規(個人情報保護法・GDPR)の遵守。社会的影響への意識も採用担当者が重視します。

Q10.仕事で最も得意なプログラミング言語は?なぜですか?

A.Pythonを軸に答えるのが無難ですが、プロジェクトの文脈でSQL・R・ScalaなどのLLMなど多様性を示すのも効果的です。「Pythonを主軸に、データ処理にはSQL、分散処理が必要な場面ではPySpark/Scalaを使っています」のように実務文脈での使い分けを説明できると高評価です。

Q11.5年後のキャリアプランを教えてください。

A.具体的なポジション(ML Lead・アーキテクト・リサーチャーなど)と、そのための学習計画を示しましょう。「AIエンジニアとして技術力を高めながら、3年後にはMLシステムのアーキテクト設計を担える立場に、5年後は事業戦略にAIを組み込むポジションを目指しています」のように段階的に答えると具体性が伝わります。

Q12.弊社を選んだ理由を教えてください。

A.「企業研究→自分の強みとの接続→入社後のビジョン」の3ステップで答えましょう。技術ブログ・Kaggleへの参加・GitHubのOSS活動など具体的な調査を引用することで、他社との比較ではなく貴社固有の魅力への共感を示せます。

スキルを磨いたら、転職エージェントに相談しよう

AI転職に強い専門エージェントが、あなたのスキルと経験に合った求人を無料で紹介します。