☑️ みずほフィナンシャルグループが独自開発の金融特化LLMを公開
☑️ 銀行実務テストで正答率89.0%と応答時間1秒未満を両立
☑️ オンプレミス運用により機密データの高度なAI処理が可能に
みずほフィナンシャルグループは、独自に開発を進める「金融特化LLM(大規模言語モデル)」が、銀行の実務テストにおいて正答率89.0%を達成したと発表しました。同時に業務実装を想定した評価で平均回答時間1秒未満を確認。汎用LLMであるGPT-5.2の推論あり設定(平均回答時間67.4秒)と比較し、精度を維持したまま応答時間を大幅に短縮しました。
本取り組みの主な特徴は、自社開発モデルを銀行内のセキュアな閉域環境(オンプレミス)で運用できる点にあります。これにより、機密性の高い重要データに対しても、汎用モデルと同等の高度なAI処理を安全に適用可能としています。
汎用AIの課題を「知識の定着」で解決
金融業界では生成AIの活用が広がる一方で、複雑な金融商品や社内規定に関する照会において、回答時間の増加や計算コストの上昇が課題となっていました。特に法人向け業務や市場分析では、応答の遅延が市場機会の喪失に直結する懸念があります。
みずほフィナンシャルグループは、オープンウェイトモデルの「Qwen3-32B」をベースに、複雑な推論ステップを経ずに回答できるモデルの構築を進めてきました。具体的には、銀行業務で必要性が高い金融基礎や社内ルールなどの領域を特定し、根拠となるコンテキストを付与した教師データでファインチューニングを実施。知識をモデルに直接定着させることで、推論プロセスに依存しない高速な応答を実現したと説明しています。
実務テスト(預金、融資、外国為替など)における検証結果は以下の通りです。
| LLMの種類 | 推論設定 | コンテキスト付与 | 正答率 | 平均回答時間 |
|---|---|---|---|---|
| 金融特化LLM (Qwen3-32Bベース) | なし | あり | 89.0% | 1秒未満 |
| 汎用LLM (GPT-5.2) | なし | あり | 89.0% | 1秒未満 |
| 汎用LLM (GPT-5.2) | あり | なし | 89.7% | 67.4秒 |
専門領域への段階的な適用拡大
みずほフィナンシャルグループは、業務特性に応じたAI基盤を3段階で整備する計画を立てています。第1段階として一般的な照会応答を支援する「金融特化LLM」を構築し、続く第2段階では融資や法務、市場など特定部署の専門データを学習させた「特定領域特化LLM」を開発。最終的には複数の専門モデルを連携させ、部門横断的な判断を支援する「協調型エキスパートLLM」の構築を進める方針です。
今後はパラメータサイズを拡大したモデルでの学習や、強化学習などの手法拡充に取り組むとしています。金融機関に求められる統制と安全性を維持しながら、高度な専門業務へAIをどう浸透させていくかが今後の焦点となりそうです。
発表日時: 2026年3月5日
関連URL: https://prtimes.jp/main/html/rd/p/000000002.000177612.html
