11月13日リリースのOpenAI最新モデル「GPT-5.1」を検証 「LegalOn: World Leading Legal AI」に実装予定~「GPT-5.1」のモデル検証を早期に実施。文体・表現力の向上や処理速度とコスト効率も改善を確認~
株式会社LegalOn Technologies(本社:東京都渋谷区 代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、2025年11月13日公開のOpenAIが開発する最新AIモデル「GPT-5.1」について検証いたしました。
その結果、精度や速度において効果が見られたため、近日「LegalOn: World Leading Legal AI」( https://www.legalon-cloud.com/)に、実装予定であることを発表いたします。

■「GPT-5.1」とは
OpenAIの新モデル「GPT-5.1」は、従来のGPT-5やGPT-4.1と比較して、次のような大きな進化を遂げています。
- 質問の難易度によって変化する思考時間
質問の難易度に応じて、AIが自律的に「考える時間」を調整するようになりました。簡単な質問には即応し、複雑な課題には深く推論します。
- 文体・表現力の向上
法的文書の生成・レビューにおいて、より自然で一貫したトーン、明確な構成、適切な専門性を発揮することができるようになりました。
- 非推論モードの導入
軽量タスクでは、従来のGPT-4.1同様の速度を維持しながら、ツール連携精度が強化されました。比較的負荷の小さい処理や短時間で完了する作業において、処理速度とコスト効率が改善されました。
■「GPT-4.1」、「GPT-5」、「GPT-5.1」の性能を比較検証
LegalOn Technologiesは、「GPT-4.1」、「GPT-5」、「GPT-5.1」を当社が独自に開発したベンチマークデータセットを用いて比較検証しました。検証した内容は、契約書レビュー業務の主なタスクである、問題点の抽出、修正文案提案、契約に関する質問への回答などの精度です。
- 契約書の修正文提案は、過去モデルよりも優れた文案を出す確率が2倍以上に
問題点の抽出、修正文案提案については、英語と日本語で約300のプロンプトを用いて、AIが6つの主要な論点(責任範囲、補償、セキュリティ、知的財産、契約終了、機密保持)に関してどの程度適切に修正文案を提案できるかを検証しました。
この検証は、AIが提案する修正文が「弊社の弁護士が受け入れられる、もしくは修正を要請するレベルの品質かどうか」を評価するものです。
「GPT-5.1」の契約修正タスクでは、英語と日本語のいずれにおいても精度が改善されていることを確認できました。
検証の数字は、弊社の社内弁護士が作成した模範解答により近い提案を生成した頻度を示しています。
<英語>
「GPT-5」と比較して67%、「GPT-4.1」と比較して57%の精度向上
<日本語>
「GPT-5」と比較して65%、「GPT-4.1」と比較して60%の精度向上
「GPT-5.1」の成果は、より正確で文脈を理解した修正文案の提案ができることを意味し、弁護士による実際の修正に近い業務が可能になりつつあることを示しています。
契約書レビューは、法務業務の中でも時間を要する業務のひとつです。AIが正確かつ弁護士のように修正を行えることで、交渉の高速化、修正回数の削減、戦略的業務に充てる時間の確保が可能になります。
- 処理速度は約30%向上
契約内容の説明や変更点の要約、質問応答などの会話的タスクではわずかに性能が低下した一方で、処理速度は約30%の向上が見られ、よりスムーズで高速なユーザー体験を実現しています。
■LegalOn Technologiesは、お客様の業務支援に最も適したモデルの選定を継続
LegalOn Technologiesは、活用場面や業務プロセスに最も適したモデルを選定するために、引き続き比較検証を行います。今後も、法務業務の生産性と品質を両立させる法務AIサービスの開発を進めてまいります。