2025-09-01から1ヶ月間の記事一覧

【検証】Claude Opus 4.1 vs codex-1(high) | プロセス・定量・定性の3軸で比較 2025年9月版

はじめに 本来は要件定義〜設計からのフルサイクルでの比較を目指したが、自由度の高い指示では中途逸脱が多く再現性が下がってしまいました ;( そのため、本検証では設計を既知の状態に固定し、実装・運用タスクの正確性と堅牢性に評価軸を絞っています。1…