#数学的推論のAIニュース

6件の記事

OpenAI の最新研究、LLM が数学の未解決問題を解決する能力を実証

OpenAI の研究者らは、GPT-5.5 Pro をソルバーに、Claude Opus 4.7 を検証者に用いたプロバイザー・ベリファイアワークフローを設計し、異なる分野の未解決数学問題に対してテストを行いました。その結果、このシステムは驚くほど強力な成果を示し、複数の未解決質問への回答に成功しました。

TLDR AI·7月1日·★★★★

GoogleのAletheiaが完全自律的なエージェント型数学研究の最先端を前進

Googleは、Gemini 3 Deep Thinkを使用するAI「Aletheia」を発表した。AletheiaはFirstProofチャレンジで新規数学問題の6/10を解決し、IMO-ProofBenchで約91.9%を獲得し、人間の介入なしでの研究レベルの証明発見における大きな進展を示した。

InfoQ·4月19日·★★★★

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を2時間未満で解いたと報告

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を80分で解き、数学者テレンス・タオは数学への有意義な貢献と評価した。

The Decoder·4月15日·★★★★★

Amazon Bedrockにおける強化学習ファインチューニング：ベストプラクティス

AWSが、Amazon Bedrockで強化学習ファインチューニング（RFT）のベストプラクティスを公開した。これにより、AIモデルの性能向上とカスタマイズが可能になる。

AWS Machine Learning Blog·4月9日·★★★★

数学には思考時間、日常知識には記憶が必要：新Transformerアーキテクチャが両方を実現を目指す

ドイツの研究チームが、Transformerモデルに問題を考える回数を自律決定させ、追加メモリと組み合わせることで、数学問題で大規模モデルを上回る性能を達成した。

The Decoder·3月22日·★★★★

NVIDIAがNemotron-Cascade 2をリリース：3Bの活性化パラメータを持つオープンな30B MoEモデルで、推論能力とエージェント機能を強化

NVIDIAは、30BのMixture-of-Expertsモデルで3Bの活性化パラメータを持つNemotron-Cascade 2を公開した。このモデルは「知能密度」を最大化し、フロンティアモデルよりも少ないパラメータで高度な推論能力を提供し、2025年の国際数学オリンピックなどでゴールドメダルレベルの性能を達成した。

MarkTechPost·3月21日·★★★★

#数学的推論 のAIニュース