#ai限界のAIニュース

3件の記事

LLMはコーディングと数学で圧倒的だが日常質問でつまずく、それは矛盾ではない

AIモデルはコードベース全体を数時間で再構築できるが、単純な日常質問でつまずく。これは矛盾ではなく、現在の言語モデルの根本的限界を示している可能性がある。

OpenAIのチーフサイエンティストJakub Pachockiは、かつて手作業でコードを書いていた実験をAIが1週間で処理できるようになったと認める一方、複雑なシステム設計はAIに任せられないと述べている。

Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25％に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。