#ai限界 のAIニュース
3件の記事
LLMはコーディングと数学で圧倒的だが日常質問でつまずく、それは矛盾ではない
AIモデルはコードベース全体を数時間で再構築できるが、単純な日常質問でつまずく。これは矛盾ではなく、現在の言語モデルの根本的限界を示している可能性がある。
The Decoder·4月10日
OpenAIのチーフサイエンティスト、実験にはAIを信頼するが複雑なシステム設計のレベルには達していないと指摘
OpenAIのチーフサイエンティストJakub Pachockiは、かつて手作業でコードを書いていた実験をAIが1週間で処理できるようになったと認める一方、複雑なシステム設計はAIに任せられないと述べている。
The Decoder·3月21日
Claudeがサイバーセキュリティ競技会に参加
Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25%に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。
Anthropic Red Team·8月9日