GLM 5.2 beats Claude in our benchmarks
セムグリップのブログによると、中国発の AI モデル「GLM 5.2」がセキュリティベンチマークにおいて Claude を上回るスコアを記録しました。これは大規模言語モデル間の競争が激化し、特にサイバーセキュリティ分野での性能比較が重要視されていることを示しています。
Hacker日報
30件の記事を集計·2026/6/30 0:01:30 生成
本日最大の議論は、AI モデル「GLM 5.2」が Claude をベンチマークで上回ったという発表と、Claude Code を用いた MRI 診断の試行に関する記事によって支配されています。これら AI の急速な進化に対し、Tidal の新しい AI ポリシーや年齢確認が言論の追跡につながるという懸念など、AI と倫理・プライバシーをめぐる議論も活発です。また、HackerRank が ATS(採用管理システム)をオープンソース化したことで、求職者がアルゴリズムにどう評価されるかという実用的な関心が高まっています。
セムグリップのブログによると、中国発の AI モデル「GLM 5.2」がセキュリティベンチマークにおいて Claude を上回るスコアを記録しました。これは大規模言語モデル間の競争が激化し、特にサイバーセキュリティ分野での性能比較が重要視されていることを示しています。
年齢確認制度の導入が、単なる規制ではなく、オンライン上の発言を自動的に追跡・特定するシステムへの第一歩であるという懸念記事です。デジタルプライバシーと表現の自由をめぐる深刻な議論を喚起しており、コメント数も非常に多いです。
採用管理システム(ATS)をオープンソース化したハッカランクの発表に対し、多くのユーザーが自分の履歴書スコアに一喜一憂しています。アルゴリズムによる選考プロセスが可視化されることで、求職者側から「ブラックボックス」への不安と関心が集まっています。
医療画像診断において AI モデル(Claude Code)にセカンドオピニオンを求めたという実体験談です。AI の医療応用が現実のものとなりつつある一方、その限界やリスクに対する議論も活発で、技術と人間の役割の再定義を迫る内容です。
サンディア国立研究所が開発した、Intel 8085互換の独自のCPU「SA3000」についての記事です。レガシーなアーキテクチャを現代の技術で再構築する試みや、軍事・研究用ハードウェアの特殊性に興味を持つエンジニアから高い評価を得ています。