#信頼性のAIニュース

17件の記事

ポール・グレアムへの言及：AI 作成メールの不信感

ポール・グレアムは、創業者から届く AI 作成のメールが人間によるものか偽装されていると感じ、そのようなメールを無視する傾向があると述べている。

Simon Willison Blog·5月27日·★★★★

AIの現実検証：3社がウォレット、住宅、ゲーム構築で学んだこと

シティ、ホームデポ、カプコンの経営陣は、AIエージェントが実験ツールから顧客対応業務へ移行する過程で得た知見を語った。次なる課題は、金銭や創造的出力に関わる際のガバナンスと信頼性の確保である。

The Register AI/ML·4月28日·★★★★

InsightFinderが1500万ドルを調達、企業がAIエージェントの失敗箇所を特定する支援へ

InsightFinderが1500万ドルを調達し、企業がAIエージェントの失敗箇所を特定する支援を行う。CEOのHelen Guは、業界の最大の問題はAIモデルの監視だけでなく、AIが組み込まれた技術スタック全体の診断だと指摘している。

TechCrunch AI·4月17日·★★★★

クイニピアック大学の新世論調査、AI利用は過去最高だが信頼度は低下と報告

クイニピアック大学の世論調査が、米国人のAI利用が増加している一方で、AIへの信頼度がさらに急速に低下している矛盾を明らかにした。AIに最も詳しいZ世代は雇用市場への見通しが最も暗い。

The Decoder·4月6日

AIモデルは見たことのない画像を自信満々に描写し、ベンチマークはその問題を見逃している

スタンフォード大学の研究によると、GPT-5やGemini 3 ProなどのマルチモーダルAIモデルは、画像が提供されていない場合でも詳細な画像描写や医療診断を生成する。一般的なベンチマークはこの問題を隠蔽している。

The Decoder·3月31日·★★★★

Delve、顧客を「偽のコンプライアンス」で誤解させたと非難される

匿名のSubstack投稿が、コンプライアンススタートアップのDelveが、プライバシー・セキュリティ規制への「コンプライアンス達成」を「虚偽」で「数百の顧客」に信じ込ませたと告発した。

TechCrunch AI·3月22日

Delve、『偽のコンプライアンス』で顧客を誤解させたと非難される

匿名のSubstack投稿が、コンプライアンススタートアップのDelveがプライバシー・セキュリティ規制への「コンプライアンス達成」を「虚偽」で数百の顧客に信じ込ませたと告発している。

TechCrunch AI·3月22日

メモリ安全性を超えて：Rustが異なる理由 - 自律ロボット工学からの教訓

本記事は、自律移動ロボットの制御システム開発を通じて、Rust言語の特徴を分析している。Rustの真の強みは、メモリ安全性だけでなく、型システムと所有権ルールにあると指摘する。

InfoQ·3月18日

世界がAIショッピングエージェントの背後にいる人間を検証するツールを立ち上げ

サム・アルトマンのスタートアップが、AIエージェントによるオンラインショッピングの普及を受け、エージェント型商取引を支援する検証サービスを拡大する。

TechCrunch AI·3月18日

GrammarlyのAIライティング機能が、無許可で専門家の名前を使用していると指摘

Grammarlyが「Expert Review」というAI機能で、許可なくジャーナリストや著者の名前を使用していると記事が報じた。

The Decoder·3月12日

OpenAIの新しいトレーニングデータセットはAIモデルに信頼すべき指示を教える

OpenAIは、AIモデルが信頼できる指示を信頼できない指示よりも優先するように教えるためのトレーニングデータセット「IH-Challenge」をリリースした。初期結果では、セキュリティとプロンプトインジェクション防御の両方で大幅な改善が見られている。

The Decoder·3月12日·★★★★

OpenTitan、製品として出荷開始

GoogleのオープンソースプロジェクトOpenTitanが、初めて製品として出荷を開始した。

Google Developers JP·3月10日·★★★★

OpenAIがAIセキュリティプラットフォームPromptfooを買収

OpenAIは、企業がAIシステム開発時に脆弱性を特定・修正するAIセキュリティプラットフォームPromptfooを買収する。

OpenAI News·3月9日·★★★★

幻覚スパン検出のための推論学習

研究者が、大規模言語モデルの幻覚（根拠のない生成内容）をスパン単位で検出するために、明示的な推論プロセスを導入する手法を提案した。従来の二値分類ではなく多段階判断を可能にし、信頼性向上を目指す。

Apple Machine Learning·3月3日·★★★★

AnthropicのClaudeが広範囲にわたるサービス停止を報告

AnthropicのAIチャットボットClaudeが月曜日の朝に広範囲なサービス停止を経験し、数千人のユーザーがボットへのアクセスに問題を報告した。

TechCrunch AI·3月2日

なぜ私たちはLLM記事に嫌悪感を抱くのか

著者は、大量のLLM（大規模言語モデル）記事が氾濫する状況に嫌悪感を抱き、自らの執筆経験を振り返りながら、AI技術の活用と人間の創造性のバランスについて考察している。

Andrej Karpathy 厳選·3月2日

研究：最新LLMをランク付けするプラットフォームは信頼性に欠ける可能性

オンラインランキングプラットフォームの基盤となるクラウドソースデータのごく一部を削除するだけで、結果が大きく変わる可能性があるという研究結果。

MIT ML News·2月9日·★★★★

#信頼性 のAIニュース