#ai信頼性のAIニュース

9件の記事

研究者が発見：AIモデルは助けを求めるより推測することを選ぶ

研究者がProactiveBenchで22のマルチモーダル言語モデルをテストした結果、視覚情報が欠けている場合に助けを求めるモデルはほぼなく、単純な強化学習アプローチが修正の可能性を示唆している。

研究によると、GoogleのAI生成検索応答「AI概要」は90%の正確性を示しており、従来不明だった誤り発生頻度を初めて数値化した。

Moonbounce社が1200万ドルを調達し、コンテンツモデレーション方針を一貫したAI行動に変換するAI制御エンジンを拡大する。

クイニピアック大学の世論調査によると、米国でのAI導入は進んでいるが、透明性や規制、社会への影響を懸念する声が多く、信頼度は低いままである。

研究者が、回答生成だけでなく信頼度推定も行う不確実性認識大規模言語モデルシステムを構築した。3段階の推論パイプラインで、モデルは回答と信頼度スコアを生成し、自己評価で回答を批判・改良する。

アマゾンは、AI起因とされる一連の障害を受けて、AIが生成したコードの品質確認のために上級エンジニアをヒューマンフィルターとして配置する方針を発表した。

専門家が、生成AIは根本的な設計上、税金申告や人命に関わる判断に信用できないと警告している。

学習済みモデルの特定入力に対する正しさを保証するため、理論に基づく自己証明モデルを提案。平均精度ではなく個別入力の信頼性を確保する手法。

Bespoke Labsは、Ollamaで利用可能な新しい事実確認モデル「Bespoke-Minicheck」を開発した。このモデルは、他のモデルが生成した応答を事実確認し、幻覚を検出・低減できる。