#ai信頼性 のAIニュース
9件の記事
研究者が発見:AIモデルは助けを求めるより推測することを選ぶ
研究者がProactiveBenchで22のマルチモーダル言語モデルをテストした結果、視覚情報が欠けている場合に助けを求めるモデルはほぼなく、単純な強化学習アプローチが修正の可能性を示唆している。
The Decoder·4月11日
GoogleのAI概要は10回中9回正しいと研究が発見
研究によると、GoogleのAI生成検索応答「AI概要」は90%の正確性を示しており、従来不明だった誤り発生頻度を初めて数値化した。
The Decoder·4月8日
元Facebook社内関係者がAI時代のコンテンツモデレーションを構築
Moonbounce社が1200万ドルを調達し、コンテンツモデレーション方針を一貫したAI行動に変換するAI制御エンジンを拡大する。
TechCrunch AI·4月3日
AIツール利用者が増える米国で、結果を信頼できると答える人は減少
クイニピアック大学の世論調査によると、米国でのAI導入は進んでいるが、透明性や規制、社会への影響を懸念する声が多く、信頼度は低いままである。
TechCrunch AI·3月31日
信頼度推定、自己評価、自動ウェブ調査を備えた不確実性認識LLMシステムの構築実装
研究者が、回答生成だけでなく信頼度推定も行う不確実性認識大規模言語モデルシステムを構築した。3段階の推論パイプラインで、モデルは回答と信頼度スコアを生成し、自己評価で回答を批判・改良する。
MarkTechPost·3月22日·★★★★
アマゾン、AI生成コードのヒューマンフィルターとして上級エンジニアを配置
アマゾンは、AI起因とされる一連の障害を受けて、AIが生成したコードの品質確認のために上級エンジニアをヒューマンフィルターとして配置する方針を発表した。
The Decoder·3月11日·★★★★
生成AIを税金申告に信用するな――人命に関わる場面でも信用するな
専門家が、生成AIは根本的な設計上、税金申告や人命に関わる判断に信用できないと警告している。
Andrej Karpathy 厳選·3月6日·★★★★
自己証明するモデル
学習済みモデルの特定入力に対する正しさを保証するため、理論に基づく自己証明モデルを提案。平均精度ではなく個別入力の信頼性を確保する手法。
Apple Machine Learning·2月17日·★★★★
Bespoke-Minicheckで幻覚を低減
Bespoke Labsは、Ollamaで利用可能な新しい事実確認モデル「Bespoke-Minicheck」を開発した。このモデルは、他のモデルが生成した応答を事実確認し、幻覚を検出・低減できる。
Ollama Blog·9月18日