メインコンテンツへスキップ

#セキュリティ のAIニュース

174件の記事

知性と判断の分離不可能性:AIアライメントのためのフィルタリングの計算論的困難性について

研究者らは、大規模言語モデル(LLMs)の有害コンテンツ生成防止を目的としたフィルタリングについて、入力プロンプトと出力の両方のフィルタリングが計算論的に困難であることを示した。

Apple Machine Learning·3月3日·★★★★

週次アップデート493

オディド社のデータ漏洩事件が今週の更新で報告された。複数回のデータダンプが発生し、最終的に全てのデータが流出したと記録されている。

Andrej Karpathy 厳選·3月2日

AIは数ドルで偽名と実名を数分で結び付けられる

ETH ZurichとAnthropicの研究者が、商用AIモデルを数ドルで使用して偽名インターネットユーザーの実名を特定できることを実証した。この結果はオンライン匿名性の基本的な前提に疑問を投げかけている。

The Decoder·3月1日·★★★★

2026年2月の記録

著者がGhostで初めての機能「Inbox Links」をリリースした。この機能はメンバーがメールアドレスを入力すると受信トレイに直接移動するボタンを表示するもので、MXレコードやRFC準拠のメールアドレス解析について学んだ。また、gzipストリームが圧縮時のOS情報をエンコードすることに驚いた。

Andrej Karpathy 厳選·2月28日

ユーザーデータの暗号化にパスキーを使用するのはやめてください

Tim Cappalli氏は、ユーザーがパスキーを頻繁に紛失し、データが回復不能になるリスクがあるため、業界にパスキーによるユーザーデータ暗号化の使用停止を訴えている。

Simon Willison Blog·2月28日

インターネットで最も目にするUI?Turnstileとチャレンジページの再設計

Cloudflareが、人間確認用ウィジェット「Turnstile」とウェブサイトアクセス前のセキュリティチェック「チャレンジページ」の再設計を発表した。

Cloudflare Blog·2月27日

メンバーズオンリー:あなたの匿名性セットは崩壊しており、あなたはまだ気づいていない

オンライン匿名性の脆弱性を指摘し、プライバシー保護の重要性を警告する記事。

Andrej Karpathy 厳選·2月26日

CodeQLがGo 1.26とKotlin 2.3.10をサポートし、クエリ精度を向上

GitHubの静的解析エンジンCodeQLがバージョン2.24.2でGo 1.26とKotlin 2.3.10をサポートし、セキュリティ問題の発見精度を向上させました。

GitHub Changelog·2月25日

エージェント型アーキテクチャにおけるセキュリティ境界

OpenAIが、AIエージェントが生成コードを実行する際に機密情報にフルアクセスする現在の状況を指摘し、複数コンポーネントの信頼レベルに応じたセキュリティ境界の再設計を提案している。

Vercel Blog·2月24日·★★★★

エンタープライズ定義のカスタム組織ロールが一般提供開始

企業管理者が複数組織間でのロールベースアクセス制御を容易にするカスタム組織ロールを作成できるようになりました。

GitHub Changelog·2月24日

ローカルエージェント向けの安全なサンドボックスの実装

macOS、Linux、Windowsでエージェントサンドボックスを構築し、セキュリティを向上させながら中断を減らす方法について。

Cursor Blog·2月18日·★★★★

Gemini CLI拡張機能の使いやすさ向上

Gemini CLIは構造化された拡張機能を導入し、ユーザー体験を簡素化し、起動時の失敗を防止しています。

Google Developers AI·2月11日

エージェントがサンドボックスを接続する2つのパターン

エージェントが安全な作業環境(サンドボックス)を接続する主要な2つの方法について説明する記事。

LangChain Blog·2月11日·★★★★

コミュニティと共に成長する実践的なセキュリティ知識、LINE CTF

LINEヤフー株式会社が、2021年から毎年グローバルセキュリティ技術大会「LINE CTF」を開催し、セキュリティエンジニアの実践的な知識向上とコミュニティ育成を図っている。

LY Corp Tech Blog·2月10日

GenAI.milにChatGPTを導入

OpenAI for GovernmentがGenAI.milにカスタムChatGPTを導入し、米国防チームに安全なAIを提供することを発表しました。

OpenAI News·2月9日·★★★★

フックでGemini CLIをあなたのワークフローに合わせる

Gemini CLI v0.26.0以降で導入されたフック機能により、エージェントループをカスタマイズできます。コンテキストの追加、ポリシーの適用、シークレットのブロックが可能になります。

Google Developers AI·1月28日·★★★★

CloudflareのACME検証ロジックにおける脆弱性の緩和策

セキュリティ研究者グループFearsOffが2025年10月13日にCloudflareのACME検証ロジックの脆弱性を発見・報告し、特定のACME関連パスでWAF機能が無効化される問題をCloudflareがバグ報奨プログラムを通じて検証・対応した。

Cloudflare Blog·1月19日

MITの科学者が臨床AI時代の記憶化リスクを調査

MITの科学者が、データ収集アルゴリズムとサイバー攻撃が増加する中、臨床AIにおける患者データの記憶化リスクと医療倫理(ヒポクラテスの誓い)の保護について調査している。

MIT ML News·1月6日·★★★★

インターン生が挑戦した認証方式の移行──メルペイ加盟店管理画面へのOAuth 2.0導入

メルペイのインターン生が、加盟店管理画面の認証方式をOAuth 2.0に移行した取り組みについて、技術的挑戦と学びを共有しています。

Mercari Engineering·12月22日

許可プロンプトを超えて:Claude Codeのセキュリティと自律性を向上

Claude Codeの新しいサンドボックス機能により、ファイルシステムとネットワークの分離を実現し、許可プロンプトを減らしながらユーザーの安全性を高めています。

Anthropic Engineering·10月20日·★★★★

Gemini CLIのサンドボックス機能とは

Googleが提供するGemini CLIは、コマンドラインでGemini AIと対話できるツールであり、Claude Codeにはないサンドボックス機能を備えている。この機能はコード実行時の安全性を高めるために設計されており、-sフラグを付けるだけで簡単に利用できる。

Algomatic Tech Blog·6月26日

DeepSeek公式情報発信及びサービスチャネルに関する説明

DeepSeekは、偽アカウントや不正確な情報による混乱を防ぐため、公式アカウントがWeChat、X(Twitter)、小紅書のみであることを明らかにした。同社は、非公式アカウントの情報を信じないようユーザーに注意を促している。

DeepSeek Blog·2月6日

大規模言語モデルに対する敵対的攻撃

ChatGPTの普及によりLLM利用が加速する中、OpenAIはRLHFによる安全な動作構築に注力している。しかし、敵対的攻撃やジェイルブレイクプロンプトにより、モデルが望ましくない出力を行うリスクが存在する。

Lilian Weng·10月25日·★★★★

反撃するフィルター

Richard Jowsey氏が、スパムフィルターの精度向上のために、疑わしいメールのリンク先を確認する手法を開発した。この方法は、スパム送信者のサーバーに負荷をかける副作用を持つ。

Paul Graham·8月1日