#セキュリティ のAIニュース
174件の記事
知性と判断の分離不可能性:AIアライメントのためのフィルタリングの計算論的困難性について
研究者らは、大規模言語モデル(LLMs)の有害コンテンツ生成防止を目的としたフィルタリングについて、入力プロンプトと出力の両方のフィルタリングが計算論的に困難であることを示した。
週次アップデート493
オディド社のデータ漏洩事件が今週の更新で報告された。複数回のデータダンプが発生し、最終的に全てのデータが流出したと記録されている。
AIは数ドルで偽名と実名を数分で結び付けられる
ETH ZurichとAnthropicの研究者が、商用AIモデルを数ドルで使用して偽名インターネットユーザーの実名を特定できることを実証した。この結果はオンライン匿名性の基本的な前提に疑問を投げかけている。
2026年2月の記録
著者がGhostで初めての機能「Inbox Links」をリリースした。この機能はメンバーがメールアドレスを入力すると受信トレイに直接移動するボタンを表示するもので、MXレコードやRFC準拠のメールアドレス解析について学んだ。また、gzipストリームが圧縮時のOS情報をエンコードすることに驚いた。
ユーザーデータの暗号化にパスキーを使用するのはやめてください
Tim Cappalli氏は、ユーザーがパスキーを頻繁に紛失し、データが回復不能になるリスクがあるため、業界にパスキーによるユーザーデータ暗号化の使用停止を訴えている。
インターネットで最も目にするUI?Turnstileとチャレンジページの再設計
Cloudflareが、人間確認用ウィジェット「Turnstile」とウェブサイトアクセス前のセキュリティチェック「チャレンジページ」の再設計を発表した。
メンバーズオンリー:あなたの匿名性セットは崩壊しており、あなたはまだ気づいていない
オンライン匿名性の脆弱性を指摘し、プライバシー保護の重要性を警告する記事。
CodeQLがGo 1.26とKotlin 2.3.10をサポートし、クエリ精度を向上
GitHubの静的解析エンジンCodeQLがバージョン2.24.2でGo 1.26とKotlin 2.3.10をサポートし、セキュリティ問題の発見精度を向上させました。
エージェント型アーキテクチャにおけるセキュリティ境界
OpenAIが、AIエージェントが生成コードを実行する際に機密情報にフルアクセスする現在の状況を指摘し、複数コンポーネントの信頼レベルに応じたセキュリティ境界の再設計を提案している。
エンタープライズ定義のカスタム組織ロールが一般提供開始
企業管理者が複数組織間でのロールベースアクセス制御を容易にするカスタム組織ロールを作成できるようになりました。
ローカルエージェント向けの安全なサンドボックスの実装
macOS、Linux、Windowsでエージェントサンドボックスを構築し、セキュリティを向上させながら中断を減らす方法について。
Gemini CLI拡張機能の使いやすさ向上
Gemini CLIは構造化された拡張機能を導入し、ユーザー体験を簡素化し、起動時の失敗を防止しています。
エージェントがサンドボックスを接続する2つのパターン
エージェントが安全な作業環境(サンドボックス)を接続する主要な2つの方法について説明する記事。
コミュニティと共に成長する実践的なセキュリティ知識、LINE CTF
LINEヤフー株式会社が、2021年から毎年グローバルセキュリティ技術大会「LINE CTF」を開催し、セキュリティエンジニアの実践的な知識向上とコミュニティ育成を図っている。
GenAI.milにChatGPTを導入
OpenAI for GovernmentがGenAI.milにカスタムChatGPTを導入し、米国防チームに安全なAIを提供することを発表しました。
フックでGemini CLIをあなたのワークフローに合わせる
Gemini CLI v0.26.0以降で導入されたフック機能により、エージェントループをカスタマイズできます。コンテキストの追加、ポリシーの適用、シークレットのブロックが可能になります。
CloudflareのACME検証ロジックにおける脆弱性の緩和策
セキュリティ研究者グループFearsOffが2025年10月13日にCloudflareのACME検証ロジックの脆弱性を発見・報告し、特定のACME関連パスでWAF機能が無効化される問題をCloudflareがバグ報奨プログラムを通じて検証・対応した。
MITの科学者が臨床AI時代の記憶化リスクを調査
MITの科学者が、データ収集アルゴリズムとサイバー攻撃が増加する中、臨床AIにおける患者データの記憶化リスクと医療倫理(ヒポクラテスの誓い)の保護について調査している。
インターン生が挑戦した認証方式の移行──メルペイ加盟店管理画面へのOAuth 2.0導入
メルペイのインターン生が、加盟店管理画面の認証方式をOAuth 2.0に移行した取り組みについて、技術的挑戦と学びを共有しています。
許可プロンプトを超えて:Claude Codeのセキュリティと自律性を向上
Claude Codeの新しいサンドボックス機能により、ファイルシステムとネットワークの分離を実現し、許可プロンプトを減らしながらユーザーの安全性を高めています。
Gemini CLIのサンドボックス機能とは
Googleが提供するGemini CLIは、コマンドラインでGemini AIと対話できるツールであり、Claude Codeにはないサンドボックス機能を備えている。この機能はコード実行時の安全性を高めるために設計されており、-sフラグを付けるだけで簡単に利用できる。
DeepSeek公式情報発信及びサービスチャネルに関する説明
DeepSeekは、偽アカウントや不正確な情報による混乱を防ぐため、公式アカウントがWeChat、X(Twitter)、小紅書のみであることを明らかにした。同社は、非公式アカウントの情報を信じないようユーザーに注意を促している。
大規模言語モデルに対する敵対的攻撃
ChatGPTの普及によりLLM利用が加速する中、OpenAIはRLHFによる安全な動作構築に注力している。しかし、敵対的攻撃やジェイルブレイクプロンプトにより、モデルが望ましくない出力を行うリスクが存在する。
反撃するフィルター
Richard Jowsey氏が、スパムフィルターの精度向上のために、疑わしいメールのリンク先を確認する手法を開発した。この方法は、スパム送信者のサーバーに負荷をかける副作用を持つ。