#プロンプトエンジニアリング のAIニュース
100件の記事
Claude Code構築の経験:私たちがSkillsをどのように活用しているか
Anthropic社の内部チームが、Claude Code Skillsの実践的経験を共有した。9つのSkillsタイプの分類、作成方法、チームへの展開戦略について解説している。
エージェンティック・エンジニアリングとは何か
著者のSimon Willison氏が、コーディングエージェント(Claude Code、OpenAI Codexなど)の支援を受けてソフトウェアを開発する実践を「エージェンティック・エンジニアリング」と定義している。
ソートアルゴリズム
開発者のSimon Willison氏が、Claude Artifactsを使用してソートアルゴリズムのアニメーション解説を作成し、Pythonのtimsortアルゴリズムを追加して一括実行機能を実装した。
フロンティアLLMにおける命令階層の改善
研究チームがIH-Challengeを開発し、大規模言語モデルに信頼できる命令を優先させる訓練を行い、命令階層の向上、安全性の制御性、プロンプトインジェクション攻撃への耐性を改善した。
OpenAIがAIエージェントの安全性確保のためPromptfooを買収
OpenAIはAIエージェントの安全性確保を目的にPromptfooを買収した。先端AI研究所は重要な業務運用で技術を安全に活用できることを証明するため競争している。
新研究がAIコーディングにおけるAGENTS.mdファイルの価値を再評価
ETH Zurichの研究者が、AGENTS.mdファイルはAIコーディングエージェントの妨げになることが多いと結論付け、LLM生成のコンテキストファイルを完全に省略し、人間が書く指示は推測不可能な詳細に限定することを推奨した。
スキル評価
LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。
AI翻訳の3つの進化段階:プロンプト時代→推論モデル時代→エージェント時代
著者がAI翻訳ツール開発で経験した3段階の進化を解説。プロンプト設計から推論モデル活用、自律的エージェントへの発展過程と、翻訳品質向上のための設計原則を共有。
最高裁のAI著作権判決は包括的に聞こえるが、実際にはほとんど解決していない
米国最高裁は、AI発明家スティーブン・テイラーが機械を画像の唯一の著者として認めるよう求めた訴えを却下した。しかし、この判決はこの極端な事例のみを対象としており、AIツールで作成した作品の著作権を人が主張できるかどうかについては何も述べていない。
Anthropicの新プロンプトがChatGPTにユーザー情報を全て開示させる
Anthropicは、OpenAIの不祥事を利用し、ChatGPTなどの保存コンテキストを単一プロンプトでClaudeに移行できる新機能を発表した。
Claude.comのメモリエクスポート機能に関する引用
ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。
できることを蓄積せよ
著者Simon Willison氏が、コーディングエージェントを生産的に活用するためのヒントとして「できることを蓄積する」重要性を述べている。これは、ソフトウェア構築において何が可能か不可能かを理解し、実現方法の見通しを持つことが重要であるという従来からのキャリアアドバイスを拡張したものだ。
エージェントの挙動は本番環境で初めてわかる
AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。
エンジニアリングの制御:『エージェントファースト』の世界でCodexを活用する
OpenAIチームが、Codexエージェントを使用して100万行のコード製品をゼロから構築した経験を共有した。3人のエンジニアが1500のプルリクエストを処理し、完成時間は手動コーディングの10分の1だった。
アドビの新Firefly「Quick Cut」ツール、テキストプロンプトから生映像をラフ編集に変換
アドビのFireflyが新機能「Quick Cut」を追加。テキストプロンプトから生映像を自動でラフ編集できるようになり、映像編集の効率化が期待される。
OpenClaw開発者がAI構築者にアドバイス:より遊び心を持ち、改善の時間を確保せよ
Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。
Adobe Fireflyの動画エディターが映像から自動で初稿を作成可能に
Adobe Fireflyの新機能「Quick Cut」は、AIがユーザーの指示に基づき映像を編集し、最終動画の初稿を自動生成します。
最初にテストを実行せよ
コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。
赤/緑TDD
コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。
2026年2月23日 社会的影響 Anthropic教育報告書:AIフルーエンシー指数
Anthropicの教育報告書が発表したAIフルーエンシー指数は、AIリテラシーの社会的影響を分析し、2026年時点での教育課題と対策を示している。
Notion CEO:エージェントが使えない製品に未来はない
Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。
プロンプトだけでは平凡なAIライティングは救えない
AIライティングの品質向上には、プロンプトよりも素材の質・モデルの性能・レビュー能力の3要素が重要である。
Geminiで創造的なプロンプトをインタラクティブなXR体験に変える
Android XRチームはGeminiのCanvas機能を活用し、没入型拡張現実(XR)体験の作成を簡素化しています。
Claude CodeのHook + Skillで、コミット後の変更を自動的にコミットする方法
Claude CodeのStop Hookで未コミットの変更を検知し、カスタムCommit Skillで自動的にグループコミットを行うことで、手動コミットを不要にする方法を紹介。
GLM-5とMinimax M2.5がWindsurfで利用可能に
Zhipu AIのGLM-5とMinimax M2.5が期間限定価格でWindsurfに追加され、Arena Modeの対戦グループで利用可能です。
AIらしさを消すためのプロンプトは間違いだ、方向性が誤っている
著者は、AIの出力からAIらしさを除去するためのプロンプトは根本的に誤ったアプローチだと主張する。代わりに、ユーザーの好みやスタイルを記録した「レシピ」をAIに与え、継続的に更新することで、より個性的で正確な文章生成が可能になると提案している。
SQL未経験でも即戦力に?アナリスト組織が挑む「AIネイティブ」な働き方改革
DeNAのアナリティクスチームが、AIツールを活用してSQL未経験者でもデータ分析業務に参画できる「AIネイティブ」な働き方改革に取り組んでいる事例を紹介。
Anthropicの成長マーケティングチームがClaude Codeで広告作成時間を30分から30秒に短縮
Anthropicの成長マーケティングチームが、自社開発のAIツール「Claude Code」を使用して、広告作成にかかる時間を30分から30秒に大幅に短縮した。
マルチエージェントシステムの構築:使用するタイミングと方法
OpenAIがマルチエージェントシステムの構築について解説し、複数のAIエージェントを連携させる適切なタイミングと実装方法を説明した。
DeNA × AI Talks #4 開催! - LLMを組み込んだプロダクト開発の実践的知見を公開!
DeNAが主催するAIトークイベント第4回の開催報告。LLMを製品開発に組み込む実践的な知見が共有された。
LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論
AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。
尊厳あるPython:LLMエージェントを改善する10のルール
現代のLLMは原則ではなくパターンを生成する。尊厳あるPythonはエージェントに意図を与え、コードを明示的で一貫性があり注意深く設計されるようにする。
動的コンテキスト発見
OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。
実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化
LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。
Windsurf バージョン 1.12.44 のパッチと改善点
開発者チームは、Windsurf の新バージョン 1.12.44 をリリースし、プロンプトが長すぎるエラーの発生頻度を減らし、MCP OAuth 設定でスコープ未指定時に全サポート範囲を要求する機能を追加した。
プロンプションズ、動的UIコントロールでAIプロンプトの精度を向上させる
開発チームは「Promotions」UIフレームワークを公開し、ユーザーがAI応答を動的に制御できるインターフェースを提供する。これにより顧客支援や教育などでプロンプト試行錯誤を削減できる。
Windsurf 1.12.41 の新機能:プロンプト管理と MCP サーバー対応の強化
AI エディタ「Windsurf」がバージョン 1.12.41 をリリースし、ユーザープロンプトのログ記録やポリシー違反ブロックを可能にする「Cascade Hooks」機能を追加した。また、GitLab や GitHub のリモート MCP サーバーサポートを強化し、認証問題の修正も行った。
LLMを活用したAmazon商品リストの改善
Amazonが大規模言語モデル(LLM)を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。
AIエージェントのための効果的なコンテキスト設計
AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
LLMでJSON出力する際に気をつけていること3選
Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。
プロンプトを隠すな、見せろ
LLM出力の改善を目指すライブラリ群は、ユーザーがプロンプト作成から遠ざかるよう促す傾向がある。DSPyなどのツールは、この「プロンプトの仲介排除」を新たなパラダイムとして提示している。
日本語LLMの評価におけるプロンプトバージョンごとの得意不得意の調査
著者がlm-evaluation-harnessとJGLUEデータセットを使用し、FintanPromptやAlpacaPromptなど複数のプロンプトバージョンによる日本語LLMの評価結果を比較し、各プロンプトの特性を分析した。
PromptIDEの発表
プロンプトエンジニアリングと解釈可能性研究のための統合開発環境を発表。
Code Llamaのプロンプト方法
Code Llamaのプロンプト構造、バリエーション、機能(指示、コード補完、中間補完)について解説するガイドです。
記事中のノイズ削除方式 - ChatGPTとの比較
ストックマーク社が自社製品で実装している記事中のノイズ削除技術を、ChatGPT Plus(GPT-4)と比較検証している。プロダクトへの組み込み可能性を探る実践的な比較記事である。
プロンプトエンジニアリング
プロンプトエンジニアリングは、モデルの重み更新なしでLLMの出力を制御する手法である。これは経験的な科学であり、モデルごとに効果が変わるため、多くの実験とヒューリスティックなアプローチが必要となる。
AI画像生成で古いコンピューターグラフィックスを再構築
AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。
Cohereによる大規模言語モデルの実世界への応用
CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。