#プロンプトエンジニアリング のAIニュース

100件の記事

Claude Code構築の経験:私たちがSkillsをどのように活用しているか

Anthropic社の内部チームが、Claude Code Skillsの実践的経験を共有した。9つのSkillsタイプの分類、作成方法、チームへの展開戦略について解説している。

宝玉的分享·3月17日·★★★★

エージェンティック・エンジニアリングとは何か

著者のSimon Willison氏が、コーディングエージェント(Claude Code、OpenAI Codexなど)の支援を受けてソフトウェアを開発する実践を「エージェンティック・エンジニアリング」と定義している。

Simon Willison Blog·3月16日

ソートアルゴリズム

開発者のSimon Willison氏が、Claude Artifactsを使用してソートアルゴリズムのアニメーション解説を作成し、Pythonのtimsortアルゴリズムを追加して一括実行機能を実装した。

Simon Willison Blog·3月12日

フロンティアLLMにおける命令階層の改善

研究チームがIH-Challengeを開発し、大規模言語モデルに信頼できる命令を優先させる訓練を行い、命令階層の向上、安全性の制御性、プロンプトインジェクション攻撃への耐性を改善した。

OpenAI News·3月10日·★★★★

OpenAIがAIエージェントの安全性確保のためPromptfooを買収

OpenAIはAIエージェントの安全性確保を目的にPromptfooを買収した。先端AI研究所は重要な業務運用で技術を安全に活用できることを証明するため競争している。

TechCrunch AI·3月10日

新研究がAIコーディングにおけるAGENTS.mdファイルの価値を再評価

ETH Zurichの研究者が、AGENTS.mdファイルはAIコーディングエージェントの妨げになることが多いと結論付け、LLM生成のコンテキストファイルを完全に省略し、人間が書く指示は推測不可能な詳細に限定することを推奨した。

InfoQ·3月7日

スキル評価

LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。

LangChain Blog·3月6日

AI翻訳の3つの進化段階:プロンプト時代→推論モデル時代→エージェント時代

著者がAI翻訳ツール開発で経験した3段階の進化を解説。プロンプト設計から推論モデル活用、自律的エージェントへの発展過程と、翻訳品質向上のための設計原則を共有。

宝玉的分享·3月5日

最高裁のAI著作権判決は包括的に聞こえるが、実際にはほとんど解決していない

米国最高裁は、AI発明家スティーブン・テイラーが機械を画像の唯一の著者として認めるよう求めた訴えを却下した。しかし、この判決はこの極端な事例のみを対象としており、AIツールで作成した作品の著作権を人が主張できるかどうかについては何も述べていない。

The Decoder·3月5日·★★★★

Anthropicの新プロンプトがChatGPTにユーザー情報を全て開示させる

Anthropicは、OpenAIの不祥事を利用し、ChatGPTなどの保存コンテキストを単一プロンプトでClaudeに移行できる新機能を発表した。

The Decoder·3月2日

Claude.comのメモリエクスポート機能に関する引用

ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。

Simon Willison Blog·3月1日

できることを蓄積せよ

著者Simon Willison氏が、コーディングエージェントを生産的に活用するためのヒントとして「できることを蓄積する」重要性を述べている。これは、ソフトウェア構築において何が可能か不可能かを理解し、実現方法の見通しを持つことが重要であるという従来からのキャリアアドバイスを拡張したものだ。

Simon Willison Blog·2月27日

エージェントの挙動は本番環境で初めてわかる

AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。

LangChain Blog·2月26日·★★★★

エンジニアリングの制御:『エージェントファースト』の世界でCodexを活用する

OpenAIチームが、Codexエージェントを使用して100万行のコード製品をゼロから構築した経験を共有した。3人のエンジニアが1500のプルリクエストを処理し、完成時間は手動コーディングの10分の1だった。

宝玉的分享·2月26日·★★★★

アドビの新Firefly「Quick Cut」ツール、テキストプロンプトから生映像をラフ編集に変換

アドビのFireflyが新機能「Quick Cut」を追加。テキストプロンプトから生映像を自動でラフ編集できるようになり、映像編集の効率化が期待される。

The Decoder·2月26日·★★★★

OpenClaw開発者がAI構築者にアドバイス:より遊び心を持ち、改善の時間を確保せよ

Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。

TechCrunch AI·2月26日

Adobe Fireflyの動画エディターが映像から自動で初稿を作成可能に

Adobe Fireflyの新機能「Quick Cut」は、AIがユーザーの指示に基づき映像を編集し、最終動画の初稿を自動生成します。

TechCrunch AI·2月25日·★★★★

最初にテストを実行せよ

コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。

Andrej Karpathy 厳選·2月24日

赤/緑TDD

コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。

Andrej Karpathy 厳選·2月23日

2026年2月23日 社会的影響 Anthropic教育報告書:AIフルーエンシー指数

Anthropicの教育報告書が発表したAIフルーエンシー指数は、AIリテラシーの社会的影響を分析し、2026年時点での教育課題と対策を示している。

Anthropic Research·2月23日

Notion CEO:エージェントが使えない製品に未来はない

Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。

宝玉的分享·2月19日·★★★★

プロンプトだけでは平凡なAIライティングは救えない

AIライティングの品質向上には、プロンプトよりも素材の質・モデルの性能・レビュー能力の3要素が重要である。

宝玉的分享·2月19日

Geminiで創造的なプロンプトをインタラクティブなXR体験に変える

Android XRチームはGeminiのCanvas機能を活用し、没入型拡張現実(XR)体験の作成を簡素化しています。

Google Developers AI·2月19日·★★★★

Claude CodeのHook + Skillで、コミット後の変更を自動的にコミットする方法

Claude CodeのStop Hookで未コミットの変更を検知し、カスタムCommit Skillで自動的にグループコミットを行うことで、手動コミットを不要にする方法を紹介。

宝玉的分享·2月18日

GLM-5とMinimax M2.5がWindsurfで利用可能に

Zhipu AIのGLM-5とMinimax M2.5が期間限定価格でWindsurfに追加され、Arena Modeの対戦グループで利用可能です。

Windsurf Blog·2月16日

AIらしさを消すためのプロンプトは間違いだ、方向性が誤っている

著者は、AIの出力からAIらしさを除去するためのプロンプトは根本的に誤ったアプローチだと主張する。代わりに、ユーザーの好みやスタイルを記録した「レシピ」をAIに与え、継続的に更新することで、より個性的で正確な文章生成が可能になると提案している。

宝玉的分享·2月14日

SQL未経験でも即戦力に?アナリスト組織が挑む「AIネイティブ」な働き方改革

DeNAのアナリティクスチームが、AIツールを活用してSQL未経験者でもデータ分析業務に参画できる「AIネイティブ」な働き方改革に取り組んでいる事例を紹介。

DeNA Engineering·1月27日·★★★★

Anthropicの成長マーケティングチームがClaude Codeで広告作成時間を30分から30秒に短縮

Anthropicの成長マーケティングチームが、自社開発のAIツール「Claude Code」を使用して、広告作成にかかる時間を30分から30秒に大幅に短縮した。

Claude Blog·1月26日

マルチエージェントシステムの構築:使用するタイミングと方法

OpenAIがマルチエージェントシステムの構築について解説し、複数のAIエージェントを連携させる適切なタイミングと実装方法を説明した。

Claude Blog·1月23日·★★★★

DeNA × AI Talks #4 開催! - LLMを組み込んだプロダクト開発の実践的知見を公開!

DeNAが主催するAIトークイベント第4回の開催報告。LLMを製品開発に組み込む実践的な知見が共有された。

DeNA Engineering·1月23日

LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論

AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。

The Batch·1月9日

尊厳あるPython:LLMエージェントを改善する10のルール

現代のLLMは原則ではなくパターンを生成する。尊厳あるPythonはエージェントに意図を与え、コードを明示的で一貫性があり注意深く設計されるようにする。

Dagster Blog·1月9日

動的コンテキスト発見

OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。

Cursor Blog·1月6日

実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化

LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。

LayerX Tech Blog·12月19日

Windsurf バージョン 1.12.44 のパッチと改善点

開発者チームは、Windsurf の新バージョン 1.12.44 をリリースし、プロンプトが長すぎるエラーの発生頻度を減らし、MCP OAuth 設定でスコープ未指定時に全サポート範囲を要求する機能を追加した。

Windsurf Changelog·12月12日

プロンプションズ、動的UIコントロールでAIプロンプトの精度を向上させる

開発チームは「Promotions」UIフレームワークを公開し、ユーザーがAI応答を動的に制御できるインターフェースを提供する。これにより顧客支援や教育などでプロンプト試行錯誤を削減できる。

Microsoft Research·12月11日·★★★★

Windsurf 1.12.41 の新機能:プロンプト管理と MCP サーバー対応の強化

AI エディタ「Windsurf」がバージョン 1.12.41 をリリースし、ユーザープロンプトのログ記録やポリシー違反ブロックを可能にする「Cascade Hooks」機能を追加した。また、GitLab や GitHub のリモート MCP サーバーサポートを強化し、認証問題の修正も行った。

Windsurf Changelog·12月10日

LLMを活用したAmazon商品リストの改善

Amazonが大規模言語モデル(LLM)を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。

Amazon Science·11月29日·★★★★

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

エージェントによるエージェントのための効果的なツール作成

エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。

Anthropic Engineering·9月11日·★★★★

LLMでJSON出力する際に気をつけていること3選

Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。

Algomatic Tech Blog·5月8日

文脈に応じた検索機能の導入

OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。

Anthropic Engineering·9月19日·★★★★

プロンプトを隠すな、見せろ

LLM出力の改善を目指すライブラリ群は、ユーザーがプロンプト作成から遠ざかるよう促す傾向がある。DSPyなどのツールは、この「プロンプトの仲介排除」を新たなパラダイムとして提示している。

Hamel Husain·2月14日·★★★★

日本語LLMの評価におけるプロンプトバージョンごとの得意不得意の調査

著者がlm-evaluation-harnessとJGLUEデータセットを使用し、FintanPromptやAlpacaPromptなど複数のプロンプトバージョンによる日本語LLMの評価結果を比較し、各プロンプトの特性を分析した。

HEROZ Tech Blog·1月19日

PromptIDEの発表

プロンプトエンジニアリングと解釈可能性研究のための統合開発環境を発表。

xAI News·11月6日·★★★★

Code Llamaのプロンプト方法

Code Llamaのプロンプト構造、バリエーション、機能(指示、コード補完、中間補完)について解説するガイドです。

Ollama Blog·9月9日

記事中のノイズ削除方式 - ChatGPTとの比較

ストックマーク社が自社製品で実装している記事中のノイズ削除技術を、ChatGPT Plus(GPT-4)と比較検証している。プロダクトへの組み込み可能性を探る実践的な比較記事である。

Stockmark Tech Blog·5月8日

プロンプトエンジニアリング

プロンプトエンジニアリングは、モデルの重み更新なしでLLMの出力を制御する手法である。これは経験的な科学であり、モデルごとに効果が変わるため、多くの実験とヒューリスティックなアプローチが必要となる。

Lilian Weng·3月15日·★★★★

AI画像生成で古いコンピューターグラフィックスを再構築

AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。

Jay Alammar·1月1日

Cohereによる大規模言語モデルの実世界への応用

CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。

Jay Alammar·3月7日