#プロンプトエンジニアリング のAIニュース

87件の記事

スキル評価

LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。

LangChain Blog·3月6日

AI翻訳の3つの進化段階:プロンプト時代→推論モデル時代→エージェント時代

著者がAI翻訳ツール開発で経験した3段階の進化を解説。プロンプト設計から推論モデル活用、自律的エージェントへの発展過程と、翻訳品質向上のための設計原則を共有。

宝玉的分享·3月5日

Claude.comのメモリエクスポート機能に関する引用

ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。

Simon Willison Blog·3月1日

できることを蓄積せよ

著者Simon Willison氏が、コーディングエージェントを生産的に活用するためのヒントとして「できることを蓄積する」重要性を述べている。これは、ソフトウェア構築において何が可能か不可能かを理解し、実現方法の見通しを持つことが重要であるという従来からのキャリアアドバイスを拡張したものだ。

Simon Willison Blog·2月27日

エージェントの挙動は本番環境で初めてわかる

AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。

LangChain Blog·2月26日·★★★★

エンジニアリングの制御:『エージェントファースト』の世界でCodexを活用する

OpenAIチームが、Codexエージェントを使用して100万行のコード製品をゼロから構築した経験を共有した。3人のエンジニアが1500のプルリクエストを処理し、完成時間は手動コーディングの10分の1だった。

宝玉的分享·2月26日·★★★★

プロンプトから環境生成の研究

Google DeepMindの研究チームがプロンプトからナビゲーション可能な環境を生成する技術を発表

X: Google DeepMind·2月26日·★★★★

アドビの新Firefly「Quick Cut」ツール、テキストプロンプトから生映像をラフ編集に変換

アドビのFireflyが新機能「Quick Cut」を追加。テキストプロンプトから生映像を自動でラフ編集できるようになり、映像編集の効率化が期待される。

The Decoder·2月26日·★★★★

OpenClaw開発者がAI構築者にアドバイス:より遊び心を持ち、改善の時間を確保せよ

Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。

TechCrunch AI·2月26日

Adobe Fireflyの動画エディターが映像から自動で初稿を作成可能に

Adobe Fireflyの新機能「Quick Cut」は、AIがユーザーの指示に基づき映像を編集し、最終動画の初稿を自動生成します。

TechCrunch AI·2月25日·★★★★

最初にテストを実行せよ

コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。

Andrej Karpathy 厳選·2月24日

赤/緑TDD

コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。

Andrej Karpathy 厳選·2月23日

Claude Codeのプロンプトキャッシュ性能影響

Claude Codeの性能にプロンプトキャッシュが大きく影響する発見について

X: elvis·2月20日

Notion CEO:エージェントが使えない製品に未来はない

Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。

宝玉的分享·2月19日·★★★★

プロンプトだけでは平凡なAIライティングは救えない

AIライティングの品質向上には、プロンプトよりも素材の質・モデルの性能・レビュー能力の3要素が重要である。

宝玉的分享·2月19日

Geminiで創造的なプロンプトをインタラクティブなXR体験に変える

Android XRチームはGeminiのCanvas機能を活用し、没入型拡張現実(XR)体験の作成を簡素化しています。

Google Developers AI·2月19日·★★★★

Claude CodeのHook + Skillで、コミット後の変更を自動的にコミットする方法

Claude CodeのStop Hookで未コミットの変更を検知し、カスタムCommit Skillで自動的にグループコミットを行うことで、手動コミットを不要にする方法を紹介。

宝玉的分享·2月18日

SQL未経験でも即戦力に?アナリスト組織が挑む「AIネイティブ」な働き方改革

DeNAのアナリティクスチームが、AIツールを活用してSQL未経験者でもデータ分析業務に参画できる「AIネイティブ」な働き方改革に取り組んでいる事例を紹介。

DeNA Engineering·1月27日·★★★★

Anthropicの成長マーケティングチームがClaude Codeで広告作成時間を30分から30秒に短縮

Anthropicの成長マーケティングチームが、自社開発のAIツール「Claude Code」を使用して、広告作成にかかる時間を30分から30秒に大幅に短縮した。

Claude Blog·1月26日

DeNA × AI Talks #4 開催! - LLMを組み込んだプロダクト開発の実践的知見を公開!

DeNAが主催するAIトークイベント第4回の開催報告。LLMを製品開発に組み込む実践的な知見が共有された。

DeNA Engineering·1月23日

LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論

AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。

The Batch·1月9日

尊厳あるPython:LLMエージェントを改善する10のルール

現代のLLMは原則ではなくパターンを生成する。尊厳あるPythonはエージェントに意図を与え、コードを明示的で一貫性があり注意深く設計されるようにする。

Dagster Blog·1月9日

動的コンテキスト発見

OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。

Cursor Blog·1月6日

実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化

LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。

LayerX Tech Blog·12月19日

Windsurf 1.12.44

Windsurfがバージョン1.12.44をリリースし、「プロンプトが長すぎる」エラーの発生を減らし、MCP OAuth設定でスコープが指定されていない場合にすべてのサポート対象スコープを要求する機能を改善した。

Windsurf Changelog·12月12日

プロンプションズ、動的UIコントロールでAIプロンプトの精度を向上させる

開発チームは「Promotions」UIフレームワークを公開し、ユーザーがAI応答を動的に制御できるインターフェースを提供する。これにより顧客支援や教育などでプロンプト試行錯誤を削減できる。

Microsoft Research·12月11日·★★★★

Windsurf 1.12.41

Windsurfがユーザープロンプトのカスケードフック機能を追加し、GitLabリモートMCPのサポートやGitHub MCPのOAuth対応などMCP機能を拡張した。

Windsurf Changelog·12月10日

LLMを活用したAmazon商品リストの改善

Amazonが大規模言語モデル(LLM)を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。

Amazon Science·11月29日·★★★★

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

エージェントによるエージェントのための効果的なツール作成

エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。

Anthropic Engineering·9月11日·★★★★

LLMでJSON出力する際に気をつけていること3選

Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。

Algomatic Tech Blog·5月8日

文脈に応じた検索機能の導入

OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。

Anthropic Engineering·9月19日·★★★★

日本語LLMの評価におけるプロンプトバージョンごとの得意不得意の調査

著者がlm-evaluation-harnessとJGLUEデータセットを使用し、FintanPromptやAlpacaPromptなど複数のプロンプトバージョンによる日本語LLMの評価結果を比較し、各プロンプトの特性を分析した。

HEROZ Tech Blog·1月19日

PromptIDEの発表

プロンプトエンジニアリングと解釈可能性研究のための統合開発環境を発表。

xAI News·11月6日·★★★★

Code Llamaのプロンプト方法

Code Llamaのプロンプト構造、バリエーション、機能(指示、コード補完、中間補完)について解説するガイドです。

Ollama Blog·9月9日

AI画像生成で古いコンピューターグラフィックスを再構築

AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。

Jay Alammar·1月1日

Cohereによる大規模言語モデルの実世界への応用

CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。

Jay Alammar·3月7日