#プロンプトエンジニアリング のAIニュース
87件の記事
スキル評価
LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。
AI翻訳の3つの進化段階:プロンプト時代→推論モデル時代→エージェント時代
著者がAI翻訳ツール開発で経験した3段階の進化を解説。プロンプト設計から推論モデル活用、自律的エージェントへの発展過程と、翻訳品質向上のための設計原則を共有。
Claude.comのメモリエクスポート機能に関する引用
ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。
できることを蓄積せよ
著者Simon Willison氏が、コーディングエージェントを生産的に活用するためのヒントとして「できることを蓄積する」重要性を述べている。これは、ソフトウェア構築において何が可能か不可能かを理解し、実現方法の見通しを持つことが重要であるという従来からのキャリアアドバイスを拡張したものだ。
エージェントの挙動は本番環境で初めてわかる
AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。
エンジニアリングの制御:『エージェントファースト』の世界でCodexを活用する
OpenAIチームが、Codexエージェントを使用して100万行のコード製品をゼロから構築した経験を共有した。3人のエンジニアが1500のプルリクエストを処理し、完成時間は手動コーディングの10分の1だった。
プロンプトから環境生成の研究
Google DeepMindの研究チームがプロンプトからナビゲーション可能な環境を生成する技術を発表
アドビの新Firefly「Quick Cut」ツール、テキストプロンプトから生映像をラフ編集に変換
アドビのFireflyが新機能「Quick Cut」を追加。テキストプロンプトから生映像を自動でラフ編集できるようになり、映像編集の効率化が期待される。
OpenClaw開発者がAI構築者にアドバイス:より遊び心を持ち、改善の時間を確保せよ
Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。
Adobe Fireflyの動画エディターが映像から自動で初稿を作成可能に
Adobe Fireflyの新機能「Quick Cut」は、AIがユーザーの指示に基づき映像を編集し、最終動画の初稿を自動生成します。
最初にテストを実行せよ
コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。
赤/緑TDD
コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。
Claude Codeのプロンプトキャッシュ性能影響
Claude Codeの性能にプロンプトキャッシュが大きく影響する発見について
Notion CEO:エージェントが使えない製品に未来はない
Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。
プロンプトだけでは平凡なAIライティングは救えない
AIライティングの品質向上には、プロンプトよりも素材の質・モデルの性能・レビュー能力の3要素が重要である。
Geminiで創造的なプロンプトをインタラクティブなXR体験に変える
Android XRチームはGeminiのCanvas機能を活用し、没入型拡張現実(XR)体験の作成を簡素化しています。
Claude CodeのHook + Skillで、コミット後の変更を自動的にコミットする方法
Claude CodeのStop Hookで未コミットの変更を検知し、カスタムCommit Skillで自動的にグループコミットを行うことで、手動コミットを不要にする方法を紹介。
SQL未経験でも即戦力に?アナリスト組織が挑む「AIネイティブ」な働き方改革
DeNAのアナリティクスチームが、AIツールを活用してSQL未経験者でもデータ分析業務に参画できる「AIネイティブ」な働き方改革に取り組んでいる事例を紹介。
Anthropicの成長マーケティングチームがClaude Codeで広告作成時間を30分から30秒に短縮
Anthropicの成長マーケティングチームが、自社開発のAIツール「Claude Code」を使用して、広告作成にかかる時間を30分から30秒に大幅に短縮した。
DeNA × AI Talks #4 開催! - LLMを組み込んだプロダクト開発の実践的知見を公開!
DeNAが主催するAIトークイベント第4回の開催報告。LLMを製品開発に組み込む実践的な知見が共有された。
LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論
AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。
尊厳あるPython:LLMエージェントを改善する10のルール
現代のLLMは原則ではなくパターンを生成する。尊厳あるPythonはエージェントに意図を与え、コードを明示的で一貫性があり注意深く設計されるようにする。
動的コンテキスト発見
OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。
実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化
LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。
Windsurf 1.12.44
Windsurfがバージョン1.12.44をリリースし、「プロンプトが長すぎる」エラーの発生を減らし、MCP OAuth設定でスコープが指定されていない場合にすべてのサポート対象スコープを要求する機能を改善した。
プロンプションズ、動的UIコントロールでAIプロンプトの精度を向上させる
開発チームは「Promotions」UIフレームワークを公開し、ユーザーがAI応答を動的に制御できるインターフェースを提供する。これにより顧客支援や教育などでプロンプト試行錯誤を削減できる。
Windsurf 1.12.41
Windsurfがユーザープロンプトのカスケードフック機能を追加し、GitLabリモートMCPのサポートやGitHub MCPのOAuth対応などMCP機能を拡張した。
LLMを活用したAmazon商品リストの改善
Amazonが大規模言語モデル(LLM)を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。
AIエージェントのための効果的なコンテキスト設計
AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
LLMでJSON出力する際に気をつけていること3選
Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。
日本語LLMの評価におけるプロンプトバージョンごとの得意不得意の調査
著者がlm-evaluation-harnessとJGLUEデータセットを使用し、FintanPromptやAlpacaPromptなど複数のプロンプトバージョンによる日本語LLMの評価結果を比較し、各プロンプトの特性を分析した。
PromptIDEの発表
プロンプトエンジニアリングと解釈可能性研究のための統合開発環境を発表。
Code Llamaのプロンプト方法
Code Llamaのプロンプト構造、バリエーション、機能(指示、コード補完、中間補完)について解説するガイドです。
AI画像生成で古いコンピューターグラフィックスを再構築
AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。
Cohereによる大規模言語モデルの実世界への応用
CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。