#aws のAIニュース

79件の記事

AWS上での分散推論の導入：llm-dを活用

llm-dチームは、エージェントAIワークフローにおける推論プロセスの課題を解決するため、AWS上で分散推論を導入した。これにより、複雑な推論チェーンによる計算負荷の増大と可変需要に対応し、ユーザー体験の向上を目指す。

P-EAGLE: vLLMにおける並列投機的デコーディングによる高速なLLM推論

研究者らは、大規模言語モデル推論のための並列投機的デコーディング手法P-EAGLEを開発した。従来のEAGLE手法の逐次処理のボトルネックを解消し、複数のドラフトトークンを単一のフォワードパスで生成することで、推論速度を最大1.8倍向上させた。

AWS Machine Learning Blog·3月14日·★★★★

Amazon Bedrockの推論ワークロード向け新CloudWatchメトリクスでTTFTと推定クォータ消費量の可視性を向上

AWSはAmazon BedrockでTTFT（初回トークン時間）と推定クォータ消費量のCloudWatchメトリクスを追加し、生成AIワークロードの推論パフォーマンスとリソース消費の可視性を向上させた。

AWS Machine Learning Blog·3月13日

AWS、実験的AIエージェントプロジェクト向けにStrands Labsを立ち上げ

Amazon Web Servicesが、エージェントベースのAI開発に関連する実験的プロジェクトをホストするために、新しいGitHub組織「Strands Labs」を導入した。

InfoQ·3月12日

エージェント的AIの実用化第1部：関係者向けガイド

著者は、エージェント的AIが単なる機能ではなく、仕事の定義や意思決定方法の変革であると指摘し、企業が実プロセスやガバナンスで直面する課題を説明している。

AWS Machine Learning Blog·3月12日·★★★★

カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ

OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。

AWS Machine Learning Blog·3月11日

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

AWSがEC2インスタンスでネスト型仮想化を導入

AWSは、KVMまたはHyper-Vを実行する仮想化EC2インスタンス内でネスト型仮想マシンをサポートすることを発表した。この新機能により、C8i、M8i、R8iインスタンス上でのアプリケーションエミュレーションやハードウェアシミュレーションなどのユースケースが可能になる。

InfoQ·3月7日

AWSが医療分野向けに新AIエージェントプラットフォームを立ち上げ

AWSがAmazon Connect Healthを発表した。このAIエージェントプラットフォームは、患者の予約管理、文書作成、患者確認を支援する。

TechCrunch AI·3月6日

エンタープライズアプリケーションにAmazon Quick Suiteチャットエージェントを組み込む

Amazon Quick Suiteは、企業がCRMやサポートコンソールなどの業務ツール内に、セキュアな埋め込みチャット機能を迅速に実装できるサービスを提供する。これにより、ユーザーは別ツールへの移動なしにAI対話を利用できる。

AWS Machine Learning Blog·3月5日

Amazon Nova基盤モデルで強力なコールセンター分析を実現

Amazonは、コールセンターの分析と運用の質・効率を向上させるために、生成AIを活用した基盤モデル「Nova」を提供する。これにより、顧客サポート担当者や管理者は、より微妙な洞察を得て、コールセンターデータの活用方法を再定義できる。

AWS Machine Learning Blog·3月5日·★★★★

リコーがAWS上で構築したスケーラブルなインテリジェント文書処理ソリューション

リコーのジェレミー・ジェイコブソンとラド・フレックが、生成AI、サーバーレスアーキテクチャ、標準化フレームワークを組み合わせて文書処理のスケーリング制限を克服する方法を説明している。リコーはAWS GenAI IDPアクセラレーターを使用して反復可能で再利用可能なフレームワークを構築した。

AWS Machine Learning Blog·3月5日·★★★★

AIエージェントキャッチアップ #68 - AI-DLCを開催

ジェネラティブエージェンツの大嶋氏が、AWSが公開したソフトウェア開発ワークフロー「AI-DLC（AI-Driven Development Life Cycle）」をテーマに勉強会を開催した。

Generative Agents·3月3日

OpenAIが1100億ドルの資金調達を発表、AWSとの提携を拡大

OpenAIが1100億ドルの資金調達を実施し、AWSとの提携を拡大した。この取引はAI投資が急増する中で史上最大級の民間資金調達ラウンドの一つである。

AI Business·3月3日·★★★★

OpenAIとAmazonが戦略的パートナーシップを発表

OpenAIとAmazonは戦略的パートナーシップを締結し、OpenAIのFrontierプラットフォームをAWSに導入し、AIインフラ・カスタムモデル・企業向けAIエージェントを拡充する。

OpenAI News·2月27日·★★★★

知性はパラメータ数ではなく時間についてである

AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。

Amazon Science·2月25日·★★★★

AWS、動画エンコードサービスの特許侵害保護を撤廃

AWSが動画トランスコーディング・ストリーミングサービスの法的保護を撤廃。顧客が特許侵害訴訟のリスクに直面する可能性。

InfoQ·2月25日·★★★★

HexagonがAmazon SageMaker HyperPodでAIモデル生産を加速

HexagonはAWSと協力し、Amazon SageMaker HyperPodのトレーニング基盤を活用して最先端のセグメンテーションモデルを事前学習し、AIモデル生産を拡大しました。

AWS Machine Learning Blog·2月24日·★★★★

Amazon Quick AgentsがModel Context Protocol (MCP)で外部ツールを統合

Amazon QuickがModel Context Protocol (MCP)をサポートし、ユーザーが独自のMCPサーバーをホストしてアプリケーション機能をツールとして公開できる。Amazon QuickはMCPクライアントとして機能し、アクション実行、データアクセス、AIエージェント統合を可能にする。

AWS Machine Learning Blog·2月21日·★★★★