#aws のAIニュース
79件の記事
AWS上での分散推論の導入:llm-dを活用
llm-dチームは、エージェントAIワークフローにおける推論プロセスの課題を解決するため、AWS上で分散推論を導入した。これにより、複雑な推論チェーンによる計算負荷の増大と可変需要に対応し、ユーザー体験の向上を目指す。
P-EAGLE: vLLMにおける並列投機的デコーディングによる高速なLLM推論
研究者らは、大規模言語モデル推論のための並列投機的デコーディング手法P-EAGLEを開発した。従来のEAGLE手法の逐次処理のボトルネックを解消し、複数のドラフトトークンを単一のフォワードパスで生成することで、推論速度を最大1.8倍向上させた。
Amazon Bedrockの推論ワークロード向け新CloudWatchメトリクスでTTFTと推定クォータ消費量の可視性を向上
AWSはAmazon BedrockでTTFT(初回トークン時間)と推定クォータ消費量のCloudWatchメトリクスを追加し、生成AIワークロードの推論パフォーマンスとリソース消費の可視性を向上させた。
AWS、実験的AIエージェントプロジェクト向けにStrands Labsを立ち上げ
Amazon Web Servicesが、エージェントベースのAI開発に関連する実験的プロジェクトをホストするために、新しいGitHub組織「Strands Labs」を導入した。
エージェント的AIの実用化 第1部:関係者向けガイド
著者は、エージェント的AIが単なる機能ではなく、仕事の定義や意思決定方法の変革であると指摘し、企業が実プロセスやガバナンスで直面する課題を説明している。
カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ
OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。
インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に
Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。
AWSがEC2インスタンスでネスト型仮想化を導入
AWSは、KVMまたはHyper-Vを実行する仮想化EC2インスタンス内でネスト型仮想マシンをサポートすることを発表した。この新機能により、C8i、M8i、R8iインスタンス上でのアプリケーションエミュレーションやハードウェアシミュレーションなどのユースケースが可能になる。
AWSが医療分野向けに新AIエージェントプラットフォームを立ち上げ
AWSがAmazon Connect Healthを発表した。このAIエージェントプラットフォームは、患者の予約管理、文書作成、患者確認を支援する。
エンタープライズアプリケーションにAmazon Quick Suiteチャットエージェントを組み込む
Amazon Quick Suiteは、企業がCRMやサポートコンソールなどの業務ツール内に、セキュアな埋め込みチャット機能を迅速に実装できるサービスを提供する。これにより、ユーザーは別ツールへの移動なしにAI対話を利用できる。
Amazon Nova基盤モデルで強力なコールセンター分析を実現
Amazonは、コールセンターの分析と運用の質・効率を向上させるために、生成AIを活用した基盤モデル「Nova」を提供する。これにより、顧客サポート担当者や管理者は、より微妙な洞察を得て、コールセンターデータの活用方法を再定義できる。
リコーがAWS上で構築したスケーラブルなインテリジェント文書処理ソリューション
リコーのジェレミー・ジェイコブソンとラド・フレックが、生成AI、サーバーレスアーキテクチャ、標準化フレームワークを組み合わせて文書処理のスケーリング制限を克服する方法を説明している。リコーはAWS GenAI IDPアクセラレーターを使用して反復可能で再利用可能なフレームワークを構築した。
AIエージェントキャッチアップ #68 - AI-DLCを開催
ジェネラティブエージェンツの大嶋氏が、AWSが公開したソフトウェア開発ワークフロー「AI-DLC(AI-Driven Development Life Cycle)」をテーマに勉強会を開催した。
OpenAIが1100億ドルの資金調達を発表、AWSとの提携を拡大
OpenAIが1100億ドルの資金調達を実施し、AWSとの提携を拡大した。この取引はAI投資が急増する中で史上最大級の民間資金調達ラウンドの一つである。
OpenAIとAmazonが戦略的パートナーシップを発表
OpenAIとAmazonは戦略的パートナーシップを締結し、OpenAIのFrontierプラットフォームをAWSに導入し、AIインフラ・カスタムモデル・企業向けAIエージェントを拡充する。
知性はパラメータ数ではなく時間についてである
AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。
AWS、動画エンコードサービスの特許侵害保護を撤廃
AWSが動画トランスコーディング・ストリーミングサービスの法的保護を撤廃。顧客が特許侵害訴訟のリスクに直面する可能性。
HexagonがAmazon SageMaker HyperPodでAIモデル生産を加速
HexagonはAWSと協力し、Amazon SageMaker HyperPodのトレーニング基盤を活用して最先端のセグメンテーションモデルを事前学習し、AIモデル生産を拡大しました。
Amazon Quick AgentsがModel Context Protocol (MCP)で外部ツールを統合
Amazon QuickがModel Context Protocol (MCP)をサポートし、ユーザーが独自のMCPサーバーをホストしてアプリケーション機能をツールとして公開できる。Amazon QuickはMCPクライアントとして機能し、アクション実行、データアクセス、AIエージェント統合を可能にする。
Union.aiとFlyteでAmazon EKS上にAIワークフローを構築
Union.aiとFlyteは、AI/MLワークフローの複雑化に対応するため、Amazon EKS上でのモデル展開を効率化するソリューションを提供している。これにより、データサイエンティストやエンジニアは、パイロット段階から本番環境への移行を容易に実現できる。
Amazon QuickがSnowflakeデータソースへのキーペア認証をサポート
Amazon Quickは、Snowflakeデータソースへの接続にキーペア認証をサポートした。これにより、パスワード認証のセキュリティ脆弱性や運用負荷を解消し、Snowflakeのユーザー名・パスワード非推奨化に対応する。
NFL次世代統計の10年間の革新
NFL試合では選手の動きをRFIDで追跡し、AWS上の機械学習モデルで瞬時に分析。スポーツをデータ駆動型に変革。
AWSマルチアカウント環境からのGoogle Cloudフェデレーション設計 ― AI時代に対応した社内認証基盤の構築
AI活用や業務自動化が進む中、AWSとGoogle Workspace/GCPを跨いだ安全なアクセスを実現するためのフェデレーション認証基盤の設計について述べている。
強化学習によるマルチターンAIエージェントのカスタマイズ
既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。
AIネイティブ6G:ネットワークからインテリジェンス・ファブリックへ
研究者が、AIネイティブ6Gネットワークの構想を提案している。ネットワーク言語モデルが、知能化されたコンポーネント、計算インフラ、アクセスポイント、データセンターなどの複雑な相互作用を調整する。
Amazon Research Award受賞者63名が発表される
Amazonが、8カ国41大学の研究者63名をAmazon Research Award受賞者として発表し、受賞者はAmazonの公開データセットとAWSのAI/MLサービス・ツールにアクセスできる。
大規模AWS障害の原因は何か?
Gergely氏が、Signal、Slack、Zoomなどのサービス停止を引き起こしたAWS大規模障害の原因について、エンジニア視点で分析している。
AWS RDS Aurora Serverless v1からv2への移行手順メモ
バックエンドエンジニアのわいけい氏が、AWS RDS Aurora Serverless v1からv2へのアップグレード手順を業務で実施した経験を共有している。v1のサポート終了に伴う移行作業で、サービス影響を考慮した慎重な対応が必要だった。
Apache Airflow (MWAA) から EKS の Pod を起動・停止して AWS コストを削減する
みらい翻訳のプラットフォーム開発部 SRE チームが、Amazon Managed Workflows for Apache Airflow (MWAA) から EKS の Pod を起動・停止する仕組みを導入し、開発環境の不要な稼働を抑制して AWS コスト削減を実現した。