#aws のAIニュース

79件の記事

AWS上での分散推論の導入:llm-dを活用

llm-dチームは、エージェントAIワークフローにおける推論プロセスの課題を解決するため、AWS上で分散推論を導入した。これにより、複雑な推論チェーンによる計算負荷の増大と可変需要に対応し、ユーザー体験の向上を目指す。

AWS Machine Learning Blog·3月17日·★★★★

P-EAGLE: vLLMにおける並列投機的デコーディングによる高速なLLM推論

研究者らは、大規模言語モデル推論のための並列投機的デコーディング手法P-EAGLEを開発した。従来のEAGLE手法の逐次処理のボトルネックを解消し、複数のドラフトトークンを単一のフォワードパスで生成することで、推論速度を最大1.8倍向上させた。

AWS Machine Learning Blog·3月14日·★★★★

Amazon Bedrockの推論ワークロード向け新CloudWatchメトリクスでTTFTと推定クォータ消費量の可視性を向上

AWSはAmazon BedrockでTTFT(初回トークン時間)と推定クォータ消費量のCloudWatchメトリクスを追加し、生成AIワークロードの推論パフォーマンスとリソース消費の可視性を向上させた。

AWS Machine Learning Blog·3月13日

AWS、実験的AIエージェントプロジェクト向けにStrands Labsを立ち上げ

Amazon Web Servicesが、エージェントベースのAI開発に関連する実験的プロジェクトをホストするために、新しいGitHub組織「Strands Labs」を導入した。

InfoQ·3月12日

エージェント的AIの実用化 第1部:関係者向けガイド

著者は、エージェント的AIが単なる機能ではなく、仕事の定義や意思決定方法の変革であると指摘し、企業が実プロセスやガバナンスで直面する課題を説明している。

AWS Machine Learning Blog·3月12日·★★★★

カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ

OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。

AWS Machine Learning Blog·3月11日

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

AWSがEC2インスタンスでネスト型仮想化を導入

AWSは、KVMまたはHyper-Vを実行する仮想化EC2インスタンス内でネスト型仮想マシンをサポートすることを発表した。この新機能により、C8i、M8i、R8iインスタンス上でのアプリケーションエミュレーションやハードウェアシミュレーションなどのユースケースが可能になる。

InfoQ·3月7日

AWSが医療分野向けに新AIエージェントプラットフォームを立ち上げ

AWSがAmazon Connect Healthを発表した。このAIエージェントプラットフォームは、患者の予約管理、文書作成、患者確認を支援する。

TechCrunch AI·3月6日

エンタープライズアプリケーションにAmazon Quick Suiteチャットエージェントを組み込む

Amazon Quick Suiteは、企業がCRMやサポートコンソールなどの業務ツール内に、セキュアな埋め込みチャット機能を迅速に実装できるサービスを提供する。これにより、ユーザーは別ツールへの移動なしにAI対話を利用できる。

AWS Machine Learning Blog·3月5日

Amazon Nova基盤モデルで強力なコールセンター分析を実現

Amazonは、コールセンターの分析と運用の質・効率を向上させるために、生成AIを活用した基盤モデル「Nova」を提供する。これにより、顧客サポート担当者や管理者は、より微妙な洞察を得て、コールセンターデータの活用方法を再定義できる。

AWS Machine Learning Blog·3月5日·★★★★

リコーがAWS上で構築したスケーラブルなインテリジェント文書処理ソリューション

リコーのジェレミー・ジェイコブソンとラド・フレックが、生成AI、サーバーレスアーキテクチャ、標準化フレームワークを組み合わせて文書処理のスケーリング制限を克服する方法を説明している。リコーはAWS GenAI IDPアクセラレーターを使用して反復可能で再利用可能なフレームワークを構築した。

AWS Machine Learning Blog·3月5日·★★★★

AIエージェントキャッチアップ #68 - AI-DLCを開催

ジェネラティブエージェンツの大嶋氏が、AWSが公開したソフトウェア開発ワークフロー「AI-DLC(AI-Driven Development Life Cycle)」をテーマに勉強会を開催した。

Generative Agents·3月3日

OpenAIが1100億ドルの資金調達を発表、AWSとの提携を拡大

OpenAIが1100億ドルの資金調達を実施し、AWSとの提携を拡大した。この取引はAI投資が急増する中で史上最大級の民間資金調達ラウンドの一つである。

AI Business·3月3日·★★★★

OpenAIとAmazonが戦略的パートナーシップを発表

OpenAIとAmazonは戦略的パートナーシップを締結し、OpenAIのFrontierプラットフォームをAWSに導入し、AIインフラ・カスタムモデル・企業向けAIエージェントを拡充する。

OpenAI News·2月27日·★★★★

知性はパラメータ数ではなく時間についてである

AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。

Amazon Science·2月25日·★★★★

AWS、動画エンコードサービスの特許侵害保護を撤廃

AWSが動画トランスコーディング・ストリーミングサービスの法的保護を撤廃。顧客が特許侵害訴訟のリスクに直面する可能性。

InfoQ·2月25日·★★★★

HexagonがAmazon SageMaker HyperPodでAIモデル生産を加速

HexagonはAWSと協力し、Amazon SageMaker HyperPodのトレーニング基盤を活用して最先端のセグメンテーションモデルを事前学習し、AIモデル生産を拡大しました。

AWS Machine Learning Blog·2月24日·★★★★

Amazon Quick AgentsがModel Context Protocol (MCP)で外部ツールを統合

Amazon QuickがModel Context Protocol (MCP)をサポートし、ユーザーが独自のMCPサーバーをホストしてアプリケーション機能をツールとして公開できる。Amazon QuickはMCPクライアントとして機能し、アクション実行、データアクセス、AIエージェント統合を可能にする。

AWS Machine Learning Blog·2月21日·★★★★

Union.aiとFlyteでAmazon EKS上にAIワークフローを構築

Union.aiとFlyteは、AI/MLワークフローの複雑化に対応するため、Amazon EKS上でのモデル展開を効率化するソリューションを提供している。これにより、データサイエンティストやエンジニアは、パイロット段階から本番環境への移行を容易に実現できる。

AWS Machine Learning Blog·2月20日

Amazon QuickがSnowflakeデータソースへのキーペア認証をサポート

Amazon Quickは、Snowflakeデータソースへの接続にキーペア認証をサポートした。これにより、パスワード認証のセキュリティ脆弱性や運用負荷を解消し、Snowflakeのユーザー名・パスワード非推奨化に対応する。

AWS Machine Learning Blog·2月20日·★★★★

NFL次世代統計の10年間の革新

NFL試合では選手の動きをRFIDで追跡し、AWS上の機械学習モデルで瞬時に分析。スポーツをデータ駆動型に変革。

Amazon Science·2月2日·★★★★

AWSマルチアカウント環境からのGoogle Cloudフェデレーション設計 ― AI時代に対応した社内認証基盤の構築

AI活用や業務自動化が進む中、AWSとGoogle Workspace/GCPを跨いだ安全なアクセスを実現するためのフェデレーション認証基盤の設計について述べている。

LayerX Tech Blog·1月30日

強化学習によるマルチターンAIエージェントのカスタマイズ

既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。

Amazon Science·1月14日·★★★★

AIネイティブ6G:ネットワークからインテリジェンス・ファブリックへ

研究者が、AIネイティブ6Gネットワークの構想を提案している。ネットワーク言語モデルが、知能化されたコンポーネント、計算インフラ、アクセスポイント、データセンターなどの複雑な相互作用を調整する。

Amazon Science·12月2日·★★★★

Amazon Research Award受賞者63名が発表される

Amazonが、8カ国41大学の研究者63名をAmazon Research Award受賞者として発表し、受賞者はAmazonの公開データセットとAWSのAI/MLサービス・ツールにアクセスできる。

Amazon Science·11月26日

大規模AWS障害の原因は何か?

Gergely氏が、Signal、Slack、Zoomなどのサービス停止を引き起こしたAWS大規模障害の原因について、エンジニア視点で分析している。

Pragmatic Engineer·10月24日·★★★★

AWS RDS Aurora Serverless v1からv2への移行手順メモ

バックエンドエンジニアのわいけい氏が、AWS RDS Aurora Serverless v1からv2へのアップグレード手順を業務で実施した経験を共有している。v1のサポート終了に伴う移行作業で、サービス影響を考慮した慎重な対応が必要だった。

Spiral.AI Tech Blog·2月2日

Apache Airflow (MWAA) から EKS の Pod を起動・停止して AWS コストを削減する

みらい翻訳のプラットフォーム開発部 SRE チームが、Amazon Managed Workflows for Apache Airflow (MWAA) から EKS の Pod を起動・停止する仕組みを導入し、開発環境の不要な稼働を抑制して AWS コスト削減を実現した。

Mirai Translate Tech Blog·12月26日