[AINews] Humanity's Last Gasp｜【AIニュース】人類の最後の息吹 | AIニュース最前線

Latent SpaceとAI Engineerの両方で繰り返し話題になっているトピックの一つは、皆がより多くの努力をしているように見える度合いです： （番組の友人である）Aaron Levie氏は、「現在、AIによって誰かの作業量が減っているわけではなく、シリコンバレーの人々と同様に、彼らのチームが過去で最も忙しいと感じている」と報告しています。 Tyler Cowen氏は経済学的な立場から、AIがあなたの価値を下げると信じていようとも上げると信じていようとも、今すぐはるかに多くの努力をするべきだと主張しています。 NotionのSimon Last氏は、今日のポッドキャストで、MLモデルのトレーニングをあきらめて以来初めてではないものの、睡眠不足と24時間365日の仕事に戻ったとコメントしており、今回はエージェント層のトークン不安が原因です。 「エージェントがより多くの作業を行っている」と同時に、「誰もがより多くの努力をしている」ことがどのように両立し得るのでしょうか？Claude Mythosが内部で2ヶ月間使用されているにもかかわらず、なぜClaudeの価値は下落し続けるのでしょうか？モデルラボとエージェントラボが過去最高に生産性が高いにもかかわらず、なぜ買収や企業買収が過去最多になっているのでしょうか？ 私たちが以前に行った簡単な思考実験は「七面鳥問題」です。これは、実際の証拠と豊富な歴史的データに基づき、七面鳥は人生が素晴らしいものであり、人類は自分が経験した限りにおいて肥えた七面鳥を作るために設定されていると結論付けるべきものです。七面鳥の悲観論者は、過剰な警告をする狂人として扱われ、無視されます。感謝祭の日まで。 ![image](https://substackcdn.com/image/fetch/$s_!MkCX!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbe710fc7-d4bc-4898-8998-0a28234eb8ad_1562x905.webp) このシナリオにおいて、エンジニア、あるいはより一般的にはすべての知識労働者は「七面鳥」なのでしょうか？私たちの仕事の「弾力性（elasticity）」や価値は、ある境界点に達するまで、私たちが「馬」になるまでにますます正の値を示すべきでしょうか？SWE-Benchが飽和状態に達し（SWE-Bench Proもまもなく）、Mythosが78%の達成率を示す中、GDPvalはGPT 5.4を経済の大部分において人間の専門家と同等以上（83%の確率）と評価しています。では、残っているものは何でしょうか？ Notionは「Notionの最終試験」に取り組んでいます。GregとFrancoisはARC-AGI-3を設定しました。私はコーディング評価の次のフロンティアに取り組んでいます。しかし、ハードウェアが運命であり、AGI（人工一般知能）が予測可能として20GWのスーパークラスターに過ぎない場合、それらはすべて無意味なものに見えるかもしれません… …あるいは、より価値のある問題は残っているのでしょうか？ 2026年4月3日〜4月4日のAIニュース。私たちは12のサブレッド、544件のTwitter投稿、およびさらにいくつかのDiscordサーバーを確認しました。AINewsのウェブサイトでは過去のすべての号を検索できます。 reminderとして、AINewsは現在Latent Spaceの一部です。メール配信頻度のオプトイン/オプトアウトが可能です！ AI Twitter レビュー トップツイート（エンゲージメント基準） GoogleのChrome「Skills」はプロンプトを再利用可能なブラウザワークフローに変換する：GoogleはChromeにSkillsを導入し、ユーザーがGeminiのプロンプトをワンクリックアクションとして保存できるようにした。これにより、現在のページや選択されたタブに対してアクションを実行できる。Googleはまた、既製のSkillsライブラリも提供しており、これは単なるプロンプトの履歴以上のものとなっている。これは実質的にブラウザ内での軽量なエンドユーザーエージェント化を意味する。 TencentのHYWorld 2.0は、世界モデルを動画モデルではなく編集可能な3Dシーンジェネレーターとして位置づけている：リリースに先立ち、@DylanTFWang氏はHYWorld 2.0を、単一の画像から編集可能な3Dシーンを生成するオープンソースかつエンジン対応の3D世界モデルとして予告した。 Google DeepMindはGemini Robotics-ER 1.6をリリースした：@GoogleDeepMindによって発表されたこの新モデルは、ロボティクスにおける視覚・空間推論を改善し、より安全な物理的推論を追加した。Gemini APIおよびAI Studioで利用可能である。続報では、計器の読み取り成功率が93%に達し、液体や重たい物体といった物理的制約への対応も向上していることが強調されている。 OpenAIはGPT-5.4-Cyberを用いてCyber分野のTrusted Accessを拡大した：OpenAIによると、GPT-5.4-CyberはGPT-5.4を防御的なセキュリティワークフロー向けにファインチューニングしたバージョンであり、Trusted Accessプログラムを通じて認証された上級レベルの防御担当者向けに提供されている。 Hugging FaceはHubに「Kernels」をリリースした：@ClementDelangue氏は、GPUカーネル用の新しいリポジトリタイプを発表した。これは、特定のGPU/PyTorch/OSの組み合わせに一致する事前コンパイル済みアーティファクトを含み、PyTorchのベースラインと比較して1.7倍から2.5倍の高速化を実現していると主張している。 CursorはNVIDIAとの共同開発によるマルチエージェントCUDA最適化システムを説明した。@cursor_aiによると、このマルチエージェント・ソフトウェアエンジニアリング・システムは3週間で235のCUDA問題に対して幾何平均で38%の高速化を実現しており、これはエージェントがアプリケーションの骨組み作成ではなくシステム最適化に応用される具体的な例である。 エージェント・インフラストラクチャ：Hermes、Deep Agents、そして本番環境向けハーネス Hermes Agentは、信頼性とメモリ管理を差別化要素とする、本格的なオープンローカルエージェントスタックへと成長している。複数の投稿で共通のテーマが指摘された：ユーザーは、長時間実行タスクに対する耐久性の高さから、他の代替案からHermes Agentへと移行している。このプロジェクトは@AntoineRSXによって、Web UI、モデル切替、iMessage/WeChat統合、バックアップ/リカバリ機能、そしてtmux経由のAndroidサポートを含む大規模なv0.9.0アップデートを提供した。また、Tencentはメッセージング統合を備えた常時稼働型クラウドホスティングのためのワンクリックLighthouseデプロイメントを強調した。メモリ管理の面では、@SteveSchoettlerによるhermes-lcm v0.2.0が、永続的なメッセージストレージ、DAG（有向非循環グラフ）サマリー、圧縮されたコンテキストを展開するツールなどを備えた損失なしのコンテキスト管理を追加した。@Teknium、@aiqiang888、およびその他のコミュニティ投稿は、Hermesの主要な利点は純粋なモデルの知能（IQ）よりも、運用上の安定性、拡張性、そしてデプロイ可能性にあることを裏付けている。 LangChainは、「ディープエージェント」を実運用可能なマルチテナント、非同期システムへと推進しています。deepagents 0.5リリースでは、非同期サブエージェント、マルチモーダルファイルのサポート、プロンプトキャッシングの改善が追加されました。関連する投稿では、deepagents deployが管理されたエージェントホスティングに対するオープンな代替手段であることを強調し、@LangChainと@sydneyrunkleによる、ユーザー/エージェント/組織にスコープを限定したメモリや、@LangChainと@sydneyrunkleによるカスタム認証およびユーザーごとのスレッド分離に関する今後の作業について言及しています。ここで興味深いパターンは、「エージェントのデモ」からプラットフォームに関する懸念事項、すなわちテナンシー、分離、長期タスク、SalesforceやAgent Protocolをサポートするサーバーなどの統合インターフェースへのシフトです。 ハarness設計が第一級のエンジニアリング課題となりつつあります。複数の投稿で、エージェントのパフォーマンスはモデルだけでなく、スケルトン（ハarness）にも少なくとも同等に依存すると主張されました。@Vtrivedy10は、イデオロギー（「薄型 vs 厚型」）よりもタスク固有のオープンハarnessを明確に支持し、@kmeanskaranは最先端モデルの追跡よりも、ワークフロー設計、メモリ切り替え、ツール出力制御を強調しました。これは、オープンウェイトモデルが多様化するにつれてますます必要となる、@ClementDelangueによるモデルから最適なコーディング/エージェントハarnessへのキュレーションされたマッピングの要請と一致しています。 ロボティクス、ワールドモデル、3D生成 Google の Gemini Robotics-ER 1.6 は、具現化された推論（embodied reasoning）における重要な製品化のステップです。@GoogleDeepMind からのリリースは、視覚・空間的理解、ツール使用、物理的制約の推論能力の向上を強調しています。後続の注記では、人間の傷害リスク検出が 10% 向上したこと、複雑なアナログ計器の読み取りに対応したことが明記され、API での利用が可能になりました。@_philschmid は、計器読み取りタスクにおいて 93% の成功率を強調しました。これはロボット工学の基盤モデル論文の発表というよりは、開発者向けの具現化された推論 API の提供のように感じられます。 ワールドモデルは、映画のようなデモから編集可能な空間的アーティファクトへと移行しています。Tencent の HYWorld 2.0 のティーザーは、出力を編集可能でエンジン準備が整った実際の 3D シーンとして位置づけることで、ビデオ生成システムとは明確に差別化されました。Web 側では、@sparkjsdev の Spark 2.0 が、モバイル、Web、VR にわたる WebGL2 で 1 億以上のスプラット（3D ガウス splats）の世界を対象としたストリーミング可能な LOD システムを提供しました。これらは、「AI 生成 3D」のスタックが、コンテンツ生成からインタラクティブなレンダリングや下流用途へと成熟しつつあることを示唆しています。 3D生成のオープン化は、トポロジー（topology）、UV展開（UVs）、リギング（rigging）、アニメーション対応の準備において進展しています。@DeemosTechは、トポロジーとUV生成のための自己回帰モデルであるSATOを導入し、@yanpei_caoは1枚の画像から3D形状、スケルトン（骨格）、スキニングウェイトを生成するAniGenを発表しました。これらが重要なのは、制作現場の3Dパイプラインにおけるボトルネックは「メッシュを生成できるか」ではなく、アセットがアニメーション化、テクスチャリング、編集のために十分な構造を持っているかどうかにあるからです。 モデル、ベンチマーク、および専門システム 続きを読む

【AIニュース】人類の最後の息吹

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト