Midjourney Medical:体重計に乗るように臓器をスキャン
画像生成 AI の大手である Midjourney が、放射線・磁石を使用しない新型医療スキャナー「Midjourney Scanner」を発表し、業界に大きな衝撃と議論を呼んだ。
キーポイント
画期的な新技術の発表
Midjourney が放射線・磁石フリーで高速かつ低コストな医療スキャナーを開発し、技術詳細を公開した。
トレードオフと現状の制約
水没タンク内での撮影が必要であり、現時点では CT や MRI に比べて解像度が粗いという課題がある。
業界からの反応
実機デモへの参加報告や「他の AI ラボももっと挑戦すべき」という称賛の声が上がる一方、技術的実現性への議論も活発だ。
影響分析・編集コメントを表示
影響分析
この発表は、AI ラボがソフトウェアの枠を超えて物理的ハードウェアや医療インフラへ直接参入する新たな潮流を示す象徴的な出来事です。特に Midjourney のような非医療系企業が医療機器開発に着手することは、業界の境界を曖昧にし、既存の医療テック企業に対する競争圧力と技術的イノベーションの加速を促す可能性があります。
編集コメント
画像生成 AI の最大手である Midjourney が医療機器開発に参入したことは、業界の常識を覆す出来事であり、AI ラボの多角化戦略が物理世界へ急速に進出していることを如実に示しています。
静かな一日。
2026年6月16日〜17日のAIニュース。私たちは12のサブレッド、544 の Twitter を確認し、Discord についてはさらに調査していませんでした。AINews のウェブサイトでは過去のすべての号を検索できます。念のためお知らせしますが、AINews は現在 Latent Space のセクションの一部となっています。メールの頻度を選択的に設定(購読または解除)することができます!
AI Twitter リキャップ
トップストーリー:Midjourney Medical**
何が起きたか
Midjourney が医療画像診断・スキャンシステムを発表し、その技術的な詳細を公開しました。これにより、AI ラボがハードウェアや医療機器分野へ進出することに対する興味、懐疑、そしてより広範な議論が巻き起こりました。
- Midjourney の公式アカウントは、主要な発表ツイートで「新しい『Midjourney Scanner』の技術的深掘り」を投稿しました。これはプロジェクト @midjourney における核心的なローンチ資料であるようです。
- この発表に先立って、あるいは並行して、スキャナに関する議論が行われました。そのトレードオフは、「放射線なし、磁気なし、高速、低コスト」と要約されましたが、一方で「人が水没タンクの中で座る必要がある」ことと、「現時点では CT や MRI に比べて解像度が粗い」という点が指摘されています @iScienceLuvr。
- デモは実際に会場で体験可能だったようです。ある参加者は「今夜、@midjourney のデモスキャナに手を入れました」と述べており、これは純粋な概念的発表ではなく、具体的なプロトタイプとして捉えられています @saranormous。
- この発表は、Midjourney が通常とは異なり非常に野心的な製品方向性を示しているという証拠と捉えられた支持者たちから強い熱狂を生み出しました。そこには「これはあまりにも素晴らしい」「@DavidSHolz のような発明家たちに任せるべきだ」といったコメントや、「@saranormous」への言及が含まれていました。
- 他の人々は、この発表をより漸進的な AI ハードウェアの取り組みに対する競争と捉えました。ある反応では「退屈なラペルカメラ(lapel camera)への賭け」と対比させ、Midjourney がこのようなものを構築しているなら他の AI 研究所は「自分を叩くべきだ」と主張しました @matvelloso。
- また、イメージング手法に関心のある人々からは軽微な技術的なコメントもありました。これには検出器/エミッターの配置やリアルタイム版に関する推測 @johnowhitaker が含まれ、さらに一部のユーザーがこの発表トピックに対して異常に準備ができているように見えるというからかいも含まれていました @johnowhitaker。
事実と意見
ツイートセットに明示的に存在する事実に基づく主張
- Midjourney は「Midjourney Scanner」と呼ばれる製品に関する技術的な詳細を公開しました @midjourney。
- スキャナは以下のように説明されました:
放射線フリー(radiation-free)
磁石フリー(magnet-free)
高速
低コスト
水没タンク(water immersion tank)が必要
CT/MRI よりも解像度が粗い
@iScienceLuvr
- 1 人の人物が実際に手を介してデモスキャナを試しました @saranormous。
解釈・意見・推測
- 非常に肯定的な反応は、このスキャナを先見の明があるものや「未来」であると位置づけました @saranormous。
- ある観察者たちは、この発表が Midjourney が競合する AI 研究所よりもより野心的なハードウェアロードマップ(roadmap)を追っているという証拠だと捉えました @matvelloso。
- あるユーモアに富んだ返信がこのアイデアを「次はミッドジャーニーによる貨物全体の輸送」という方向へエスカレートさせましたが、これは明確に事実に基づく主張ではありません @yacinelearning。
- 独立した技術的なコメントでは、分散型で散在する検出器や送信機、あるいはリアルタイムシステムといった将来の設計方向の可能性が示唆されましたが、これらはミッドジャーニーの現在のスキャナの特徴として提示されたわけではありません @johnowhitaker。
技術的詳細と推測されるモダリティ
ツイート群には限られた数の具体的な仕様しか含まれていませんが、それだけでプロジェクトの位置づけを概観するには十分です。
- イオン化放射線の不使用:「放射線フリー」という表現は、このシステムが X 線や CT スタイルのイオン化モダリティを使用していないことを意味します @iScienceLuvr。
- 磁石の不使用:「マグネットフリー」という表現は、強力な磁場を必要とする MRI との違いを明確にしています @iScienceLuvr。
- 水没タンク:これは物理的なセンシング設定に関する重要な手がかりです。水による結合(カプリング)は、送信機・組織・検出器間の伝送と結合を改善するため、一部の音響および波伝播イメージングシステムで一般的に用いられています @iScienceLuvr。
- CT/MRI 以下の解像度:これらのツイートにおいて、このシステムが既存の臨床画像診断における解像度を上回ると主張されているわけではありません。むしろ、明確な制限事項として、解像度は CT や MRI よりも粗いものであるとされています @iScienceLuvr。
- 速度・コストにおける位置づけ:これは高速かつ低コストであると枠組み付けられており、その価値提案はおそらく最高峰の画像忠実度ではなく、アクセシビリティ、処理能力、あるいは携帯性にあると考えられます @iScienceLuvr。
技術的な観点からの反応として、おそらく生じるセンシングの課題についても言及されています:
- ジョン・ホイタカーは、光、超音波、電流などを基盤とするシステムは X 線よりも逆問題が困難であると指摘しています。なぜなら、信号が同じように直進しないため、再構成がより複雑になるからです @johnowhitaker。
- また、彼は将来的なバージョンとして、機械的に移動する部品ではなく、多数の散在した検出器と発振器を備えたものも提案しており、少なくとも一部の読者は現在のシステムに動きやスキャン幾何学が含まれていると推測している一方で、完全に並列化されたキャプチャではないと理解していると示唆しています @johnowhitaker。
これらを総合すると、公的な議論は、CT や MRI 以外のモダリティ、すなわち波に基づく再構成と意味のあるアルゴリズム的・逆問題の要素を有するものへと向かっているように見えます。ただし、ここで紹介されたツイートでは、述べられたトレードオフ以外に、決定打となるモダリティの分類や性能表は提供されていません。
異なる視点
支持派/楽観派
- 最も熱狂的な陣営は、これを AI 創業者が追求すべき、まさに高リターンで奇抜な非コンセンサス型の発明と捉えています。単なる漸進的なチャットボットや UI プロダクトではありません。このトーンは「@DavidSHolz のような発明家が発明できるようにしよう」@saranormous という発言に明確に表れています。
- 対面でのデモへの反応では、論文を読むだけや動画を見るのではなく、実際のスキャナとインタラクションすることの生々しい新奇さが強調されました @saranormous。
- この動きを、ミッドジャーニーが画像生成を超えてフルスタックの応用発明へと視野を広げている兆候と捉える声もあり、おそらくハードウェア、センシング、AI 再構成を組み合わせたものではないかと考えられています。
ネイティブ / 技術に好奇心を持つ層
- この反応セットの中で最も現実的なものは、放射線不要・磁石不要・高速・低コスト versus 水没が必要・CT/MRI より解像度が低いという簡潔な賛否要約です @iScienceLuvr。
- 技術的に好奇心を持つ観察者たちは、このモダリティの奇妙さを好む一方で、物理的およびシステム上のトレードオフを即座に指摘しました:
X 線と比較した直進性のない伝播
- より優れたリアルタイムキャプチャ配置の必要性
検出器/エミッタートポロジーに関する疑問
@johnowhitaker
反対 / 懐疑的 / 注意喚起
このツイートセットにおいて直接的な敵対的批判は限られていますが、懐疑性は複数の点に暗黙的に含まれています:
- 臨床的有用性への懐疑: CT/MRI より解像度が粗いという指摘は実質的な留保であり、特に画像の品質が診断価値に直接影響しうる医療分野では重要です @iScienceLuvr。
- 実用性への懐疑: 水没タンクを必要とすることは、日常的な臨床利用や消費者向け利用において深刻な人間工学上の制約および展開上の課題となります @iScienceLuvr。
- モダリティへの懐疑:直線伝播ではないという技術的なコメントは、代替イメージングシステムにおけるいつもの課題を示唆しています。すなわち、物理学と逆再構成が困難であり、魅力的なデモが自動的に堅牢で臨床的に信頼性の高いイメージングに転換するわけではないということです @johnowhitaker。
競争的枠組み
- 注目すべき見解の一つは、スキャナそのものよりも、それが戦略的に何を意味するかについてのものでした。もし Midjourney がハードウェア医療発明を試みているなら、より狭いウェアラブルカメラの概念を追求する AI 企業と比較すると保守的に見えるということです @matvelloso。
コンテキスト:なぜこれが重要なのか
Midjourney は主に画像生成会社として知られています。そのため、医療/スキャナの発表が注目される理由は複数あります:
- これは、生成メディアソフトウェアから現実世界のセンシングやハードウェアへと移行する意志を示唆しています。
- 医療イメージングは、逆問題、信号処理、再構成、そしてますます機械学習に基づく解釈がすべて重要となる領域です。明白な隣接分野ではありませんが、技術的に深い分野です。
- このスキャナは、「すべての軸で MRI や CT よりも優れている」として位置づけられているのではなく、古典的な破壊的イノベーションの領域への潜在的参入者として位置づけられています。つまり、プレミアム指標では劣るものの、コスト・アクセシビリティ・運用負担においては優れています。
- もしこのシステムが本当に高速かつ低コストであれば、最も妥当な影響は以下の分野に現れるでしょう:
スクリーニングまたはトリアージ、
CT や MRI へのアクセスが限られている環境、
放射線回避が重要な反復イメージング、
- 没入型セットアップが許容される、専門的な解剖学的用途ケース。
今回の発表は、AI に隣接する企業が単なるモデルベンダーではなく、物理世界への新たなインターフェースの構築者として自らを定義しようとする、2025 年全体の傾向にも合致しています。この枠組みにおいて、Midjourney Medical は単一のスキャナに関するものというよりも、フロンティア AI エラ期のスタートアップがコンテンツ生成だけでなく、困難なセンシングシステムを実用化できるかどうかという点にかかっています。
示唆と未解決の質問
- 規制への道筋:これらのツイートには承認や検証研究に関する記述はなく、これが研究専用なのか臨床展開を意図したものなのかも明言されていません。医療的関連性において、これらこそが中心的な問いです。
- 再構築スタック:「技術的な深掘り」という表現から、同社が内部構造について議論したことは示唆されますが、ここで提示されたツイート群は実際のアルゴリズムの詳細を明らかにしていません。おそらく核心となるのは、制約のあるセンシング設定下における再構築の品質です。
- 用途の特定性:CT や MRI に比べて解像度が低いとしても、システムが必ずしも破綻するわけではありません。多くの画像診断ツールは、特定のワークフローにおいて「十分である」ことで成功を収めます。しかし、これらのツイートには具体的なターゲット適応症は示されていません。
- フォームファクタの課題:水没タンクによるスキャンは、文脈によっては許容される一方で、他の場面では大きな障壁となります。これがプロトタイプ特有の artifact なのか、それとも根本的な要件なのかによって評価が分かれます。
- スループットとコストの現実性:「高速」や「低コスト」という表現は、スキャン時間、ハードウェアコスト、消耗品、オペレータの負担、そして下流の解釈にかかるオーバーヘッドといったベンチマークに対して相対的な意味を持つものであり、本件のツイートにはこれらの数値は提供されていません。
- AI の役割:最も興味深い技術的疑問点は、Midjourney の貢献が主にハードウェア設計、逆問題再構築、学習されたノイズ除去・超解像、自動解釈、あるいはこれらすべてを跨ぐ統合スタックのいずれにあるのかという点でしょう。社会的反応を見ると、Midjourney というブランドは古典的な医療機器ではなく学習型視覚システムと結びついているため、人々がこのプロジェクトに多くのことを投影していることが示唆されます。
AI 研究、エージェント、およびオープンモデル
- 注目すべき研究のメタポイントとして、過去 1 年間の中国語によるオープンソース文献は追跡する上で異常なほど高い ROI(投資対効果)を持つと強調され、「アルファ(先行利益)が信じられないほど巨大である」という主張が @himanshustwts 氏によってなされました。
- PapersWithCode のトップトレンド論文は VibeThinker-3B で、これは小規模言語モデル(LMs)における検証可能な推論を探求する 30 億パラメータのモデルであり、DeepSeek V3.2、GLM-5、Gemini 3 Pro と同程度の性能階層に到達しているとされています @NielsRogge。
- コンピュータ使用に関する論文 PreAct は、成功したエージェントの実行をガード付きで再生可能な状態機械に統合し、繰り返しにおけるステップごとの LM(言語モデル)呼び出しを排除することで、8.5 倍から 13 倍の高速な再生を実現した点が高く評価されました @dair_ai。
- もう一つの RL/エージェント論文では、LLM-as-Environment-Engineer が提案されており、ここでポリシーは自身の失敗を用いて次のトレーニング環境を再設計します。関連するベンチマークは MAPF-FrozenLake です @dair_ai。
- Omar Sar0 は、コーディング・エージェントには盲目的な自律ループではなく、検証機能と堅牢なガードレールが必要だと主張し、制約付きのアクティブ実行への傾向を強化しました @omarsar0。
- David Khourshid のコーディング・エージェントに関する見解はより実務的でした:AI 生成コードも依然として読まなければならず、それを読まないことは単にデバッグの負担を先送りするだけだと述べています @DavidKPiano。
- RL 理論については、John Schulman が PPO の LLM 時代における再浮上は、オリジナル論文で予測されていなかった効果によるものだと指摘しました。これには、数値誤差からのバイアスを修正する重要性比目的関数、非同期トレーニング、順伝播ノイズが含まれ、クリッピングは後に理解されたメカニズムを通じてエントロピーを変化させるとしています。彼は DAPO @johnschulman2 を引用しています。
- 関連して、Chris Wolfe は、最近の GRPO 後の分析論文(例:DAPO, Dr. GRPO, GSPO, TIS)は、推論/エージェント文脈における PPO についても彼が見たいと願うような目的関数分析のまさにその種のものであると述べています @cwolferesearch。
- John Carmack は、視覚表現学習のための Temporal Differences について詳細な批判を投稿し、この手法を要約しました:RGB フレーム差分を用いてフレームエンコーダーと「モーションエンコーダー」をトレーニングし、latent(frame1) + delta ≈ latent(frame2) を満たすようにします(ストライドは 0.25 秒)。彼は DINO の EMA によるアンチ・コラプス選択の妥当性と、デルタ構成の健全性に疑問を呈しています @ID_AA_Carmack。
AI インフラ、推論、および製品ローンチ
- Xenova は、現在閉鎖された Fable 5 の取り組みからデモとカーネルを公開し、WebGPU 上で Gemma 4 を 255 tok/s で実行可能にしたと主張しました。この発表の背景には、エージェント型カーネル最適化がブラウザやオンデバイスでの推論(inference)に実質的な改善をもたらす可能性があるという見方があります @xenovacom。
- Fal は Kling 3.0 Turbo と O3 のアップグレードを発表しました:
より高速な生成
- コストの削減
- より優れたリップシンク
- より安定したモーション
- "Omni"におけるプロンプトやリファレンスの一貫性の強化
- 最大 15 秒のクリップ
- Omni を使用したフル 4K 生成
- ストーリーボードおよびマルチショットワークフローの改善
@fal
- Kling の公式アカウントは、この Fal のローンチをクリエイター向けの品質と速度向上として拡散しました @Kling_ai。
- GitHub Copilot の Auto モードでは、推論の深さ、コードの複雑さ、デバッグの難易度、ツールオーケストレーションの必要性に基づいてモデルを選択するために、カスタムルーティングモデルが使用されるようになりました。ブログ記事と関連する研究論文が共有されました @pierceboggan, @pierceboggan。
- Kimi Code Web が一時的なエコシステムノートによると再びオンラインになったようです @bigeagle_xd。
- Grok の画像生成プロジェクトは grok.com/imagine を通じて言及されましたが、具体的な技術詳細はありませんでした @chaitu。
人材、研究所、および競争動態
- Midjourney 以外で最も注目すべき人事ニュース:Noam Shazeer は OpenAI への合流を発表し、困難な決断であったと述べた上で元チームを称賛しつつ Google を去りました @NoamShazeer。
- Sam Altman はこの動きを祝し、Noam は OpenAI の設立以来、彼が最も一緒に働きたいと思っていた人物の一人だと述べた @sama。さらに、OpenAI が「Noam において」SOTA(最先端)であると冗談めかして語った @sama。
解説では、Shazeer が Transformer、T5、Switch Transformer の共著者であり、スパース MoE システムの先駆者であるという重要性が強調され、一部からは
原文を表示
a quiet day.
AI News for 6/16/2026-6/17/2026. We checked 12 subreddits, 544 Twitters and no further Discords. AINews' website lets you search all past issues. As a reminder, AINews is now a section of Latent Space. You can opt in/out of email frequencies!
AI Twitter Recap
Top Story: Midjourney Medical
What happened
Midjourney unveiled a medical imaging/scanning system and then published a technical dive on it, triggering a mix of fascination, skepticism, and broader discussion about AI labs moving into hardware/medical devices.
- Midjourney’s official account posted “A technical dive inside our new ‘Midjourney Scanner’” in the main announcement tweet, which appears to be the core launch artifact for the project @midjourney.
- The launch was preceded or paralleled by discussion of a scanner whose tradeoffs were summarized as: radiation-free, magnet-free, fast, and low-cost, but requiring the person to sit in a water immersion tank and currently having coarser resolution than CT/MRI @iScienceLuvr.
- A demo appears to have been available in person: one attendee said, “I put my hand in the @midjourney demo scanner tonight”, framing it as a tangible prototype rather than a purely conceptual announcement @saranormous.
- The announcement generated strong enthusiasm from supporters who viewed it as evidence of unusually ambitious product direction from Midjourney, including comments like “this is so amazing” and “let inventors like @DavidSHolz invent” @saranormous.
- Others interpreted the launch competitively against more incremental AI hardware efforts; one reaction contrasted it with “boring lapel camera” bets and argued other AI labs should “slap yourself” if Midjourney is building this kind of thing @matvelloso.
- There was also lightweight technical commentary from people interested in imaging methods, including speculation about detector/emitter arrangements and real-time variants @johnowhitaker, plus teasing that some users seemed unusually prepared for the launch topic @johnowhitaker.
Facts vs opinions
Factual claims explicitly present in the tweet set
- Midjourney published a technical dive into a product called the “Midjourney Scanner” @midjourney.
- The scanner was described as:
Radiation-free
- Magnet-free
- Fast
- Low-cost
- Requiring a water immersion tank
- Having coarser resolution than CT/MRI
@iScienceLuvr
- A person physically tried a demo scanner with their hand @saranormous.
Interpretations/opinions/speculation
- Strongly positive reactions framed the scanner as visionary or “the future” @saranormous.
- Some observers took the launch as evidence that Midjourney is pursuing a more ambitious hardware roadmap than competing AI labs @matvelloso.
- One humorous reply escalated the idea into “next up is full cargo transport by midjourney,” clearly not a factual claim @yacinelearning.
- Independent technical commentary suggested possible future design directions, such as distributed scattered detectors and emitters or real-time systems, but these were not presented as features of Midjourney’s current scanner @johnowhitaker.
Technical details and inferred modality
The tweet corpus contains only a limited number of hard specs, but they are enough to outline the project’s positioning.
- No ionizing radiation: “Radiation-free” implies the system is not using X-rays/CT-style ionizing modalities @iScienceLuvr.
- No magnets: “Magnet-free” differentiates it from MRI, which relies on strong magnetic fields @iScienceLuvr.
- Water immersion tank: This is a major clue about the physical sensing setup. Water coupling is common in some acoustic and wave-propagation imaging systems because it improves transmission and coupling between emitters, tissue, and detectors @iScienceLuvr.
- Resolution below CT/MRI: The system is not being claimed, in these tweets, to outperform incumbent clinical imaging on resolution; in fact, an explicit limitation is that resolution is coarser than CT/MRI @iScienceLuvr.
- Speed/cost positioning: It is framed as fast and low-cost, suggesting the value proposition is likely accessibility, throughput, or portability rather than top-end image fidelity @iScienceLuvr.
There is also technically informed reaction about the likely sensing challenges:
- John Whitaker notes that systems based on light, ultrasound, electric current, etc. have a harder inverse problem than X-rays because signals do not travel in straight lines in the same way, making reconstruction more complex @johnowhitaker.
- He also suggests a future version with many scattered detectors and emitters rather than mechanically moving components, indicating that at least some readers infer the current system may involve motion/scanning geometry rather than fully parallelized capture @johnowhitaker.
Taken together, the public discussion points toward a non-CT, non-MRI modality with wave-based reconstruction and meaningful algorithmic/inverse-problem content, though the tweets here do not provide definitive modality labeling or performance tables beyond the stated tradeoffs.
Different perspectives
Supportive / optimistic
- The most enthusiastic camp sees this as exactly the kind of high-upside, weird, non-consensus invention AI founders should pursue, not just incremental chatbot/UI products. That tone is clear in “let inventors like @DavidSHolz invent” @saranormous.
- In-person demo reactions emphasized the visceral novelty of interacting with a real scanner, not just reading a paper or watching a video @saranormous.
- Some interpreted the move as a sign that Midjourney may be thinking beyond image generation and toward full-stack applied invention, possibly combining hardware, sensing, and AI reconstruction.
Neutral / technical-curious
- The most grounded reaction in the set is the concise pros/cons summary: radiation-free, magnet-free, fast, low-cost versus water immersion and lower resolution than CT/MRI @iScienceLuvr.
- Technically curious observers liked the strangeness of the modality while immediately identifying the physical and systems tradeoffs:
Non-straight-line propagation compared with X-rays
- Need for better real-time capture arrangements
- Questions about detector/emitter topology
@johnowhitaker
Opposing / skeptical / cautionary
Direct hostile criticism is limited in this tweet set, but skepticism is implicit in several points:
- Clinical utility skepticism: saying it has coarser resolution than CT/MRI is a substantive caveat, especially in medicine where image quality can directly affect diagnostic value @iScienceLuvr.
- Practicality skepticism: requiring a water immersion tank is a serious ergonomic and deployment constraint for routine clinical or consumer use @iScienceLuvr.
- Modality skepticism: technical comments about non-straight-line propagation hint at the usual challenge for alternative imaging systems: the physics and inverse reconstruction are hard, and the pretty demo may not automatically translate into robust, clinically reliable imaging @johnowhitaker.
Competitive framing
- One notable perspective was less about the scanner itself and more about what it says strategically: if Midjourney is attempting hardware-medical invention, then AI companies pursuing narrower wearable-camera concepts look conservative by comparison @matvelloso.
Context: why this matters
Midjourney is primarily known as an image-generation company. That makes a medical/scanner reveal noteworthy for several reasons:
- It suggests a willingness to move from generative media software into real-world sensing and hardware.
- Medical imaging is a domain where inverse problems, signal processing, reconstruction, and increasingly ML-based interpretation all matter; it is not an obvious adjacency, but it is a technically deep one.
- The scanner appears to be positioned not as “better than MRI/CT on all axes,” but as a potential entrant in the classic disruption lane: worse on a premium metric, better on cost/accessibility/operational burden.
- If the system is genuinely fast and low-cost, the most plausible implications are in:
screening or triage,
- settings where CT/MRI access is limited,
- repeat imaging where avoiding radiation matters,
- specialized anatomical use-cases where immersion-based setups are acceptable.
The launch also fits a broader 2025 pattern where AI-adjacent companies increasingly try to define themselves not just as model vendors, but as builders of new interfaces to the physical world. In that framing, Midjourney Medical is less about a single scanner and more about whether frontier AI-era startups can productize difficult sensing systems, not just generate content.
Implications and open questions
- Regulatory path: nothing in these tweets addresses approvals, validation studies, or whether this is research-only versus intended for clinical deployment. For medical relevance, those questions are central.
- Reconstruction stack: the phrase “technical dive” implies the company has discussed internals, but the tweet set here does not expose the actual algorithmic details. The likely crux is reconstruction quality under a constrained sensing setup.
- Use-case specificity: lower resolution than CT/MRI does not necessarily doom the system; many imaging tools win by being good enough for a narrow workflow. But no specific target indication appears in these tweets.
- Form factor challenge: a water immersion tank is acceptable for some scanning contexts and a major barrier for others. Whether this is a prototype artifact or a fundamental requirement matters.
- Throughput and cost realism: “fast” and “low-cost” are meaningful only relative to benchmarks—scan time, hardware cost, consumables, operator burden, and downstream interpretation overhead. Those numbers are not provided in the tweets here.
- AI’s role: the most interesting technical question may be whether Midjourney’s contribution is primarily in hardware design, inverse-problem reconstruction, learned denoising/super-resolution, automated interpretation, or an integrated stack spanning all of these. The social reaction suggests people are projecting a lot onto the project because Midjourney’s brand is associated with learned visual systems rather than classical medical devices
AI research, agents, and open models
- A notable research meta-point: Chinese open-source literature over the last year was highlighted as unusually high-ROI to follow, with the claim that the “alpha is insanely huge” @himanshustwts.
- PapersWithCode’s top trending paper was VibeThinker-3B, described as a 3B parameter model exploring verifiable reasoning in small LMs and allegedly landing in the performance tier of DeepSeek V3.2, GLM-5, and Gemini 3 Pro @NielsRogge.
- A computer-use paper, PreAct, was praised for compiling successful agent runs into a guarded replayable state machine, eliminating per-step LM calls on repeats and yielding 8.5x to 13x faster replay @dair_ai.
- Another RL/agent paper proposed LLM-as-Environment-Engineer, where the policy uses its own failures to redesign the next training environment; the associated benchmark is MAPF-FrozenLake @dair_ai.
- Omar Sar0 argued coding agents need verifiers and robust guardrails, not blind autonomous loops, reinforcing a trend toward constrained agentic execution @omarsar0.
- David Khourshid’s coding-agent take was more operational: AI-generated code still has to be read, and not reading it simply defers the debugging burden @DavidKPiano.
- On RL theory, John Schulman said PPO’s resurgence in the LLM era comes from effects not anticipated in the original paper, including the importance-ratio objective correcting biases from numeric error, async training, and forward-pass noise, while clipping alters entropy via a mechanism only later understood; he cites DAPO @johnschulman2.
- Relatedly, Chris Wolfe said recent post-GRPO analysis papers (e.g. DAPO, Dr. GRPO, GSPO, TIS) are exactly the kind of objective-analysis work he hopes to see for PPO in reasoning/agent contexts @cwolferesearch.
- John Carmack posted a detailed critique of Temporal Differences for visual representation learning, summarizing the method: train a frame encoder and a “motion encoder” on RGB frame differences so latent(frame1) + delta ≈ latent(frame2), with a 0.25 second stride; he questioned the DINO EMA anti-collapse choice and the soundness of the delta construction @ID_AA_Carmack.
AI infrastructure, inference, and product rollouts
- Xenova released a demo and kernels from the now-shut-down Fable 5 effort, claiming it had pushed Gemma 4 to 255 tok/s on WebGPU; the framing is that agentic kernel optimization could materially improve browser/on-device inference @xenovacom.
- Fal announced Kling 3.0 Turbo and O3 upgrades:
faster generation
- lower costs
- better lip-sync
- more stable motion
- stronger prompt/reference consistency in “Omni”
- up to 15s clips
- full 4K generation with Omni
- improved storyboard and multishot workflows
@fal
- Kling’s own account amplified the Fal rollout as a creator-facing quality/speed improvement @Kling_ai.
- GitHub Copilot’s Auto mode now uses a custom routing model to choose among models based on reasoning depth, code complexity, debugging difficulty, and tool orchestration needs; a blog post and a linked research paper were shared @pierceboggan, @pierceboggan.
- Kimi Code Web appears to be back online, per a brief ecosystem note @bigeagle_xd.
- Grok image generation projects were mentioned via grok.com/imagine, but with no substantive technical detail @chaitu.
Talent, labs, and competitive dynamics
- The biggest personnel story outside Midjourney: Noam Shazeer announced he is joining OpenAI, leaving Google after saying it was a difficult decision and praising his former team @NoamShazeer.
- Sam Altman celebrated the move, saying Noam was one of the people he had most wanted to work with since OpenAI’s beginning @sama, then joked about OpenAI being SOTA “in noams” @sama.
Commentary emphasized Shazeer’s significance as co-author of Transformer, T5, and Switch Transformer and pioneer of sparse MoE systems, with some calling
関連記事
[AINews] Midjourney Medical:体重計に乗るように臓器をスキャン
AI画像生成で有名なMidjourneyが医療用スキャナー「Midjourney Medical」を発表した。同製品は超音波やCT画像にAIを活用し、臓器の健康状態を体重計のように簡便に測定する新サービスを開始した。
AI画像生成のミッドジャーニーが全身超音波スキャナーの開発へ
AI画像生成で知られる企業「Midjourney」が、60秒で人体全体をミリメートル単位の精度で3Dマッピングする医療用超音波スキャナー装置を開発中である。同社はこれをスパ施設に設置する計画も進めている。
Midjourney が「猫の画像」生成から全身超音波スキャンへ
Midjourney のCEOであるデヴィッド・ホルツが、同社初のハードウェア製品として超音波による全身スキャナー『The Midjourney Scanner』を発表し、従来のAI画像生成とは異なる医療用途への展開を示した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み