中国のAI研究所からの報告
中国の AI ラボが米国の研究者と異なる文化的背景を持つことで、組織内のエゴやキャリア志向による対立を抑制し、モデル全体の最適化に集中できる強みを持っているという分析。
キーポイント
文化と組織構造の違い
中国の研究者は教育や労働における文化的伝統により、個人のエゴよりもチーム全体のパフォーマンスを優先する傾向があり、これが追従・先行技術の維持に寄与している。
米国におけるエゴと対立
米国の文化では研究者が自分のアイデアを主張することが評価される風潮があり、それが組織内の政治的対立やトップ研究者への妥協(金銭的な解決など)を生み、モデル開発の妨げとなっている。
LLM 構築の複雑性と最適化
最新の LLM 構築はデータからアルゴリズムまで全スタックにわたる緻密な作業であり、個々の要素を最大化するよりも、多目的最適化のために個人の成果を調整して統合することが重要である。
米中研究文化の相違とモデル開発への影響
米国では自己主張やキャリア志向が対立を生みモデル作成を阻む一方、中国では学生がコアメンバーとして参画し、エゴに左右されにくい組織風土で実用的な技術開発が進んでいる。
若手研究者の強みと教育システムの課題
中国のラボは学生を同僚として扱い、過去の hype に縛られない柔軟な適応力を有するが、画期的な 0 から 1 の研究を生む文化への転換には教育・インセンティブ制度の大規模な再設計が必要とされている。
米国トップラボとのインターンシップ体制の違い
米国の主要 AI ラボはインターンシップを設けていないか実務から隔離される傾向があるが、中国のラボでは学生が LLM チームに直接統合され、即戦力として貢献している。
学術界から産業界への人材流出と教育観の変化
中国でも米国と同様に、多くの研究者が教授職よりも業界での実務を志向しており、LLM の普及により教育は解決済みとの考えから学生との対話を不要とする意見も出ている。
影響分析・編集コメントを表示
影響分析
この記事は、AI モデル開発における技術的要因以外のカスタマー(文化的・組織的)要因が競争力に直結することを示唆しており、業界関係者に対して単なる技術競争だけでなく、組織運営や文化設計の重要性を再考させる契機となる。特に中国企業の急成長背景にある「協調性」のメカニズムは、米国のスタートアップや大企業にとって重要な経営課題として捉えられるべきである。
編集コメント
技術的な能力が同等である場合、組織文化の違いが最終的な成果に決定的な影響を与えるという視点は、AI エンジニアリングの文脈で非常に示唆に富んでいます。
杭州から上海へ向かう新しい高速列車の窓を眺めていると、夕日にシルエットを描く風力タービンが点在する劇的な山稜の景色を眼前に広げることができます。山々は、広がる畑地と密集した高層ビルが混在する風景の背景をなしています。中国からの帰途にある私は、非常に謙虚な気持ちでいます。あまりにも異質な土地へ赴き、そこであれほど歓迎されるという体験は、とても温かい人間味あふれるものです。遠くから知っていた AI エコシステム内の多くの人々と会う機会に恵まれ、彼らは大きな笑顔と歓声で私を迎えてくれました。私の仕事や AI エコシステムがいかにグローバルであるかを思い知らされました。
Interconnects AI は読者支援型の出版物です。購読をご検討ください。
中国の研究者たちのマインドセット
言語モデルを構築する中国企業は、教育と労働における長年の文化的伝統に加え、技術企業の構築に対する微妙に異なるアプローチに基づき、この技術において完璧なファストフォロワーとして設計されています。出力を見ると、エージェントワークフローを可能にする最新かつ最大規模のモデルや、優秀な科学者、大規模データ、加速されたコンピューティングといった構成要素を見ても、中国と米国のラボは全体的に大きく類似しています。永続的な違いが生じるのは、これらがどのように組織化され、どのような条件付けを受けているかという点です。
私は長年、中国のラボが最先端への追従と維持にこれほど優れている理由の一つは、このタスクに対して文化的に適応しているからではないかと考えてきました。しかし、直接関係者に話を聞かない限り、この直感に大きな影響力を帰属させるのは私の立場ではないと感じていました。中国の主要なラボで働く素晴らしい、謙虚でオープンな科学者たちと話すことで、多くの信念が明確になりました。
今日、最高の大規模言語モデル(LLM)を構築する多くは、データからアーキテクチャの詳細、強化学習(RL)アルゴリズムの実装に至るまで、スタック全体にわたる綿密な作業にかかっています。モデルのあらゆる点が改善をもたらす可能性があり、それらを統合することは複雑なプロセスであり、一部の才能ある個人の作業を棚上げしてでも、多目的最適化を最大化する全体的なモデルを優先する必要があります。
アメリカの研究者も個々のコンポーネントを解決する点では明らかに優秀ですが、米国には自分自身のために発言する文化がより根付いています。科学者として、自分の仕事について発言することが成功につながり、現代の文化は「AI をリードする科学者」という新たな名声への道へと押しやっています。これが直接的な対立を生んでいます。Llama 組織については、これらの利害関係者が階層組織に埋め込まれる政治的圧力によって崩壊したという噂が強く流れています。他のラボでは、最終モデルに自分のアイデアが採用されなかったことに対する不満を止めるために、トップ研究者への賄賂が必要だったと聞いたこともあります。それが本当にそうかどうかは別として、その考え方は明確です。エゴやキャリアアップへの欲求が、最良のモデルを作ることを妨げているのです。米国と中国の間でこのような文化に生じる小さな方向性の転換が、最終的な成果物に大きな影響を与える可能性があります。
この一部は、中国でモデルを構築しているのが誰かという点に関係しています。すべてのラボには即座に認識される現実があり、コア貢献者の大部分が現役の学生であることです。これらのラボはかなり若く、これは Ai2 での私たちのセットアップを思い出させます。そこでは学生は同僚として見なされ、LLM チームに直接統合されています。これは、OpenAI、Anthropic、Cursor などがインターンシップを提供しないという点で、米国のトップラボとは全く異なります。Google のような他の企業も Gemini に関連するインターンシップを名目上持っていますが、あなたのインターンシップが孤立し、実際の業務から遠ざけられるのではないかという懸念が非常に大きいです。
文化のわずかな変化がモデル構築能力をどのように向上させるかを要約すると以下のようになります:
最終的なモデルを改善するために派手ではない作業を行うことへのより高い意欲、
AI 構築に新しい人々は、過去の AI hype サイクルの影響を受けず、新しい現代的な技術により迅速に適応できる(実際、私が話した中国の科学者の一人は、この強みに積極的に注目していました)、
システムをゲーム化する傾向が少なく、エゴによる組織図がわずかにスケールしやすくなること、
など、他の場所で概念実証によって問題を解決するのに適した豊富な人材。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
今日の言語モデル構築を補完するスキルへのわずかな傾斜は、中国の研究者は創造性に欠け、分野を生み出す 0 から 1 の学術的研究をあまり行わないというよく知られたステレオタイプとは対照的です。今回の訪問で最も学術的なラボを訪れた際、多くのリーダーがより野心的な研究文化の育成について語っていました。同時に、私たちが話した一部の技術リーダーは、科学へのアプローチにおけるそのような再配線が近々起こる可能性に懐疑的でした。なぜなら、それは現在の経済均衡の中で起こり得ないほど大きな教育およびインセンティブシステムの再設計を必要とするからです。この文化は、LLM 構築ゲームにおいて卓越した学生やエンジニアを育成しているようです。もちろん、彼らの数は極めて豊富です。
これらの学生は、米国で起きているのと同様の中国における「頭脳流出」について私に話してくれました。以前は学術的な道を考えていた多くの人々が、現在は業界に残る意向を持っているのです。最も面白かったのは、教育システムに近い教授職に興味を持っていた研究者の言葉でした。彼は「LLM によって教育は解決済みだ——なぜ学生が私に話をしに来る必要があるのか!」と述べました。
学生たちは、LLM(大規模言語モデル)に対して新鮮な視点を持ち込むという利点があります。ここ数年、LLM の主要なパラダイムは、MoE(混合専門家モデル)のスケーリングから RL(強化学習)のスケーリングへ、そしてエージェント機能の実装へと移行してきました。これらいずれをうまく行うには、広範な文献や自社内の技術スタックから膨大な文脈情報を迅速に吸収する必要があります。学生たちはこれを慣れ親しんでおり、何が機能すべきかという前提を謙虚に捨て去ることに意欲的です。彼らは頭から水に飛び込み、モデルの改善に人生を捧げる機会を得ようと努めています。
これらの学生はまた、科学者を混乱させる可能性のある哲学的な議論の一部から解放され、非常に直接的で自由です。モデルの経済性や長期的な社会的リスクについてどう感じるかを問う際、中国の研究者のうち、洗練された見解を持ちそれを影響力を行使しようとする意欲を持つ者は遥かに少ないです。彼らの役割は、最良のモデルを構築することにあります。
この違いは微妙であり、否定されやすいものですが、英語を流暢に話せるエレガントで卓越した研究者と長時間対話しているときに最も感じられます。AI のより哲学的な側面に関する基本的な質問でも、彼らには単純な混乱として空気に漂うことになります。彼らにとってそれはカテゴリーエラーなのです。ある研究者は、これらの領域を探求する際、米国が弁護士によって運営されているのに対し中国はエンジニアによって運営されているという有名なダン・ワンの前提を引用し、彼らの「構築したい」という欲求を強調しました。中国には、Dwarkesh や Lex といった大規模なメインタストキャストのように、中国科学者のスターパワーを体系的に育成する道筋はありません。
AI に起因する今後の経済的不確実性について中国の科学者にコメントを求める質問や、単純な AGI の能力を超えた問い、あるいはモデルがどのように振るうべきかに関する道徳的議論は、すべてこれらの科学者たちの極端な謙虚さを浮き彫りにしました。それは単に仕事への献身だけではありません。彼らは自分が十分に情報を持っていない問題についてはコメントしたくないのです。
Zooming out — Beijing especially felt much like the Bay Area, where a competitive lab is a short walk or Uber away. I got off a flight and stopped by Alibaba's Beijing campus on the way to the hotel. Then, in 36 hours we went to all of Z.ai, Moonshot AI, Tsinghua University, Meituan, Xiaomi, and 01.ai. Travel by Didi is easy, and if you select an XL in China you're often paired with electric mini vans that have massage chairs. We asked the researchers about the talent wars, and they said it's very similar to what we're experiencing in the U.S. It's normal for researchers to bounce around, and much of where people choose to go is based on the best current vibes.
In China, the LLM community feels far more like an ecosystem than battling tribes. Across many off the record conversations, it's nothing but respect for peers. All of the Chinese labs fear Bytedance with their popular Doubao model, which is the only frontier closed lab in China. At the same time, all of the labs have massive respect for DeepSeek as the lab with the best research taste in execution. When you meet with lab members off the record in the States, sparks fly quickly.
The most striking part of the humility of Chinese researchers is how they also often shrug on the business side, saying it's not their problem, where everyone in the U.S. seems to be obsessed with various ecosystem-level industrial trends, from data sellers to compute or fundraising.
Share
中国の AI 産業が、西洋のラボとどこで異なり、どこで一致しているか
今日、AI モデルを構築することがこれほど興味深い理由の一つは、単に優れた研究者たちを一つの建物に集めて工学的な驚異を生み出すことだけではないからです。かつてはそのような時代でしたが、AI ビジネスを持続させるためには、LLM(大規模言語モデル)は、この創造物の構築、展開、資金調達、そして採用獲得の混合体へと変化しています。主要な AI 企業は、資金、計算資源、データなどを供給し、フロンティアを押し続けるために存在する複雑なエコシステムの中にあります。
これらの多様な入力を LLM の作成と維持に統合することは、Anthropic や OpenAI に代表される西洋のエコシステムにおいては、比較的よく概念化されマッピングされています。したがって、中国のラボがこれについてどのように考えているかに大きな違いがある点を見つけることは、各企業が将来に対して意味のある異なる賭けをしている場所を指し示すことになります。もちろん、これらの未来は資金および/または計算資源に関する制約によって強く規定される可能性があります。
私は、これらのラボへのインタビューから得た最も重要な「AI 産業」レベルの教訓を文書化しました:
国内の AI 需要における初期兆候。中国の AI マーケットは、中国企業がソフトウェアに対して支払いを好まない傾向があるため小さくなるという仮説が広く唱えられていますが、これは歴史的に中国で極めて小さい SaaS エコシステムに対応するソフトウェア支出にのみ当てはまる話です。他方、中国には明らかに依然として大きなクラウド市場が存在します。中国のラボ自体も議論している重要な未解決の質問とは、企業における AI への支出が(小さな)SaaS マーケットを追跡するのか、それとも(基盤となる)クラウド市場を追跡するのかという点です。総合的に見ると、AI はクラウドに近づく傾向にあるように感じられ、新しいツールを取り巻く市場の成長について懸念している人はいませんでした。
開発者の多くが Claude に没頭しています。中国の AI 開発者のほとんどは、公式には中国で禁止されているにもかかわらず、Claude とそれがソフトウェア構築の方法をどのように変えたかに熱中しています。歴史的に中国がソフトウェア購入に対して慎重だったからといって、推論需要の劇的な増加がないという印象を受けるわけではありません。中国の技術スタッフは非常に実用的で謙虚、かつ意欲的であり、これは支出しないという過去の習慣へのコミットメントよりも強い事実のように思われます。
一部の中国研究者は、Kimi や GLM の CLI といった独自のツールを使って構築することを言及していますが、全員が Claude を使って構築していると言います。また、ベイエリアで確実に人気を博している Codex に言及した例も驚くほど少なかったです。
中国企業には技術所有権の意識があります。中国文化が急成長する経済エンジンと結びつき、予測不能な結果を生み出しています。私に残っているのは、多数の AI モデルがこの地域の多くのテクノロジー企業が持つ実用的かつ現在の均衡を反映しているという持続的な感覚です。マスタープランなど存在しません。業界は ByteDance や Alibaba に対する敬意によって定義されており、これらの既存企業は莫大なリソースをもってすべての市場の大部分を獲得すると期待されています。DeepSeek は技術面での尊敬されるリーダーですが、市場リーダーとは程遠い存在です。方向性を示すことはあっても、経済的に勝利する体制にはなっていません。
これにより、Meituan や Ant Group といった企業では、西洋の人々がこれらのモデルを構築していることに驚くことがあります。実際には、彼らは LLM(大規模言語モデル)が将来の技術製品の中心にあると明確に認識しており、強力な基盤が必要なのです。汎用性の高い強力なモデルをファインチューニングすることで、オープンコミュニティからのフィードバックを得るためのスタックを強化し、自社製品のために内部でファインチューニングされたバージョンのモデルを保持することができます。業界における「オープンファースト」の考え方は主に実用性によって定義されており、これによりモデルが強力なフィードバックを得られるようになり、オープンソースコミュニティに還元され、ミッションを推進する力を得るのです。
政府の支援は確かに存在するが、その規模は不明確である。中国政府が開発された大規模言語モデル(LLM)の競争に積極的に協力しているという主張はよくなされる。しかし、この政府は多くのレベルに分散しており、各レベルが具体的に何をすべきかを示す明確な指針を持っていない。北京の各地区は、自地区にテック企業のオフィスを誘致しようと競い合っている。これらの企業に対して提供される「支援」には、許可証などの官僚的な手続きの簡素化が含まれていることはほぼ間違いないが、その範囲はどこまで及ぶのだろうか?政府の各レベルは人材の獲得を助けることができるのか?また、半導体の密輸を助けることができるのだろうか?今回の訪問を通じて、政府の関心や支援に関する言及は数多くあったが、それを断定的に報告したり、中国政府が中国における AI の軌道にどのように影響を与えるかについて確信を持って語るには、情報があまりにも不足していた。
中国の政府の最上層部がモデル内の技術的な決定に影響を与えているという兆候は確かに一切見られなかった。
データ産業は、まだそれほど発展していません。Anthropic や OpenAI のような企業が単一の環境に 1000 万ドル以上を費やし、強化学習(RL)の最前線を押し広げるために年間数十億ドル規模の累積支出を行っているという話を多く聞いてきたため、中国の研究機関が米国の企業から同じ環境を購入しているのか、あるいは国内でそれを模倣したエコシステムによって支えられているのかを知りたかったのです。答えは完全なものではありませんでしたが、データ産業が存在しないというよりは、その品質が相対的に低く、環境やデータを自社内で構築する方がむしろ良いという経験則があるとのことでした。研究者たちは自ら強化学習(RL)のトレーニング環境を作るために多大な時間を費やし、ByteDance や Alibaba などの大手企業にはこれを支援するための社内データラベリングチームを保有している場合もあります。これは先ほどの「購入せず自社で構築する」というマインドセットと一致しています。
より多くの Nvidia チップへの切実な渇望です。Nvidia の計算リソースはトレーニングにおけるゴールドスタンダードであり、誰もがそれをさらに入手できないことで進捗に制限されています。供給があれば、当然ながら購入されるでしょう。Huawei を含む他のアクセラレーターについては、推論(inference)において肯定的に言及されていました。無数の研究機関が Huawei チップへのアクセス権を持っています。
これらの点は、AI エコシステムについて非常に異なる像を描き出しており、西洋のラボの運営方法を中国の対応するラボに素早く当てはめようとすると、しばしばカテゴリ誤謬(カテゴリーエラー)を招くことになります。重要な問いは、これらの異なるエコシステムが意味のある違いを持つモデルを生み出すのか、それとも中国のモデルは常に 3〜9 ヶ月前の米国フロンティア・モデルに類似しているという説明で片付けられるのかということです。
購読する
結論:世界の均衡
この旅に入るまで、私は中国についてあまりにも何も知らなかったと自覚しており、旅を終えた今もまだ学び始めたばかりという感覚を持っています。中国はルールやレシピで表現できる場所ではなく、非常に異なるダイナミクスと化学反応を持つ場所です。その文化はあまりにも古く、深く、国内の技術がどのように構築されているかと完全に絡み合っています。私にはまだ学ぶべきことが多く残されています。
現在の米国における権力構造の多くは、中国に対する自らの世界観を意思決定のための重要な精神的装置として利用しています。中国の主要な AI ラボのほぼすべてと、個人的に、あるいは非公式にでも対話を行った結果、中国には西洋的な意思決定プロセスではモデル化するのが非常に難しい数多くの資質や直感が存在することがわかりました。これらのラボがなぜトップモデルをオープンにリリースするのかについて直接質問したにもかかわらず、所有権マインドセットと真のエコシステム支援の間の接点を結びつけることは私にとって依然として困難です。
ここにある研究所は実用的であり、必ずしもオープンソースの絶対主義者ではありません。つまり、構築するすべてのモデルを公開してリリースするというわけではありませんが、開発者やエコシステムをサポートし、自社のモデルについてより多く学ぶための手段として活用することに深い意図があります。
中国の主要なテクノロジー企業のほとんどが、独自の汎用大規模言語モデル(LLM)を開発しています。例えば、配送サービスの美团(Meituan)や広範な消費者向けテクノロジー企業である小米(Xiaomi)が、オープンウェイトモデルをリリースしているのがその例です。米国では同様の企業がサービスを購入するでしょう。これらの企業が LLM を構築するのは、最新の流行に追随して存在感を示すための競争のためではなく、自社のスタックを制御し、現代において最も重要な技術を発展させるという深い根本的な渇望によるものです。ノートパソコンから顔を上げて見上げると、常に地平線にクレーンの群れが見えますが、これは明らかに中国における構築活動に関するより広範な文化やエネルギーと調和しています。
中国の研究者の人間的な魅力、愛嬌、そして本物の温かさは、非常に人間味あふれるものです。個人的なレベルでは、米国で慣れ親しんでいる過酷な地政学的な議論は、彼らに全く浸透していません。世界には、このような単純なポジティブさがもっと必要です。AI コミュニティの一員として、私は現在、国籍というラベルを巡ってメンバーやグループ内に現れつつある亀裂についてより心配しています。
私は、AI スタックのあらゆる部分において米国のラボが明確なリーダーであることを望まないと言ったなら嘘になります。特にオープンモデルについては私が時間を費やしている分野ですが、私はアメリカ人であり、これは正直な好みの問題です。これに伴い、私はオープンエコシステム自体が世界的に繁栄することを望んでいます。なぜなら、これが世界にとってより安全で、よりアクセスしやすく、より有用な AI を生み出すことができるからです。そして今、問われているのは、米国のラボがこのリーダーシップの地位を確立するための措置を取るかどうかです。
この記事を完成させた時点では、オープンモデルに影響を与える大統領令に関する噂がさらに渦巻いており、これが米国のリーダーシップとグローバルエコシステム間のシナジーをさらに複雑にする可能性があります。これは私に安心感を与えません。
Moonshot、Zhipu、Meituan、Xiaomi、Qwen、Ant Ling、01.ai、およびその他の企業で話をさせていただいた素晴らしい方々全員に感謝いたします。皆様は時間を割いていただき、非常に歓迎的で寛容でした。私は中国に関する考えを、文化全般および AI 分野において具体化されるままに引き続き共有していきます。この知識が、AI 開発の最前線で展開されている物語に直接的に関連していることは明白です。
原文を表示
Staring out the window on a new, high-speed train from Hangzhou to Shanghai I’m gifted with views of dramatic ridgelines speckled with wind turbines that are silhouetted against the setting sun. The mountains cast a backdrop to a mix of spanning fields and clustered skyscrapers. I’m returning from China with great humility. It’s a very warming, human experience to go somewhere so foreign and be so welcomed. I had the honor of meeting so many people in the AI ecosystem who I knew from afar, and they greeted me with big smiles and cheer, reminding me how global my work and the AI ecosystem is.
Interconnects AI is a reader-supported publication. Consider becoming a subscriber.
The mentality of Chinese researchers
The Chinese companies building language models are set up as the perfect fast-followers for the technology, building on long-standing cultural traditions in education and work, along with subtly different approaches to building technology companies. When you look at the outputs, the latest, biggest models enabling agentic workflows, and the ingredients, excellent scientists, large-scale data, and accelerated computing, the Chinese and American labs look largely similar. The lasting differences emerge in how these are organized and conditioned.
I’ve long thought that a reason that the Chinese labs are so good at catching up and keeping up with the frontier is that they’re culturally aligned for this task, but without talking to people directly I felt like it wasn’t my place to attribute substantial influence to this hunch. Speaking with many wonderful, humble, and open scientists at the leading Chinese labs has crystallized a lot of my beliefs.
So much of building the best LLMs today comes down to meticulous work across the entire stack, from data to architecture details and RL algorithm implementations. All points of the model can give some improvements, and fitting them in together is a complex process where the work of some brilliant individuals needs to get shelved in favor of the overall model maximizing a multi-objective optimization.
Where American researchers are obviously also brilliant at solving the individual components, there’s more of a culture of speaking up for yourself in the U.S. As a scientist, you’re more successful when you speak up for your work and modern culture is pushing the new path to fame of “leading AI scientists”. This results in direct conflict. The Llama organization is heavily rumored to have collapsed under the political weight of these interests embedding themselves in a hierarchical organization. I’ve heard of other labs saying that it can be needed to pay off a top researcher to get them to stop complaining about their idea not making it in the final model. Whether or not that’s exactly true, the idea is clear. Ego and desires for career advancement do get in the way of making the best models. A small, directional shift in this sort of culture between the U.S. and China can have a meaningful impact on the final outputs.
Some of this has to do with who is building the models in China. There’s an immediate reality at all of the labs that a large proportion of the core contributors are active students. The labs are quite young, and it reminds me of our setup at Ai2, where students are seen as peers and directly integrated in the LLM team. This is incredibly different from the top labs in the US, where the likes of OpenAI, Anthropic, Cursor, etc. simply don’t offer internships. Other companies like Google nominally have internships related to Gemini, but there’s a lot of concern about whether your internship will be siloed and away from anything real.
To summarize how the slight change in culture can improve the ability to build models:
More willingness to do non-flashy work in order to improve the final model,
People new to building AI can be free of prior phases of AI hype cycles, allowing them to adapt to the new modern techniques faster (in fact, one of the Chinese scientists I talked to really actively attached to this strength),
Less ego enabling org charts to scale slightly, as there’s less gamifying the system, and
Abundant talent well-suited to solving problems with a proof of concept elsewhere, etc.
This slight inclination towards skills that complement building today’s language models stands in contrast to a known stereotype that Chinese researchers tend to produce less creative, field-spawning, 0-to-1 academic style research. Among the more academic lab visits on our trip, many leaders talk about cultivating this more ambitious research culture. At the same time, some technical leaders we talked to were skeptical about whether such a rewiring in the approach to science is likely in the near term, because it’ll take a redesign of the education and incentive systems that is too big to happen within the current economic equilibrium. This culture seems to be training students and engineers that are excellent at the LLM building game. They also, of course, have an extremely abundant quantity.
These students told me about a similar brain drain happening in China as in the U.S., where many who previously considered academic paths now intend to stay in industry. The funniest quote was from a researcher who was interested in being a professor to be close to the education system, but remarked that education is solved with LLMs – “why would a student talk to me!”
The students have a benefit of coming at LLMs with fresh eyes. Over the last few years we’ve seen the key paradigm of LLMs shift from scaling MoE’s, to scaling RL, to enabling agents. Doing any of these well involves absorbing an insane amount of context quickly, both from the broader literature and the technical stack at your company. Students are used to doing this and excited to humbly drop all presumptions about what should work. They dive in head first and dedicate their life to getting the chance to improve the models.
These students are also so magically direct and free of some of the philosophical chatter that can distract scientists. When asking questions on how they feel about the economics or long-term social risks of models, far fewer Chinese researchers have sophisticated opinions and a drive to influence this. Their role is to build the best model.
This difference is subtle, and easy to deny, but it is best felt when having long conversations with an elegant, brilliant researcher who can clearly communicate well in English, basic questions on more philosophical aspects of AI hang in the air with a simple confusion. It’s a category error to them. One researcher even quoted the famous Dan Wang premise of China being run by engineers, relative to the lawyers of the U.S. when probing in these areas, to emphasize their desire to build. There’s no track in China that systematically enables the growth of star power for Chinese scientists, akin to mega mainstream podcasts like Dwarkesh or Lex.
Trying to get Chinese scientists to comment on the coming economic uncertainty fueled by AI, questions beyond the capabilities of simple AGI, or moral debates on how models should behave all served to capture the extreme humility of these scientists. It’s more than just being dedicated to their work, but they don’t want to comment on issues they’re not informed on.
Zooming out — Beijing especially felt much like the Bay Area, where a competitive lab is a short walk or Uber away. I got off a flight and stopped by Alibaba’s Beijing campus on the way to the hotel. Then, in 36 hours we went to all of Z.ai, Moonshot AI, Tsinghua University, Meituan, Xiaomi, and 01.ai. Travel by Didi is easy, and if you select an XL in China you’re often paired with electric mini vans that have massage chairs. We asked the researchers about the talent wars, and they said it’s very similar to what we’re experiencing in the U.S. It’s normal for researchers to bounce around, and much of where people choose to go is based on the best current vibes.
In China, the LLM community feels far more like an ecosystem than battling tribes. Across many off the record conversations, it’s nothing but respect for peers. All of the Chinese labs fear Bytedance with their popular Doubao model, which is the only frontier closed lab in China. At the same time, all of the labs have massive respect for DeepSeek as the lab with the best research taste in execution. When you meet with lab members off the record in the States, sparks fly quickly.
The most striking part of the humility of Chinese researchers is how they also often shrug on the business side, saying it’s not their problem, where everyone in the U.S. seems to be obsessed with various ecosystem-level industrial trends, from data sellers to compute or fundraising.
Share
Where China’s AI industry differs (and matches) the Western labs
The thing that makes building an AI model today so interesting is that it’s not just about getting a group of great researchers in one building together to produce an engineering marvel. It used to be this, but to sustain AI businesses, the LLMs are becoming a mix of building, deploying, funding, and getting adoption for this creation. The leading AI companies exist in complex ecosystems that supply money, compute, data and more in order to keep pushing the frontier.
The integration of these various inputs to creating and sustaining LLMs is fairly well conceptualized and mapped for the Western ecosystem, as typified by Anthropic and OpenAI, so finding big differences in how the Chinese labs think about it points at where the different companies can be making meaningfully different bets on the future. Of course, these futures can be heavily dictated by the constraints on funding and/or compute.
I’ve documented the biggest “AI Industry” level take-aways from talking to these labs:
Early signs of domestic AI demand. There’s a much-touted hypothesis that the Chinese AI market will be smaller because Chinese companies don’t tend to pay for software – thus, never unlocking a giant inference market supporting labs. This is only true for software spend that maps to the SaaS ecosystem, which is historically tiny in China, where on the other hand there is obviously still a large cloud market in China. A crucial unanswered question – one which the Chinese labs themselves debate – on if spending for AI in the enterprise tracks the SaaS market (small) or the cloud market (fundamental). On net, it feels like AI is trending closer to the cloud, and no one was actively worried about a market growing around the new tools.
Most developers are Claude-pilled. Most of the AI developers in China are obsessed with Claude and how it’s changed how they build software, despite Claude nominally being banned in China. Just because China has historically been hesitant to buy software does not give me the impression that there won’t be a massive surge in inference demand. Chinese technical staff are so practical, humble, and motivated – a fact that seems stronger than any commitment to previous habits in not spending.
Some Chinese researchers mention building with their own tools, such as the Kimi or GLM CLIs, but all of them mention building with Claude. There were also surprisingly few mentions of Codex, which is definitely surging in popularity in the Bay Area.
Chinese companies have a technology ownership mentality. The Chinese culture is combining with a roaring economic engine to create unpredictable outcomes. I’m left with a lasting feeling that the numerous AI models reflect a practical, current equilibrium of the many technology businesses here. There’s no master plan. The industry is defined by a respect for ByteDance and Alibaba, the incumbents expected to win large portions of all markets with their substantial resources. DeepSeek is the respected technical leader, but far from a market leader. They set the direction, but aren’t set up to win economically.
This leaves companies like Meituan or Ant Group, where people in the West can be surprised they’re building these models. In reality, they see LLMs obviously as being central to future technology products, so they need a strong base. When they fine-tune the strong, general purpose model it hardens their stack from getting the open community to provide feedback on it, and they can keep internal, fine-tuned versions of the model for their products. The “open-first” mentality in the industry is largely defined by practicality — it helps make their models get strong feedback, it gives back to the open-source community, and empowers their mission.
Government aid is real, but unclear how big. It’s often asserted that the Chinese government is actively helping with the open LLM race. This is a government that’s decentralized across many levels, each of which doesn’t have a clear playbook for what exactly they do. Neighborhoods in Beijing compete for tech companies to house their offices there. The “help” offered to these companies almost certainly involved removing bureaucratic red tape like permits, but how far does it go? Can levels of the government help attract talent? Can they help smuggle chips? Across the visit, there were many mentions of government interest or help, but far too little to report the details as assertive or have a confident worldview of how government can bend the trajectory of AI in China.
There were certainly no hints of the top levels of the Chinese government influencing any technical decisions in the models.
The data industry is far less developed. Having heard so much about the likes of Anthropic or OpenAI spending $10M+ for single environments, with cumulative spend on the order of hundreds of millions per year to push the frontier of RL, we were eager to know if Chinese labs are either buying the same environments from companies in the U.S. or supported by a mirrored domestic ecosystem. The answer was not quite complete that there’s no data industry, but rather that their experience was that the data industry was relatively poor quality and it is often better to build the environments or data in-house. Researchers themselves spend meaningful time making the RL training environments, and some of the bigger companies like ByteDance and Alibaba can have in-house data labelling teams to support this. This all mirrors the build-not-buy mentality from the previous bullet.
Desperation for more Nvidia chips. Nvidia compute is the gold-standard for training and everyone is limited in progress by not having more of it. If supply was there, it is obvious that they would buy it. Other accelerators, including but not limited to Huawei, were spoken positively of for inference. Countless labs have access to Huawei chips.
These points paint a very different picture of an AI ecosystem, where quickly mapping how Western labs operate to their Chinese counterparts will often result in a category error. The crucial question is if these different ecosystems will produce meaningfully different types of models, or if the Chinese models will always be explained by being similar to the U.S. frontier models of 3-9 months ago.
Subscribe now
Conclusion: The global equilibrium
I knew I knew so little about China going into the trip and came out with the feeling of just starting to learn. China isn’t a place that can be expressed by rules or recipes, but one with very different dynamics and chemistry. The culture is so old, so deep, and still completely intertwined with how domestic technology is built. I have much more learning ahead.
So much of the current power structures in the US use their current worldviews of China as crucial mental devices for decision making. Having talked, in person, either formally or informally to pretty much every leading AI lab in China, there are a lot of qualities and instincts in China that’ll be very hard to model with Western decision making. Even after asking directly about why these labs release their top models openly, the intersection between ownership mentality and genuine ecosystem support is hard for me to connect the dots on.
The labs here are practical and not necessarily absolutists around open-source, where every model they build would be released openly, but there’s a deep intentionality in supporting developers, the ecosystem, and using it as a way to learn more about their models.
Almost every major Chinese technology company is building their own general purpose LLMs, as we see with the likes of Meituan (delivery service) and Xiaomi (broad consumer technology company) releasing open weight models. The equivalent companies in the U.S. would just buy services. These companies aren’t building LLMs out of a race to be relevant with the hot new thing, but a deep fundamental yearning to control their own stack and develop the most important technologies of the day. When I look up from my laptop and always see bunches of cranes on the horizon, it obviously fits in the with the broader culture and energy around building in China.
The humanity, charm, and genuine warmth of Chinese researchers is extremely humanizing. At a personal level, the cut-throat geopolitical conversation we’re used to in the U.S. hasn’t permeated them at all. The world can use more of this simple positivity. As a citizen of the AI community, I currently worry more about the fissures appearing within members and groups around labels of nationality.
I’d be lying if I said I didn’t want US labs to be clear leaders in every part of the AI stack — especially with open models where I spend my time — I’m American, and that’s an honest preference. With this, I want the open ecosystem itself to thrive globally, as this can create safer, more accessible, and more useful AI for the world, and right now the question is whether American labs will take the steps to own that leadership position.
As of finishing this piece, more rumors are swirling of executive orders influencing open models, which can further complicate this synergy between American leadership and the global ecosystem — it doesn’t fill me with confidence.
Thank you to all the wonderful people I got to talk to at Moonshot, Zhipu, Meituan, Xiaomi, Qwen, Ant Ling, 01.ai, and others. Everyone has been so welcoming and gracious with their time. I’ll keep sharing my thoughts on China as they crystallize, across culture generally and AI specifically. It is obvious that this knowledge will be directly relevant to the story unfolding at the frontier of AI development.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み