AIを管理する超能力
ペンシルベニア大学の MBA コースで実施された実験により、AI ツールの活用が従来の数ヶ月に相当するスピードと質でスタートアップのプロトタイプ開発を可能にし、ピボットのハードルを劇的に低下させる実証結果が示された。
キーポイント
学習期間の劇的短縮と成果の質向上
4 日間の短期集中コースで、非エンジニア出身の MBA 学生らが AI を活用し、従来の学期全体に匹敵するレベルのプロトタイプ開発を達成した。
AI ツールの多角的な活用
Claude Code や Google Antigravity でコードを実装しつつ、ChatGPT や Gemini を用いてアイデア創出、市場調査、財務モデル作成まで一貫して支援させた。
ピボットコストの低下による探索可能性
AI によって方向転換のコストが下がることで、学生たちは複数の事業案を同時に検討したり、市場反応に基づき柔軟に戦略を変更したりできるようになった。
AI 委譲の判断方程式
AI にタスクを委譲するかどうかは、「人間の基準所要時間」「成功率(Probability of Success)」「AI プロセス時間(指示・待機・評価にかかる時間)」の 3 つの変数に基づいて決定される。
リスクとコストのトレードオフ
タスクを AI に任せることは、全工程を手作業で行う時間と、試行錯誤して合格するまでかかるオーバーヘッドコストとの交換であり、成功率が高い場合にのみ有効となる。
AI の特性による委譲の条件
AI は複雑なタスクでの能力にばらつき(Jagged Frontier)があるものの、高速で安価であるため、人間が長時間を要するタスクであれば数回の試行錯誤を含めても価値がある。
AI の成功率向上による時間節約
GPT-5.2 が人間专家を72%の確率で上回るようになり、1時間の評価コストを含めても、7時間のタスクで平均3時間の節約が可能になる。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI が単なる補助ツールではなく、起業家教育やスタートアップ創出のプロセスそのものを再定義する「スーパーパワー」として機能しうることを示唆しています。特に、技術的障壁の除去とピボットコストの低下により、従来の「失敗を恐れる」文化から「迅速に試行錯誤する」文化への転換が加速する可能性を示しており、今後スタートアップエコシステム全体のパラダイムシフトを引き起こす重要な指標となります。
編集コメント
非エンジニア出身の学生が短期間で高品質なプロトタイプを完成させた事例は、AI の民主化と起業家の参入障壁低下を象徴する画期的な出来事と言えます。
私はペンシルベニア大学で実験的な授業を行いました。その中で、学生たちに4日間でゼロからスタートアップを立ち上げる課題を出しました。クラスの参加者の多くはエグゼクティブ MBA プログラムに在籍しており、医師やマネージャー、あるいは様々な大企業・中小企業のリーダーとして働きながら受講していました。コードを書いた経験がある者はほとんどいませんでした。私は彼らに Claude Code と Google Antigravity を紹介し、これらを使って動作するプロトタイプを構築させる必要がありました。しかし、プロトタイプだけではスタートアップにはなりません。そこで、アイデア創出、市場調査、競合ポジショニング、ピッチング、財務モデリングの各プロセスを加速するために ChatGPT、Claude、Gemini を活用しました。私は、彼らがこの短い期間でどこまで到達できるのか興味を持っていました。その結果、彼らは驚くほど遠くまで到達することができました。

デモの例:ディー・セスマジ、ジェーン・リアン・ワン、ユー・マによる「Ticket Passport」(認証済みチケット販売のためのマーケットプレイス)。ホワイト・チャイルズ、ホセ・オリバレス、スペンサー・ルイによる「Revenue Resilience」(小売企業のリスクにさらされる収益を特定し、エージェント型ソリューションを構築するもの)。マノージ・マッサンド、サミュエル・リー、ハリー・ルーによる「Parenting companion」(子供の興味とアクティビティをマッチングさせる親の相棒)。アンジェラ・アルゲンタティ、サビン・チャウラ、アディール・リズワンによる「Invive」(血糖値予測)。他にも素晴らしいデモは多数ありましたが、これらのチームにスクリーンショットの共有許可を得ました!
私は起業家精神の教育を15年間続けており、数千ものスタートアップアイデア(その中には大企業に成長したものも含まれます)を見てきました。そのため、優秀なMBA学生たちが何を実現できるかという期待値について、ある程度の感覚を持っています。私が数日間で目にした成果は、AI以前に学生が1学期かけて取り組んだものよりも、実際のスタートアップへの道のりにおいて桁違いに進んでいると推測されます。作成されたプロトタイプの多くは単なるサンプル画面ではなく、実際に中核機能として動作する部分を持っていました。アイデアは通常よりもはるかに多様で興味深いものでした。市場分析や顧客分析も洞察に富んでいました。本当に印象的でした。これらはまだ稼働中のスタートアップでもなく、完全に運用可能な製品(ごく一部の例外を除く)でもありませんでしたが、従来のプロセスから数ヶ月と莫大な資金・労力を削減することに成功しました。そして、もう一つ重要な点があります:多くの初期段階のスタートアップは、市場が何を求めているかや技術的に何が可能かを学びながら方向転換(ピボット)を余儀なくされます。ピボットの費用を下げることで、ロックインされることなく可能性を探ったり、複数のスタートアップを同時に探索したりすることが格段に容易になりました:AI に何を実現したいかを伝えるだけです。
この素晴らしい成果が私の優れた指導の結果だとお話しできればいいのですが、実際にはこれらのツールをどう活用するかについて、まだ確立された枠組みはありません。学生たちは主に自分たちで工夫して解決しました。彼らが管理や専門分野の知識を持っていたことが助けになりました。なぜなら、成功の鍵は実は前の段落の最後の一文にあることがわかったからです:AI に何を望んでいるかを伝えることです。AI が人間に数時間を要するタスクをこなす能力をますます高めていく中で、その成果を評価することが時間がかかるようになればなるほど、委任スキルを持つことの価値は増していきます。では、いつ AI に委任すべきなのでしょうか?
エージェントワークの方程式
実は答えがあります。ただし、少し複雑です。3 つの要因を考えてみましょう。第一に、AI の能力には「不整なフロンティア」があるため、複雑なタスクにおいて AI が得意とする分野や苦手とする分野を確実に予測することはできません。第二に、AI が得意か不得意かは別として、間違いなく高速です。人間が何時間もかけて行う作業を、AI は数分で完了させます。第三に、コストは安いです(専門職の賃金と比較して)。また、複数のバージョンを作成し、そのほとんどを捨てても気にしません。
この 3 つの要因により、AI に委任するかどうかの判断は以下の 3 つの変数に依存します:
人間のベースライン時間:あなたが自分でタスクを完了させるのにどれくらいかかるか
成功確率:特定の試行で AI があなたの基準を満たす成果を生み出す可能性
AI プロセス時間:AI の出力を要求し、待ち、評価するまでに要する時間

有用な思考モデルとして、あなたは「タスク全体を完了させること」(人間ベースライン時間)と、「オーバーヘッドコストを支払うこと」(AI プロセス時間)のトレードオフを行っていると考えられます。これは、許容できる結果が得られるまで、複数回行われる可能性があります。成功率(Probability of Success)が高いほど、AI プロセス時間を支払う必要回数は減り、タスクを AI に任せることの有用性も高まります。例えば、あなたが 1 時間かけて行う必要があるタスクでも、AI は数分で完了できるものの、その回答を確認するのに 30 分かかる場合を考えましょう。この場合、成功率が非常に高い場合にのみ、作業を AI に任せるべきです。そうでなければ、ドラフトの生成とチェックに要する時間が、自分でやるよりも長くなってしまいます。一方、人間ベースライン時間が 10 時間かかるタスクであれば、AI が有能な仕事ができるよう調整できると仮定すれば、数時間にわたって AI と協働する価値があると言えます。

数時間にわたる人間ベースライン時間のプロンプトの例として、初期の AI プロセス時間が 30 分(この間に他の作業ができる)に、プロンプトの確認と作成にかかる時間を加えたものです。ただし、多くの修正を必要とする場合は、その価値はありません。
この方程式が機能することは、昨夏に OpenAI が AI と実務に関する最も重要な論文の一つである GDPval を発表したことで確認されています。私は以前にもこれについて言及しましたが、要点は、金融から医療、政府に至るまで多様な分野の経験豊富な人間専門家と最新 AI を対決させ、別の専門家グループを審判として配置した点にあります。専門家が平均 7 時間かけて作業を行ったため、この場合が人間ベースライン時間となります。AI プロセス時間は興味深いものでした:AI はタスクに数分しか要しませんでしたが、実際には専門家が作業をチェックするのに 1 時間を要し、もちろんプロンプトの作成にも時間がかかります。成功確率については、GDPval が最初に発表された際、審判は人間による成果を勝者と判定するケースが大半でしたが、GPT-5.2 のリリースによりバランスが変化しました。GPT-5.2 Thinking および Pro モデルは、平均して 72% の確率で人間専門家と同等かそれ以上の結果を出しています。

AI を活用した GDPval タスクにおける作業のスピードとコスト改善(「ドラフト作成→レビュー→必要に応じて再試行」というワークフロー下で、無支援の専門家と比較して 1×、1×)。GPT‑5.2 の数値は、GDPval での勝率・同点率が約 72% であるという予測に基づくものであり、他のモデルの数値は GDPval 論文からのものです。実際の成果はタスクによって大きく異なります:「容易な勝利」になるものもあれば、明確な失敗となるものもあり、最も困難なケースでは一見妥当に見えるが実際には失敗する結果が生じます。
72% の成功率と 1 時間の評価時間を前提に、7 時間かかるタスクで何時間の節約が可能かを計算できます。AI にプロンプトを入力して回答を評価し、AI の回答が悪ければ自分で実施するという手順をすべてのタスクで試した場合、平均して 3 時間の節約になります。AI が失敗したタスクでは所要時間が長くなります(プロンプト入力とレビューに時間を浪費してしまうため)が、AI が成功したタスクははるかに短時間で完了します。しかし、管理の手法を用いることで、この計算式をさらに我々に有利に変えることが可能です。
新しいプロンプティングとしての委任
AI への委譲をより有意義なものにするためには、成功確率を高め、AI プロセス時間を短縮する 3 つの施策があります。第一に、AI が実行可能な明確な目標を設定し、より高い成功率でタスクを遂行させるための指示を改善することです。第二に、評価とフィードバックのスキルを向上させ、AI に正しい行動をとらせるまでの試行回数を減らすことです。第三に、AI のタスク遂行能力が優れているか劣っているかを判断するプロセスを簡素化し、時間をかけずに評価できるようにすることです。これらすべての要素は、専門分野における知識(ドメインエキスパートシップ)によって向上します。専門家であれば、適切な指示を出す方法を知っており、何かがうまくいかない状況をより的確に把握でき、修正も迅速に行うことができます。

特定のものを必要としない場合、AI モデルは問題解決の方法を自ら見出すことに驚くほど能力を発揮します。例えば、Claude Code は「EGA 風のグラフィックスを持つ、全くオリジナルの旧式 Sierra スタイルのアドベンチャーゲームを作成してください。画像生成エージェントを使用して画像を作成し、パーサーを提供してください。すべてのパズルを面白く、かつ解決可能にしてください。ゲームを完成させてください(プレイ時間は 10〜15 分程度になるように)、質問はしないでください。素晴らしいものにして、楽しいものにしてください」という 1 つのプロンプトだけで、1980 年代風のアドベンチャーゲーム全体を生成できることがわかりました。これだけです。AI がすべて、アートワークさえも作成しました。最後の 2 つのプロンプトでゲームのテストとデプロイが完了しました。ご自身でもプレイできます:enchanted-lighthouse-game.netlify.app

これは本当に素晴らしいことですが、その驚きは私が特定のものを必要としていなかったからこそ増幅されています。単に AI が自由に即興できるアドベンチャーゲームがあればよかったのです。しかし、実際の業務や実際の委任とは、あなたが特定の成果物を想定していることを意味し、そこが問題になり得る場所です。AI にあなたの意図を伝え、望む成果物を提供しつつも「判断力」を使って問題を解決させるにはどうすればよいのでしょうか?
この問題は AI が登場するずっと以前から存在しており、あまりにも普遍的であるため、あらゆる分野がこの問題を解決するために独自の書類を作成してきました。ソフトウェア開発者は製品要件定義書(Product Requirements Documents)を作成し、映画監督は撮影リストを渡します。建築家は設計意図書を策定し、海兵隊は 5 段構成命令(状況、任務、実行、補給、指揮)を使用します。コンサルタントは詳細な納品物仕様を用いて業務範囲を定義します。これらすべての文書は、この新しいエージェント型作業の世界における AI プロンプトとして驚くほどよく機能します(AI は一度に多数ページの指示も処理できます)。多くの異なるフォーマットで AI に指示を出せる理由は、これらすべてが実質的に同じものだからです:ある人の頭の中にあるものを、他者の行動に変換しようとする試みなのです。
実際に優れた委任文書に含まれる要素を振り返ると、驚くほど一貫性があります。私たちは何を目指し、なぜそうするのか?委任された権限の限界はどこか?「完了」の状態とはどのようなものか?私が具体的に必要とする成果物は何か?進捗を追跡するために必要な中間成果物は何か?そして、完了したと報告する前に何をチェックすべきか?これらが明確に定義されていれば、AI も人間と同様に、良い仕事をする可能性が格段に高まります。
そして、これらの指示を AI に与える方法を考える過程で、実はあなたは管理(management)を再発明していることに気づくのです。
エージェントの管理
主要な AI ラボにおける最も有名なソフトウェア開発者の一人が、自分の仕事が主にプログラミングから主に AI エージェントの管理へと変化していることに注目する様子を見ていて興味深く思います。コーディングは常に非常に組織化された構造を持っており、明確に検証可能な出力(コードが動作するかしないか)があるため、AI ツールが成熟した最初の分野の一つであり、したがってこの変化を最初に実感した職業でもあります。しかし、これは最後の分野ではありません。

ビジネススクールの教授として、多くの人が AI エージェントと協力するために必要なスキルを持っていたり、習得できたりすると考えています。それは管理の基礎的なスキルです。何を必要としているかを説明し、効果的なフィードバックを与え、作業を評価する方法を設計できれば、エージェントと協働できるはずです。少なくとも専門分野においては、仕事を完了させるために巧妙なプロンプト(指示文)を設計しようとするよりもはるかに簡単で、むしろ人間と働くようなものです。同時に、管理とは常に希少性を前提としてきました:すべてを自分で行えないから、そして才能が限られていて高価だから委任するのです。しかし AI はこの方程式を変えます。今や「才能」は豊富で安価になりました。何が希少なのかといえば、何を求めるべきかを知っていることです。
だからこそ、私の学生たちはこれほどまでに優れた成果を上げることができたのです。彼らは AI の専門家ではありませんでした。しかし、彼らの専門分野において問題の範囲を定義し、納品物を明確にし、財務モデルや医療報告書に不備があることを認識する方法を何年もかけて学んできました。彼らは授業や職場で苦労して得たフレームワークを持っており、そのフレームワークがそのままプロンプトとなったのです。「ソフトスキル」としてしばしば軽視される能力こそが、実は最も重要な「ハードスキル」だったことが判明しました。
全員が管理職となり、休むことを知らないエージェントの軍隊を率いる未来の仕事が具体的にどのようなものになるのかは私にはわかりません。しかし、成功する人々は、何が良質なものかを理解しており、それを AI であっても実行できるほど明確に説明できる人々だと私は推測しています。私の学生たちはこれをわずか四日で悟りました。彼らが AI ネイティブだったからではなく、すでに管理の仕方を知っていたからです。そのすべての訓練が、実は偶然にもまさにこの瞬間のために準備をさせていたことがわかりました。
購読する
共有する

原文を表示
I just taught an experimental class at the University of Pennsylvania where I challenged students to create a startup from scratch in four days. Most of the people in the class were in the executive MBA program, so they were taking classes while also working as doctors, managers, or leaders in a variety of large and small companies. Few had ever coded. I introduced them to Claude Code and Google Antigravity, which they needed to use to build a working prototype. But a prototype alone is not a startup, so they used ChatGPT, Claude, and Gemini to accelerate the idea generation, market research, competitive positioning, pitching, and financial modelling processes. I was curious how far they could get in such a short time. It turns out they got very far.

Examples of demos: Ticket Passport (a market for verified ticket sales) by Dee Sethmajhi, Jane Lian Wang, and Yue Ma. Revenue Resilience (Identifies at-risk revenue for small businesses and creates agentic solutions) by Whit Chiles, Jose Olivares, and Spencer Louie. Parenting companion (matching kid interests to activities) by Manoj Massand, Samuel Lee, and Harry Lu. Invive (blood sugar prediction) by Angela Argentati, Sabeen Chawla, and Adeel Rizwan. (There were lots of other great ones, but these teams gave me permission to share screenshots!)
I’ve been teaching entrepreneurship for a decade and a half, and I've seen thousands of startup ideas (some of which turned into large companies) so I have a good sense of the expectations for what a class of smart MBA students can accomplish. I would estimate that what I saw in a couple of days was an order of magnitude further along the path to a real startup than I had seen out of students working over a full semester before AI. Most of the prototypes were not just sample screens but actually had a core feature working. Ideas were far more diverse and interesting than usual. Market and customer analyses were insightful. It was really impressive. These were not yet working startups nor were they fully operational products (with a couple exceptions) — but they had shaved months and huge amounts of money and effort from the traditional process. And there was something else: most early startups need to pivot, changing direction as they learn more about what the market wants and what is technically possible. By lowering the costs of pivoting, it was much easier to explore the possibilities without being locked in or even explore multiple startups at once: you just tell the AI what you want.
I wish I could say this impressive output was the result of my brilliant teaching, but we don’t really have a great framework yet for how to use all these tools, the students largely figured it out on their own. It helped that they had some management and subject matter expertise because it turns out that the key to success was actually the last bit of the previous paragraph: telling the AI what you want. As AIs are increasingly capable of tasks that would take a human hours to do, and as evaluating those results becomes increasingly time consuming, the value of being good at delegation increases. But when should you delegate to AI?
The Equation of Agentic Work
We actually have an answer, but it is a bit complicated. Consider three factors: First, because of the Jagged Frontier of AI ability, you don’t reliably know what the AI will be good or bad at on complex tasks. Second, whether the AI is good or bad, it is definitely fast. It produces work in minutes that would take many hours for a human to do. Third, it is cheap (relative to professional wages), and it doesn’t mind if you generate multiple versions and throw most of them away.
These three factors mean that deciding to delegate to AI depends on three variables:
Human Baseline Time: how long the task would take you to do yourself
Probability of Success: how likely the AI is to produce an output that meets your bar on a given attempt
AI Process Time: how long it takes you to request, wait for, and evaluate an AI output

A useful mental model is that you’re trading off “doing the whole task” (Human Baseline Time) against “paying the overhead cost” (AI Process Time), possibly multiple times until you get something acceptable. The higher Probability of Success is, the fewer times you have to pay AI Process Time, and the more useful it is to turn things over to the AI. For example, consider a task that takes you an hour to do, but the AI can do it in minutes, though checking the answer takes thirty minutes. In that case, you should only give the work to the AI if Probability of Success is very high, otherwise you’ll spend more time generating and checking drafts than just doing it yourself. If the Human Baseline Time is 10 hours, though, it could be worth several hours of working with the AI, assuming that the AI can be made to do a competent job.

An example of a many hour Human Baseline Time prompt, with an initial AI Process Time of 30 minutes (when you can be doing something else) plus the time to check and write the prompt. If you have to make a lot of corrections, though, it isn’t worth it.
We know this equation works because this past summer, OpenAI released one of the more important papers on AI and real work, GDPval. I have discussed it before, but the key was that it pitted experienced human experts in diverse fields from finance to medicine to government against the latest AIs, with another set of experts working as judges. It took experts seven hours on average to do the work, so, in this case, that is the Human Baseline Time. The AI Process Time was interesting: the AI took only minutes for tasks, but it required an hour for experts to actually check the work, and, of course, prompts take time to write as well. As for Probability of Success, when GDPval first came out, judges gave human work the win the majority of the time, but, with the release of GPT-5.2, the balance shifted. GPT-5.2 Thinking and Pro models tied or beat human experts an average of 72% of the time.

Speed and cost improvements from AI-assisted work on GDPval tasks under a “draft → review → retry if needed” workflow (relative to unaided experts at 1×, 1×). The GPT‑5.2 point is a projection using its ~72% win-or-tie rate on GDPval; other model points are from the GDPval paper. Real‑world outcomes will vary sharply by task: some tasks are “easy wins,” some are clear failures, and the hardest cases are plausible‑looking failures.
We can now calculate how many hours you would save on a seven-hour task, assuming that 72% probability of success and an hour of evaluation. If you tried every task by taking the time to prompt the AI, evaluating the answer for an hour, and then doing it yourself if the AI answer was bad, you would save 3 hours on average. Tasks the AI failed on would take longer (you wasted time prompting and reviewing!) but tasks the AI succeeded on would be much faster. But we can change the equation even more in our favor using techniques from management!
Delegation as the new prompting
There are three things we can do to make delegating to AI more worthwhile by increasing the Probability of Success and lowering AI Process Time. We can give better instructions, setting clear goals that the AI can execute on with a higher chance of succeeding. We can get better at evaluation and feedback, so we need to make fewer attempts to get the AI to do the right thing. And we can make it easier to evaluate whether the AI is good or bad at a task without spending as much time. All of these factors are improved by subject matter expertise — an expert knows what instructions to give, they can better see when something goes wrong, and they are better at correcting it.

If you don’t need something specific, AI models have become incredibly capable of figuring out how to solve problems themselves. For example, I found Claude Code was able to generate an entire 1980s style adventure game with one prompt to "create an entirely original old-school Sierra style adventure game with EGA-like graphics. You should use your image agent to generate images and give me a parser. Make all puzzles interesting and solvable. Finish the game (it should take 10-15 minutes to play), don’t ask any questions. make it amazing and delightful." That’s it, the AI made everything, including the art. With two final prompts it tested the game and deployed it. You can play it yourself: enchanted-lighthouse-game.netlify.app

This is genuinely amazing, but that amazement is amplified because I didn’t need anything specific, just an adventure game that the AI was free to improvise. But real work, and real delegation, means that you have a specific output in mind, and that is where things can get tricky. How do you communicate your intention to the AI to execute on what you want, so it can use “judgement” to solve problems while still giving you the output you desire?
This problem existed long before AI and is so universal that every field has invented their own paperwork to solve it. Software developers write Product Requirements Documents. Film directors hand off shot lists. Architects create design intent documents. The Marines use Five Paragraph Orders (situation, mission, execution, administration, command). Consultants scope engagements with detailed deliverable specs. All of these documents work remarkably well as AI prompts for this new world of agentic work (and the AI can handle many pages of instructions at a time). The reason you can use so many formats to instruct AI is that all of these are really the same thing: attempts to get what’s in one person’s head into someone else’s actions.
When you look at what actually goes into good delegation documentation, it’s remarkably consistent: What are we trying to accomplish, and why? Where are the limits of the delegated authority? What does “done” look like? What specific outputs do I need? What interim outputs do I need to follow your progress? And what should you check before telling me you’re finished? If these are well-specified, the AI, like humans, is far more likely to do a good job.
And in figuring out how to give these instructions to the AI, it turns out you are basically reinventing management.
Managing Agents
I find it interesting to watch as some of the most well-known software developers at the major AI labs note how their jobs are changing from mostly programming to mostly management of AI agents. Coding has always had a very organized structure, with clearly verifiable outputs (the code either works or it doesn’t) so it has been one of the first areas where AI tools have matured, and thus the first profession to feel this change. It isn’t the last.

As a business school professor, I think many people have the skills they need, or can learn them, in order to work with AI agents - they are management 101 skills. If you can explain what you need, give effective feedback, and design ways of evaluating work, you are going to be able to work with agents. In many ways, at least in your area of expertise, it is much easier than trying to design clever prompts to help you get work done, as it is more like working with people. At the same time, management has always assumed scarcity: you delegate because you can’t do everything yourself, and because talent is limited and expensive. AI changes the equation. Now the “talent” is abundant and cheap. What’s scarce is knowing what to ask for.
This is why my students did so well. They weren’t AI experts. But they’d spent years learning how to scope problems in their fields of expertise, define deliverables, and recognize when a financial model or medical report was off. They had hard-earned frameworks from classes and jobs, and those frameworks became their prompts. The skills that are so often dismissed as “soft” turned out to be the hard ones.
I don’t know exactly what work looks like when everyone is a manager with an army of tireless agents. But I suspect the people who thrive will be the ones who know what good looks like — and can explain it clearly enough that even an AI can deliver it. My students figured this out in four days. Not because they were AI natives, but because they already knew how to manage. All that training, it turns out, was accidentally preparing them for exactly this moment.
Subscribe now
Share

関連記事
ストリーミング、Pandas、tiktoken を活用した NVIDIA Nemotron-Pretraining-Code-v3 メタデータからのコードデータセットパイプライン構築
MarkTechPost は、NVIDIA の大規模コード事前学習用データセット「Nemotron-Pretraining-Code-v3」のメタデータを対象に、フルダウンロードを避けてストリーミング処理し、Pandas と tiktoken を使用して分析可能なサンプルパイプラインを構築する手法を紹介している。
Anthropic の Fable 5 はワンクリックで奇妙に面白いビデオゲームを生成可能
AI 企業 Anthropic が発表した「Fable 5」は、ユーザーがボタンを1回押すだけで、独自の世界観を持つ面白おかしいビデオゲームを自動生成する機能を備えている。
開発者向け初のモデル「North Mini Code」の発表:Cohere が Hugging Face で紹介
AI 企業 Cohere は、Hugging Face Blog を通じて、開発者向けの専用モデルとして初めて「North Mini Code」を発表した。この新モデルは、コード生成や技術的タスクの支援を目的としている。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み