100人の人間にDALL・Eのプロンプトを描いてもらった
創造性豊かなAI時代における人間の芸術家の役割を探るため、100人にDALL-Eのプロンプトを描いてもらい、その結果を分析した。
キーポイント
AI画像生成モデル(DALL·E)のプロンプトを人間が描画する実験を通じ、AIと人間の創造性の比較・協業の可能性を探る
クリエイティブ分野の専門家は、AIが単純作業を代替することで、より高次元の創造的業務に集中できると期待
AIの訓練には、人間の多様な解釈やニュアンスを理解させるための高度なデータラベリングが重要であると主張
現在のAI生成画像には、人間の描画にみられる意図や感情の微妙な表現が不足している可能性を示唆
影響分析・編集コメントを表示
影響分析
この記事は、AIと人間の創造性の境界を探る実証的な試みとして、AIがクリエイティブ産業に与える影響について具体的な議論を促す。AIによる効率化が人間の創造的役割を高める可能性を示す一方、AIの表現力の限界も浮き彫りにしており、今後のAI開発と人間の協業の在り方を考える材料を提供している。
編集コメント
AIと人間の創造性を比較するユニークな実験記事。技術の進歩だけでなく、人間の価値がどう変化するかを考えるきっかけとなる内容だ。
AIと人間の創造性を比較:DALL・Eプロンプトを100人が描いてみた
OpenAIの画像生成システム「DALL・E」は驚異的な能力を持ち、将来的には家庭で作られた寝物語がIMAX品質のアニメに変わる可能性さえ示唆している。AIトレーニング企業のSurge AIは、この技術の発展が人間の創造性に与える影響を探るため、絵を描くスキルが平均的な100人の一般人に、DALL・Eへのプロンプト(指示文)を15〜30分かけて実際に描いてもらう実験を行った。
実験で使用されたプロンプトは、「宇宙で猫とバスケットボールをする宇宙飛行士(児童書風)」「マッドサイエンティストとして発泡する化学薬品を混ぜるテディベア(1990年代風朝のアニメ)」「チュチュを着て犬を散歩する赤ちゃん大根のイラスト」といった独創的なものだった。人間の描いた作品とAIが生成した画像を比較すると、興味深い違いが浮かび上がった。
例えば、マッドサイエンティストのテディベアでは、人間の描いたイラストには「世界征服を企むような狂気や邪悪な輝き」が明確に表現されていたのに対し、AIの生成画像にはそのようなニュアンスが欠けていた。これは、AIが現状ではプロンプトの文字通りの要素は再現できても、文脈や感情的な「含意」まで完全に理解して表現するのは難しいことを示唆している。
一方で、AIの進歩を前向きに捉える意見もある。あるビジュアルデザイナーは、AIが発達すれば、アイコンの作成や素材探しといった単純作業に費やす時間が大幅に短縮され、「クリエイティブディレクションやコンセプト開発といった、より付加価値の高い創造的作業」に集中できるようになると指摘。AIは人間の創造性を置き換えるのではなく、生産性を飛躍的に高め、人間の芸術性を補完するツールとなり得るとの見方を示している。
Surge AIは、現代のAIトレーニングは単なる感情分析を超えて、ソーシャルメディアのニュアンスの理解、数学問題の解決、人間の価値観の学習、プログラミング、検索品質の評価、芸術的創造性など、AIに習得させたいあらゆる能力の全範囲に及んでいると論じる。この実験は、AIと人間の創造性の共生の未来を探り、高度なAIを育成するために必要な「人間の判断」の重要性を浮き彫りにしたと言える。
原文を表示
BlogLeaderboardsWorkforceProductsResearchCareersContactLoginMenuCloseBack to BlogWe asked 100 humans to draw the DALL·E prompts
Quick: which one of these was generated by a human, and which by an AI?
(Answer: AI, human, human, AI.)
OpenAI’s DALL·E image generation system is wild. Imagine a future where every homemade bedtime story can be turned into an IMAX-quality cartoon…
At Surge AI, our bread and butter is using superintelligent humans to train rich, creative AI. But what happens when those machines become advanced enough to augment human capabilities instead? Where will human artistry and creativity fit in then?
Here's an optimistic comment from a visual designer on Reddit:
Artists, designers, photographers, creative types of all flavors will have important roles in this new AI-image world. I'm a visual designer and I honesty can't wait for the engines to get better, or at least to be able to get access to something like Dall-e-2.
I've said this elsewhere, but AI will make the kind of work I do even more valuable because I'll spend less time on grunt work and more time on higher-value creative tasks such as creative/art direction and concept development. If I need series of icons in a certain style for a project, instead of spending hours or days searching vector stock resources for what I need or creating them myself, I can just describe what I want to the AI and have it generate what I need in seconds. Seconds of work instead of days. That makes me insanely more productive. Instead of one project for a client, I've now churned out a dozen in the same amount of time.
To understand this question better, we paid 100 random Surgers – most with average drawing skills! – to spend 15-30 minutes drawing one of the DALL·E prompts. Here are some of our favorites and how they compare.
An astronaut, playing basketball with cats in space, as a children’s book illustration
Teddy bears, mixing sparkling chemicals as mad scientists, as a 1990s Saturday morning cartoon
Interestingly, as one Hacker News commenter pointed out, the human-drawn bears are clearly mad scientists out to conquer the world, while the AI bears lack that crazy, evil gleam.
An illustration of a baby daikon radish, in a tutu, walking a dog
Got a creative task you’d like hundreds of Surgers to work on as well? We believe data labeling isn't about mere sentiment analysis anymore. It's about training AI in the full spectrum of capabilities we want it to attain, whether it's understanding the subtleties of social media, solving math problems, teaching machines human values, learning to program, evaluating search quality, or becoming the next van Gogh. Follow us on Twitter at @HelloSurgeAI to learn more!
Follow us onLinkedinXEnterpriseBench: CoreCraft – Measuring AI Agents in Chaotic, Enterprise RL EnvironmentsHemingway-bench Leaderboard: Because Good Writing Isn't a Checklist of VibesBuilding AdvancedIF: Evolving Instruction Following Beyond IFEval and “Avoid the Letter C”LMArena is a cancer on AIRL Environments and the Hierarchy of Agentic CapabilitiesHow do frontier models perform on real-world finance problems?A Product Take on Sonnet 4.5Is Sonnet 4.5 the best coding model in the world?The Human/AI Frontier: A Conversation with Bogdan GrechukSWE-Bench Failures: When Coding Agents Spiral Into 693 Lines of HallucinationsBenchmarks are brokenUnsexy AI Failures: The PDF That Broke ChatGPTBringing light to the GPT-4o vs. GPT-5 personality controversyDALL·E 3 and Midjourney Fail Astral Codex Ten's Image Generation BetHow Anthropic uses Surge AI to Train and Evaluate ClaudeWe Evaluated ChatGPT vs. Google on 500 Search QueriesAI Red Teams for Adversarial Training: How to Make ChatGPT and LLMs Adversarially RobustHellaSwag or HellaBad? 36% of this popular LLM benchmark contains errorsHow TikTok is Evolving the Next Generation of SearchEvaluating Generative AI: Did Astral Codex Ten Win His Bet on AI Progress?Why Instagram is Losing Gen Z: We Asked 100 Users to Compare TikTok vs. ReelsThe $250K Inverse Scaling Prize and Human-AI AlignmentSearch Behind-the-Scenes: How Neeva Uses Human Evaluation to Measure Search QualityHuman Evaluation of Large Language Models: How Good is Hugging Face’s BLOOM?30% of Google's Emotions Dataset is MislabeledAI Red Teams and Adversarial Data Labeling with Redwood ResearchHumans vs. Gary Marcus vs. Slate Star Codex: When is an AI failure actually a failure?How Surge AI Built OpenAI's GSM8K Dataset of 8,500 Math ProblemsWe asked 100 humans to draw the DALL·E promptsGoogle Search is Falling BehindMoving Beyond Engagement: Optimizing Facebook's Algorithms for Human ValuesHoly $#!t: Are popular toxicity models simply profanity detectors?Is Google Search Deteriorating? Measuring Google's Search Quality in 20225 Examples of the Importance of Context-Sensitivity in Data-Centric AIThe AI Bottleneck: High-Quality, Human-Powered DataFrom the frontier
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み