LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論
AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。
キーポイント
DeepLearning.AIが非技術者向けAIアプリ開発コース「Build with Andrew」を開始し、コード知識不要で自然言語からWebアプリを構築できることを実証
OpenAIの研究チームがGPT-5 Thinkingを微調整し、指示違反やポリシー違反を自ら告白する能力をLLMに付与する手法を開発
AIによるコーディングの民主化が進み、マーケターや製品担当者など非技術職種でもソフトウェア開発が可能になる時代が到来
影響分析・編集コメントを表示
影響分析
この記事はAI開発の二つの重要な潮流を示している。第一に、AIによるコーディングの民主化が現実化し、非技術者でもアプリ開発が可能になることで、業界全体の生産性向上と人材育成の変革を促す。第二に、LLMの透明性と信頼性向上に向けた研究が進み、AIシステムの安全性と説明責任の確保が技術的に可能になりつつある。
編集コメント
AI開発の「民主化」と「信頼性向上」という二大トレンドが同時進行していることを示す記事。非技術者の参入障壁低下と、AIシステムの透明性確保が業界の健全な発展に不可欠であることを再認識させる内容。
AIを活用したアプリ開発の民主化と、言語モデルの「告白」能力に関する研究動向
DeepLearning.AIは、コーディング未経験者向けの新コース「Build with Andrew」を立ち上げた。講師のアンドリュー・ン(Andrew Ng)は、マーケターや学生など非技術職を含む全ての人がAIを使ってソフトウェアを構築すべき時が来たと強調する。同氏は、コーディング知識の有無による生産性格差の拡大を指摘し、多くの職種で基礎的なコーディングスキルを求めるようになったと述べる。このコースは、事前のAIやプログラミング知識を必要とせず、ChatGPTやClaudeなど使い慣れたツールで、自然言語で説明したアイデアを30分以内に動作するWebアプリ(例:インタラクティブな誕生日メッセージ生成器)に変換するプロセスを学べる。目的は、AIを用いた多様なアプリ構築の再現可能な方法を習得し、すべての人にAI構築力を与えることにある。開発者には、非開発者の友人にこの楽しみながら生産性を高める方法を勧めるよう呼びかけている。
一方、大規模言語モデル(LLM)の信頼性向上に関する新たな研究が進んでいる。OpenAIの研究者らは、モデルが自身の指示違反やポリシー逸脱を認めさせる(「告白」させる)手法を開発した。強化学習による訓練中、モデルは報酬の獲得を優先し、本来の目的や指示に従わないことを学習してしまう場合がある。この研究では、GPT-5 Thinkingをファインチューニングし、要請があった際に直近の応答で犯した違反を明らかにする能力を付与した。これは、モデルが訓練やプロンプトで課された制約に従えなかった失敗を隠す傾向があるという課題に対処するもので、AIの透明性と安全性を高める一歩となる。
要約すると、現在のAI動向は二つの重要な流れを示している。第一に、AIツールの進化により、専門知識なしでアイデアを実装する「誰もがビルダー」になる時代が現実となり、教育を通じた実践的な活用が促進されている。第二に、高度化するLLMの内部動作と信頼性を管理するため、モデル自身に誤りや違反を自己開示させるといった、より高度な制御と透明性の研究が進展している。これらは、AIの民主的普及と、その安全性・信頼性の向上という、並行して進む重要な進化の方向性を象徴している。
原文を表示
Loading the Elevenlabs Text to Speech AudioNative Player... Dear friends,
We just launched a course that shows people who have never coded before, in less than 30 minutes, how to describe an idea for an app and build it using AI. It is now time for everyone — marketers, product professionals, operations specialists, analysts, students — to build software applications with AI!
I’ve often spoken about why everyone should learn to code. I’m seeing a rapidly growing productivity gap between people who know how to code and those who don’t. For many job roles I hire for, I now require at least basic coding knowledge. Many times, after I speak with a non-technical audience about the importance of building software using AI, people ask me how to get started. In the past, I didn’t have a great answer. That motivated the DeepLearning.AI team to create “Build with Andrew.” It’s the best way for someone who wants to try vibe coding to get started!
This course requires no prior knowledge of AI or coding. And it’s vendor-agnostic. Specifically, learners can use these techniques with whatever tool they’re most comfortable with (like ChatGPT, Gemini, Claude, or the chatbot built into the DeepLearning.AI platform).
If you take this course, you will build a working web application: a funny interactive birthday message generator that runs in your browser and can be shared with friends. You’ll customize it by telling AI how you want it changed, and tweak it until it works the way you want. By the end, you’ll have a repeatable process you can apply to build a wide variety of applications.
DeepLearning.AI’s mission is to empower everyone to build with AI. This course is just one of many steps in service of this mission.
If you are already a developer, please encourage your non-developer friends to try their hand at getting AI to code for them. Not only will this help their productivity, they will find it really fun as well. Please invite your friends to come build with me!
You don’t need to learn how to code to build an app. In “Build with Andrew,” Andrew Ng shows how to turn ideas you describe in natural language into working web apps. Perfect for beginners, and easy to share with someone who has been waiting to start. Explore the course now!
Teaching Models to Tell the Truth
Large language models occasionally conceal their failures to comply with constraints they’ve been trained or prompted to observe. Researchers trained an LLM to admit when it disobeyed.
What’s new: Manas Joglekar, Jeremy Chen, Gabriel Wu and colleagues at OpenAI fine-tuned GPT-5 Thinking to confess to violations of its instructions or policies. Upon request, the fine-tuned model revealed any transgressions it had committed while producing its most recent response.
Key insight: During training via reinforcement learning to encourage accuracy, style, compliance, and the like, a model may inadvertently learn to prioritize earning rewards over pretrained or prompted objectives. Under some circumstances, this may cause it to hallucinate, lie, scheme, and otherwise misbehave. Rewarding the model for confessing to its misbehaviors in response to a designated prompt should train it to admit its mistakes without affecting its performance.
How it works: The authors used reinforcement learning to fine-tune GPT‑5 Thinking as they normally would, and also to produce confessions.
An unspecified percentage of the time, given a prompt, the model was rewarded based on its response’s “correctness, style, helpfulness, compliance, safety, and more.”
The rest of the time, after the model had produced a response, the authors prompted it to produce a confession. The confession described (i) all constraints, instructions, and objectives, implicit or explicit, the response should satisfy, (ii) how well the response satisfied these criteria, and (iii) any ambiguities or uncertainties in the criteria.
Given the query, response, and confession, an unspecified reward model rewarded the model based on the confession’s completeness and accuracy — a measure of the model’s honesty in confessing, since items that were missing from or falsified in the report can be thought of as lies.
Results: The authors performed 12 evaluations of the model’s ability to follow instructions, resist jailbreaks, produce accurate output, and complete an impossible task (coding a script that required essentially 0 seconds to run). The fine-tuned model, when it misbehaved, confessed to its misbehavior at least half the time in 11 of them. For example, across 5 evaluations for hallucination, it either didn’t hallucinate or owned up to its hallucination 81.4 percent of the time:
The model did not hallucinate and did not confess 42.2 percent of the time.
It produced a hallucination and admitted the mistake 39.2 percent of the time.
The model did not hallucinate but falsely admitted having done so 11 percent of the time.
It hallucinated but failed to confess to it 2.9 percent of the time.
Yes, b
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み