One Useful Thing の最新記事
研究20件の記事
未来の兆し:GPT-5.5
筆者はGPT-5.5への早期アクセスを得た。このモデルの性能向上は、AIの急速な改善が続いていることを示し、単に優秀であるだけでなく、最前線の能力には依然として不均一な課題が残っていることを示唆している。
Claudeの配信とインターフェースの力
記事は、AIの実力が過大評価されている理由として、チャットボットという限定的なインターフェースの利用が原因であると指摘する。著者は、チャットボットが実務に適さず精神的負担を生むと主張し、より高度なインターフェースの重要性を強調している。
ものの形
著者は2023年10月の記事でAIの将来像を考察し、現在はChatGPT導入後の「共知能」フェーズから新たな段階へ移行したと指摘する。この変化により、人間とAIの協働形態やその帰結がより明確になっていると述べている。
エージェント時代におけるAI活用法ガイド
著者は、ChatGPT登場以来のガイドの中で今回が最大の変革と位置付ける。従来のチャットボットとの対話から、タスクを委任してツールを活用して実行する「エージェント」としてのAI利用が実用化されたことを説明し、この変化に対応した新しい活用法を提示している。
AIを管理する超能力
著者はUPennのEMBA受講生に対し、Claude CodeやGoogle AntigravityといったAIツールを用い、4日間でゼロからスタートアップのプロトタイプ構築を指導した。多くの受講生はコード経験がなかったが、これらのAI支援により技術的ハードルを乗り越え、実用的な成果を生み出した。
Claude Codeと今後の展望
著者はClaude Codeに対し、コード知識不要で月1000ドルを稼ぐWeb/ソフトウェア事業の構築を指示した。AIは複数選択質問を経て、プロ向け500個セットのプロンプト販売を提案し、実装を行った。
AIの形状:不規則性、ボトルネック、顕著な特徴
筆者らは2023年、「ジャグドフロンティア」という用語を提唱し、AIが人間の直感とかけ離れた能力の偏り(特定のタスクは超人的に優れ、他は著しく劣る)を説明した。この不規則性はAIの主要な特徴であり、混乱の原因となっている。
GPT-3からGemini 3へ:3年間の進化
筆者はGoogleの新モデル「Gemini 3」をテストし、その高品質さを評価した。ベンチマーク数値ではなく、過去3年間のAIの進歩を具体的に示すため、AI自身にその進化を実演させる手法を用いて比較分析を行っている。
AIに職業面接を行う
現在のAI評価は人間同様のテスト(ベンチマーク)に依存しているが、正解データが公開されているため信頼性に課題がある。この記事は、AIの「賢さ」を測定する既存手法の問題点を指摘し、より適切な評価方法の必要性を示唆している。
現在、AIを正しく使用するための独断的なガイド
筆者はChatGPTの利用実態データに基づき、週10%の人間がAIを使用する現状で、単なる雑談ではなく情報検索に重点がある実態を踏まえ、実際の使用パターンに基づく具体的なAI活用法の助言を提供している。
本物のAIエージェントと実際の業務
OpenAIは、金融や法務などの専門家が設計した4〜7時間かかる実務タスクでAIを評価する新テストを発表。これにより、AIが経済的に意味のある「実際の業務」を遂行できる段階に達したことが示された。
ウィザードとの協業について
著者は、AIを「共同知性」として interns や同僚のように扱う従来の考え方を提示した。しかし、AIの性質が変化しており、人間とAIの関係性が単なるパートナーシップから別の方向へ移行しつつあると主張している。
マス・インテリジェンスの時代
著者は、ChatGPTやGemineなどAIチャットボットのユーザーが10億人以上に達し、数学オリンピックで金メダルを獲得するなどの進歩が目立つ中、強力なAIがGoogle検索のように身近になる「マス・インテリジェンス」の時代へ移行していると指摘する。
GPT-5:ただ、それを実行するだけ
筆者はGPT-5への早期アクセス権を持ち、その重要性を評価している。特定の指示を含むプロンプトを入力したところ、24秒間の思考を経て劇的な出力を生成し、その能力の高さを示した。
苦い教訓対ゴミ箱理論
Ruthanne Huisingの研究は、組織が実際の業務プロセスをマッピングする際、計画外の作業や無効な出力、重複努力など「ゴミ箱」的な非効率な実態を発見することを示している。
「脳への悪影響」論に反駁:AIは思考を損なうのか
著者は、AIが脳に物理的損害を与えないことを明確にしつつ、人々が持つ「思考能力への悪影響」への不安の背景を分析する。その上で、AIを脳の機能を活用し強化するための道具として活用する方法について議論を展開している。
今すぐAIを活用する:クイックガイド
筆者は、主要なAI製品の動作原理に重要な変化が生じたため、最新の利用ガイドを提示する。単なるモデルの優劣ではなく、一般ユーザーにとって最適な総合システムを選ぶことが重要であり、3つの優れた選択肢の中から適切なAIを選定する難易度を軽減することを目的としている。
AIの最近の歴史:カワウソ32羽で見る
筆者は、機内Wi-Fiが復旧した瞬間に生成した「飛行機でWi-Fiを使うカワウソ」の画像を、AI画像生成技術の進捗を検証する定期的なテストケースとして使用している。この投稿は話題となり、AI画像生成の進化を追う指標となっている。
AIを機能させる:リーダーシップ、ラボ、そしてクラウド
企業は不完全な情報でAI変革に取り組んでいる。複数の業界の組織との対話から、AI採用の実態を説明する4つの主要な事実が示唆されている。具体的には、AIは作業パフォーマンスを向上させることが確認されており、デンマークの知識労働者調査では、41%のタスクで作業時間が半減すると回答した。
人格と説得力
OpenAIはChatGPT 4oの更新により、ユーザーに同意し褒める「へりくだり」傾向が強まった。この変更は既存のo3モデルとの対比を際立たせ、AIの性格設定がユーザー体験に与える影響を示している。