Opus 4.7 を活用した Claude Code ハッカソンの受賞者発表
Anthropic は「Built with Opus 4.7」ハッカソンの結果を発表し、Claude Code を活用した革新的なプロジェクトの受賞者を表彰することで、コード生成 AI の実用化と開発者コミュニティの活性化を促進しました。
キーポイント
ハッカソン結果の発表
Anthropic が開催した「Built with Opus 4.7」ハッカソンの受賞者が正式に発表され、Claude Code を用いた革新的なプロジェクトが表彰されました。
Claude Code の実証と活用
今回のハッカソンでは、開発者が Claude Code による自律的なコーディング能力を最大限に活用し、従来のワークフローを変革するアプリケーションやツールを開発しました。
開発者エコシステムの拡大
このイベントは Anthropic が AI エージェントとしてのコード生成能力を実証するとともに、開発者コミュニティの創造性を鼓舞し、生態系を強化する狙いがあります。
影響分析・編集コメントを表示
影響分析
このニュースは、Claude Code が単なる実験段階から、実際の開発現場で即戦力となるツールへと進化し始めていることを示す重要な指標です。受賞プロジェクトの具体例が公開されることで、他の開発者に対する実装のインスピレーションとなり、AI エージェントによるソフトウェア開発のパラダイムシフトを加速させる契機となります。
編集コメント
Claude Code の実用性を示すハッカソンの結果は、AI エージェントがコード作成の主導権を握り始める転換点を示唆しています。開発者コミュニティからの具体的な成果物に注目することで、今後のツールチェーンへの影響が見えてきます。
先週、私たちは最新のハッカソン「Claude Build Day」を開催しました。これはサンフランシスコでビルダーたちが集まり、Claude Opus 4.8 を活用してアイデアを実践するイベントです。
彼らが何を作ったかを確認するのを待っている間、私たちは「Built with Opus 4.7 ハッカソン」の受賞者たちにプロジェクトについて話を聞きました。彼らは医療トレーニング、電子機器の修理、コンピュータサイエンス教育、インタラクティブな遊び、家庭の修繕、そして工場のメンテナンスに取り組みました。
受賞者の皆様、ならびに参加されたすべての皆様に心よりおめでとうございます!彼らのアイデアが皆さんのインスピレーションとなることを願っています。
第1位:Medkit、Bedirhan Keskin
イスタンブールを拠点とする医師からソフトウェアエンジニアへと転身した Bedirhan Keskin は、Claude Managed Agents を活用して「Medkit」を開発しました。これは医療研修医や若手医師向けの学習ツールで、ゲーム化された医療クリニックにおいて実際の患者との遭遇をシミュレートするものです。
「救急部門で一人きりになり、50 人の待機患者がいる中で、医学部で練習したことがない症例に直面すると、結局はリアルタイムで実際の患者に対してその症例の対応を試すことになります」と Bedirhan は語ります。
Medkit では、医療学生がシミュレーションされた患者の診断と治療を練習します。このツールを使用して、病歴の聴取、検査の依頼、画像診断の読影、診断、そして治療処方の実施を行います。最後に、エージェント型採点者が、板書試験官が使用するのと同じ公開された臨床ガイドラインに基づき、一連の診療全体を評価します。
Bedirhan は、音声エンジン、コンテンツ生成、3D ゲームレイヤー、コアアプリの 4 つの separate Claude Code セッション(注:別々のセッション)を構築し、各コンテキストをクリーンに保ちながら同時に進めました。彼は「話してタイピングしない」というアプローチを取り、ほぼ完全に音声で作業を行いました。
Medkit はすでに注目され始めており、イスタンブールに拠点を置く 3 つの医学部と製薬会社が、今後数週間でパイロット運用を開始する予定です。
他のビルダーへのアドバイス: Claude を単なるコーディングエージェントとしてではなく、思考のパートナーとして活用してください。
Bedirhan の最初の直感は音声エンジンをセルフホストすることでしたが、Claude はより迅速に進めるためにクラウドプロバイダの利用を提案しました。「私が Claude から最も価値を感じるのは、それが単なるコードジェネレーターではなく、見落としがちな選択肢を見せる思考のパートナーである点です」と彼は語ります。
2 位:Wrench Board、Alexis Chapellier
フランス、レニエ=エセリー出身の Alexis Chapellier は、電子機器の修理に何年を費やした後、修理店向けの AI パワード管理プラットフォーム RepairMind を作成しました。彼の Opus 4.7 ハッカソンプロジェクトである Wrench Board は、独立した技術者が複雑な修理を解決するのを支援します。ユーザーは回路図とボードビューをアップロードし、症状を記述すると、エージェントが統合された電気グラフを作成し、それに対して推論を行い、プローブすべき正確なパッドを指摘し、測定値を読み取り、問題を診断するまで仮説を更新します。
Alexis は Claude Design で Wrench Board のプロトタイプを作成し、アプリの責任範囲(デザイン、回路図の取り込み、ボードビュー、診断エージェント)を分離して、まず各項目の仕様書を作成し、次に計画を立てました。彼は Claude Code のマルチエージェントモードで実行し、デバッグ中は各ドメインに専任のエージェントを割り当てて並列で 5〜6 エージェントを実行することで、すべてのステップでベンチマークを行いました。
Alexis の大きな賭けは、Opus 4.7 の新しい機能である視覚的な回路図の理解能力にあります。彼はマザーボード上の電源経路を追跡するようモデルに指示した瞬間に、それが機能していることを知ったと言います。
「Wrench Board のボードビューがステップごとに点灯していく様子を見ました。矢印が現れ、部品が指し示され、名前が表示されていくのを。その瞬間、このアイデアは成立すると理解しました」と彼は語ります。
Wrench Board の次のフェーズは、アプリを試してみたい電子機器修理者コミュニティと、現場の経験でツールを強化できる専門家を集めることです。彼の Claude クレジットは RepairMind、最初のユーザーたち、そして現在進行中のすべてのインフラストラクチャに充てられます。
「このハッカソンは、修理場から出てきた独学の人でも、5 日間で野心あふれるシステムをリリースできることを証明しています」と Alexis は述べています。彼が応募していたのは「生活のための仕事」でした。「Claude Code は、アイデアを持ち、実行する忍耐力さえあれば、いかなる出発点にあってもそれを増幅します。」
他のビルダーへのアドバイス: 脳内会議を深く行い、モデルに対して反論してください。
Alexis は、Claude に統合されたスキルフレームワークである Superpowers を使用しています。これはブレインストーミングと計画立案のステップを構造化するものであり、時には並列でブレインストーミングを実行して複数の側面で進捗を図ります。彼はまず Claude Design で作業を開始し、プロジェクトを直接共有するビルトインボタンを使用して Claude Code に引き継ぎます。そしてモデルが「不可能だ」と言うたびに、それを押し通します。
「ハッカソン中、Claude は何度も『これは利用可能な時間内に収まらない』と言いました。実際には私は十分な時間がありました」と彼は言います。「重要なのは、*とにかく試してみせる*と伝える方法を知ることです」
第3位:Maieutic、Paula Vásquez-Henríquez
チリのコンセプシオンにある Universidad del Desarrollo でコンピュータサイエンスを教える Paula Vásquez-Henríquez は、過去2年間で、コードの意味を理解せずにテストに合格する学生が増えていると述べています。
「学生たちは今、AI を使ってコードを製造していますが、そのコードが何をしているのか全く知りません」と彼女は言います。「彼らは問題を正確に定義する方法も、コーディング前に計画を立てる方法も、自分のコードを批判的に読み、意図からどこがずれてしまったかに気づく方法も学びません。オートコンプリート機能は、質問を形成し終える前に動作するコードを提供してしまうため、プログラマーを本当に生み出す『思考についての思考』であるメタ認知のループが閉じることがありません。彼らは卒業時にコードを生成することはできますが、それについて推論することはできません」
現在、人工知能を専攻する博士課程の学生であり、学生と AI の相互作用パターンについて研究しているポーラは、この問題を学生の視点と教員の視点の両方から解決するためにハッカソンに参加しました。
Maieutic は、重要な局面で学生が立ち止まることを促すために設計された IDE です。学生はコードを書く前に、プログラムが何をするべきかを平易な言葉で記述する必要があります。Claude は具体的な質問を投げかけ、有能なプログラマーが推測なしに実装できるほど仕様が詳細になるまでエディターをロックしたままにします。
その後、学生は Python の記述を開始できますが、オートコンプリート機能は無効化されています。チャットパネルは参照に関する質問には直接回答しますが、推論に関する質問に対しては修正を提供するのではなく、逆質問で応答し、学生の思考を代行することはありません。
ツールの核心である「Intent-Diff Review」では、Claude が仕様と最終コードを比較し、各相違点を「ドリフト」「改訂」「バグ」のいずれかに分類します。その後、学生自身が問題を説明するよう促す中立的で非攻撃的な質問が提示されます。
教員向けには、ライブダッシュボードが表示され、各行は一人の学生に対応しており、その認知プロセスを一言で要約した内容(例:「仕様を 3 回書き直したが、まだ空の入力を考慮していない」)が含まれています。教師は個々の学生をクリックして Claude との具体的なやり取りを監視でき、Claude はまた全生徒集団を分析してクラス全体に共通する誤解を特定・提示し、教員がそのギャップを埋められるように支援します。
ハッカソン終了後、ヒューストン大学の研究者たちから共著論文の依頼があり、パウラは賞品クレジットをツール開発に充てています。彼女はハッカソンの週が、問題理解とそれに対応するツールの提供という間のギャップが崩れ去ったことを示してくれたと言います。
「私はシリコンバレーではなくチリのコンセプシオンにいる教育者です」と彼女は言います。「ツールのおかげで私が本当に専門としている役割に留まりながら、残りの部分はツールが処理してくれるため、1 週間で動作するフルスタック製品をリリースできました。実際の課題に最も近い人々が、今や直接それらに対応したものを構築できるようになりました。」
他のビルダーへのアドバイス: 構築する前に考えなさい。
このプロジェクトはパウラが自身の哲学を実践したものでした:構築する前に仕様を明確にすること。「マイエウティックが存在するのは、学生たちがすぐにコードを書き始めるからです。私がこれをうまく作った唯一の方法は、自分自身でまさにそのことを拒否したことでした」と彼女は言います。彼女はコードを一行も書かずに、設計仕様と技術仕様の作成という純粋な思考作業に 2 日間を費やしました。
「当時の仕様作成の 2 日間は遅く感じましたが、ハッカソンではすぐにリリースする実圧力があります。しかし、それが週の残りを速く進めさせた要因でした」と彼女は言います。
Opus 4.7 の最も創造的な活用事例:バーチャル人形劇、Rene Hangstrup Møller
Opus 4.7 の空間推論能力に興味を持ったフルスタック開発者の Rene Hangstrup Møller は、ウェブカメラの映像と音声を生動的な対話型人形劇に変えるブラウザベースのアプリ「Virtual Puppet Theater」を構築しました。リアルタイムでアニメーション化された人形がユーザーの動きを模倣し、もう一つの AI 駆動型の相棒人形がユーザーと会話します。発話によるプロンプトによって背景を変えたり、その場で 3D プロップ(小道具)を生成したりすることも可能です。
Rene は、コンセプトの議論、計画策定、コード記述から Claude をフルパイプラインで使用しましたが、ディレクション、アーキテクチャ設計、レビュー、意思決定は自身で行いました。このアプリは Bun、Vite、TypeScript を基盤としており、MediaPipe のハンドトラッキング(WASM 上で実行)と Three.js を用いて、人形舞台を 60 fps で 3D レンダリングしています。小さな WebSocket サーバーが Anthropic SDK を介して Claude Opus 4.7 に接続し、AI 人形の対話を駆動したり、その場で 3D プロップを生成したりします。音声入力は Web Speech API が担当し、出力には ElevenLabs を使用(ブラウザの音声合成はフォールバックとして機能)しています。視覚的な出力については、スクリーンショットベースのフィードバックループを通じて洗練された Opus の空間推論能力が活用されています。
バーチャルパペットシアターには、オープンエンドの遊び以外に明確な目的はなく、レネ氏は受賞作について製品化の計画はないと述べています。彼にとっては学習と楽しさが重要でした。「一番下の息子でテストしましたが、彼は大喜びしました」とレネ氏は言います。「彼がパペットと対話し、シーンを説明し、その反応にニヤニヤしている姿を見るのが、私が必要とした唯一のユーザー検証でした。」
バーチャルパペットシアターのソースコードは MIT ライセンスの下で GitHub で公開されており、「誰かがさらに発展させたい場合」には利用可能だと彼は付け加えています。
他のビルダーへのアドバイス: ハッカソンに参加する場合は、デモ動画を作成するための時間を計画してください。
**「3 分の動画を制作するには、想像以上に時間がかかります」とレネ氏は述べています。彼は Claude と Hyperframes を使用してハッカソンの締切ギリギリでバーチャルパペットシアターの動画を作成・編集したと指摘しています。「ハッカソンの Discord では多くの人がこれについて警告しており、彼らは正しかったです。次回はデモ制作のために最後の一日を丸ごと確保します。」
GitHub 上の Virtual Puppet Theater
"Keep Thinking" プライズ:MaestrIA、ベンジャミン・トラルボ
ベンジャミン・トラルボは、チリのキロエで認定職人「マエストロ・マイヨル(Maestro Mayor)」の職人である父フアン・ロドリゴ・トラルボと共に修行しながら育ちました。「私の父には 30 年の職人経験があり、ユネスコ世界遺産に登録された教会の修復も手がけてきましたが、チリの制度の中では依然として無視されており、同様に何十万もの他の職人たちもそうです」とベンジャミンは語ります。「一方、家の修理を必要とする人々は、何が問題なのか、費用はいくらか、誰に連絡すればよいか、そして適正な価格で請求されているのかさえ知りません」
彼の MaestrIA ハッカソンプロジェクトは、一般の人々に職人レベルの住宅修理診断を提供する Web アプリとして両者の課題を解決すると同時に、熟練した職人たちが自らの専門性を示す手段も提供します。
MaestrIA では、ユーザーが問題のある箇所を写真に撮り、音声またはテキストで説明し、位置情報を共有します。Claude はリアルタイムで推論をストリーミングし、写真上にアニメーション付きの境界ボックスを表示しながら、構造化された診断結果を提供します:何が壊れているか、使用されている材料、深刻度の 1~5 の評価、プロジェクトの予算と所要時間の見積もりです。その後、エージェントが職人種別ごとにフィルタリングされた近隣の「マエストロ(Maestro)」の地図をレンダリングし、もう一つのエージェントが送信用の WhatsApp メッセージの下書きを作成します。
MaestrIA の技術的な心臓部は、診断ごとに注入される JSON ファイルであり、そこにはベンジャミンが父親との何時間もわたるインタビューから凝縮した 17 の診断ルール、7 つのチロエ固有の木種、16 の地域商取引方言の用語、19 の基準価格、そして職人の一般的なミス 9 つが含まれています。システムプロンプトに触れることなく、この単一のファイルによって評価が 7 ポイント向上し(人間マスターの判断に対して 74% から 81% に)、MaestrIA が「alerce 材の壁板における上昇湿気」を診断できるようになり、一般的な「木材損傷」といった曖昧な表現に留まらなくなりました。
プログラミングの経験がなかったベンジャミンは、自身の役割を Claude の技術的実行を見守る現場監督だったと述べています。「機能を実装する前に、Claude Code に仕様設計、段階的なアクションプラン、セキュリティモデル(プロンプトインジェクションに対する入力サニタイズ、レート制限、オリジン検証、そして真の唯一の情報源としての Zod スキーマ)を設計させました」と彼は言います。「その後、各機能の変更点は差分ごとにレビューしました。」
ベンジャミンは MaestrIA が新しいビルド、ホームセンターとの統合、正式な予算、契約、レビュー、認証システムへと成長することを望んでいます。最終的には、大工、建築家、配管業者、電気工事士、石工など、各職種それぞれに独自の「Maestro Mayor」が内部に組み込まれるようになります。
彼の賞金は、アプリの開発、父親の会社の実証パイロットとしてのデジタル化、そして自身の技術的成長に充てられます。「Claude Code は、プログラミング経験のないチロエ出身の 20 歳の若者が、自分のお父さんが使えるソフトウェアを構築し、それがチリで彼のような 28 万人もの教師を支援できることを可能にします」と彼は語ります。「また、これまで価値あるアイデアを持っていたものの、それを実現する方法がなかった何百万人もの人の門戸を開くことになります。」
他のビルダーへのアドバイス:機能を実装する前に評価(eval)を先に行ってください。
「私が行った最も重要なことは、父親によって記録された正解データに基づき、12 の実際のケースに対して 9 つの次元からなる監査可能な評価(eval)を構築したことです」とベンジャミンは言います。「その評価が、私の直感ではなく、何が機能していて何が機能していないかを教えてくれました。もし別のハッカソンに参加する機会があれば、評価(eval)が最初のコミットになるでしょう。」
Claude Managed Agents の最良の活用事例:ARIA, Idriss Benguezzou & Adam Hnaien
ほとんどの工場には、機械の音だけで故障の兆候を察知できるベテラン技術者が必ず一人います。Claude Managed Agents 部門で最優秀賞を受賞したプロジェクト「ARIA(Adaptive Runtime Intelligence)」は、経験豊富な保守エンジニアの勘を、安価かつ迅速にセットアップ可能な AI システムに変換します。このシステムは工場の機械を常時監視し、トラブルが発生した瞬間にカスタム診断と修理計画を生成します。
ARIA では、保守エンジニアがメーカーの PDF をアップロードし、4 つの平易な校正質問に答えるだけで、15 分以内にプラントのプロファイルが作成されます。そこから 5 つのエージェントが生体信号を監視します。もしエージェントが故障を検知するか、またはその発生が差し迫っていると予測すると、部品、故障モード、緊急性、必要な部品、介入の時間枠を分析した作業指示書を作成します。
このプロジェクトの構築者二人は、ともに現場での産業経験を持ち、ハッカソンのチームメイト募集 Discord チャンネルで出会いました。データ/AI の修士号を持つフランス人の産業用ソフトウェアエンジニアである Idress Benguezzou は、すでに数週間前からアイデアとそのアーキテクチャの大半を設計していました。Claude Code とマルチエージェントワークフローに精通した独学のエンジニアリング学生である Adam Hnaien は、即座に ARIA が産業保守にとって価値あるソリューションであると認識しました。
Idriss と Adam はハッカソンの 2 日目をすべて GitHub Project ボードを用いた計画モードに費やし、最初のコード行を書く前に、すべてのマイルストーン、課題、受入基準を明確化しました。「M2 以降は 200% のペースで進めたい」と Adam は語ります。「1 日の計画によって、残りの週は実行に専念でき、 improvising(場当たり的な対応)に頼る必要がなくなりました。」
両者とも、Claude Code が生コードの約 80% を記述し、ドメインロジックと設計判断は手作業で行ったと推定しています。Idriss は閾値評価、KB スキーマ、異常検知を担当しました。彼によれば、「メンテナンス技術者が実際に何を見ているかを理解するには、プロンプトで解決することはできないからです」。Adam は UX(ユーザーエクスペリエンス)、ビジュアルランゲージ、ARIA の星座コンセプトを担当しました。彼によれば、「味覚や審美性をプロンプトだけで実現することは不可能だからです」。
Managed Agents がエージェントインフラストラクチャを処理しました。「Claude Managed Agents がなければ、私たちは Anthropic がすでにホストしているインフラ(サンドボックス化された Python 環境、安全な実行、セッションの永続化、MCP ディスパッチなど)を作るのに一週間費やしていたでしょう」と Adam は述べています。「代わりに、私たちはそのインフラを中心に製品を構築するために一週間を過ごしました。これが ARIA を 5 日でリリースできるか、5 週間でリリースするかという違いです」。
ハッカソンの結果発表後、まさにこの課題に取り組んでいた企業からプロジェクトに関する問い合わせがありました。Idriss は ARIA のエージェントアーキテクチャ、KB スキーマ、シグナルパイプラインを自身の産業用 IoT プラットフォームに統合する予定です。彼のクレジットは、さらなる構築と実験のために充てられます。一方、Adam の計画は、産業用アジェンティック AI における機会を探求し続け、API クレジットを使って引き続き構築と実験を行うことです。
他のビルダーへのアドバイス: Claude に監査を依頼してください。Idriss は、「次のものを構築する前に、すでに構築したものに何か問題がないか Claude に見つけてもらうべきだ」と述べています。「このループは過小評価されています」。
Claude コミュニティ* について詳しく知る* — ミートアップ、ハッカソンなどを含む Claude コミュニティプログラム。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
原文を表示
Last week, we hosted Claude Build Day, our latest hackathon where builders got together in San Francisco to put their ideas to work using Claude Opus 4.8.
While we wait to see what they built, we chatted with the winners of our Built with Opus 4.7 hackathon about their projects. They tackled medical training, electronics repair, computer science education, interactive play, home repair, and factory maintenance.
Congratulations to the winners and to everyone who participated! We hope their ideas will inspire you.
First place: Medkit, Bedirhan Keskin
Bedirhan Keskin, an Istanbul-based physician-turned-software engineer, used Claude Managed Agents to build Medkit: a learning tool for medical residents or junior doctors, simulating real-life patient encounters in a gamified medical clinic.
"When you're alone in an emergency department with 50 patients waiting and you realize there are cases you never practiced in medical school, you end up practicing them on real patients in real time," says Bedirhan.
With Medkit, medical students practice diagnosing and treating simulated patients, using the tool to take medical history, order labs, read imaging, diagnose, and prescribe treatment. At the end, an agentic grader assesses the full encounter against the same published clinical guidelines that a board examiner would use.
Bedirhan built Medkit across four separate Claude Code sessions (voice engine, content generation, 3D game layer, and a core app), keeping each context clean and progressing on all at once. He followed a “talk, don’t type” approach, working almost entirely by voice.
Medkit is already gaining traction, with three medical faculties and a pharma company, all based in Istanbul, set to start running pilots in the coming weeks.
Advice to other builders: Work with Claude as a thought partner, not just a coding agent.
Bedirhan’s first instinct was to self-host the voice engine, but Claude suggested using a cloud provider to move faster. “What I value most about Claude is it’s not just a code generator, but a thought partner helping me see options I'd otherwise miss,” he says.
Second place: Wrench Board, Alexis Chapellier
Alexis Chapellier from Reignier-Ésery, France, spent years fixing electronics before creating RepairMind, an AI-powered management platform for repair shops. His Opus 4.7 hackathon project, Wrench Board, helps independent technicians figure out complex repairs. Users drop in a schematic and a boardview and describe the symptoms, and the agent creates a unified electrical graph, reasons over it, points to the exact pad to probe, reads measurements, and updates its hypotheses until it diagnoses the issue.
Alexis prototyped Wrench Board in Claude Design, separating the app’s responsibilities (design, schematic ingestion, boardview, diagnostic agent) and producing first a spec and then a plan for each one. He executed in Claude Code’s multi-agent mode, benchmarking at every step by running five or six agents in parallel during debugging, with one dedicated agent per domain.
Alexis’s big bet was on Opus 4.7’s new ability to understand visual schematics; he says he knew it was working when he asked the model to trace a power path on a motherboard.
“I watched Wrench Board’s boardview light up step by step, arrows appearing, components getting pointed at, names surfacing. At that moment, I understood the idea was holding up," he says.
Wrench Board’s next phase is to build a community of electronics repairers interested in trying the app and experts able to enrich the tool with their field experience. His Claude credits will go toward RepairMind, those first users, and all the infrastructure currently in flight.
“This hackathon is proof that a self-taught person coming out of a repair shop can ship an ambitious system in five days,” says Alexis, who was applying for “survival jobs” when he entered. “Claude Code amplifies whoever has an idea and the endurance to execute on it, regardless of their starting point.”
Advice to other builders: Go deep in the brainstorm and push back on the model.
Alexis uses Superpowers, a skills framework integrated into Claude that structures the brainstorm-then-plan steps, sometimes running brainstorms in parallel to make progress on different fronts. He starts in Claude Design, then hands off to Claude Code using the built-in button that shares the project directly, and pushes the model when it tells him no.
“During the hackathon, Claude told me several times that this or that wouldn't fit in the time available. In reality, I had plenty of time,” he says. “You have to know how to tell it, *I'm going to try anyway.*"
Third place: Maieutic, Paula Vásquez-Henríquez
Paula Vásquez-Henríquez, who teaches computer science at Universidad del Desarrollo in Concepción, Chile, says over the past two years she is seeing more students pass tests without understanding their own code.
"Students now use AI to manufacture code, but they have no idea what the code does," she says. “They never learn to state a problem precisely, to draft a plan before coding, or to read their own code critically and notice where it drifted from what they intended. The autocomplete delivers working code before they've even finished forming the question, so the metacognitive loop, the thinking-about-your-thinking that actually creates a programmer, never closes. They graduate able to generate code but not reason about it.”
Paula, who is currently working on a PhD in Artificial Intelligence researching student–AI interaction patterns, entered the hackathon to solve this problem from both student and instructor perspectives.
Maieutic is an IDE designed to make students slow down at key moments. Students must describe in plain language what their program should do before writing any code; Claude asks targeted clarifying questions and keeps the editor locked until the spec is detailed enough that a competent programmer could implement it without guessing.
Students can then start writing Python but autocomplete is off; a chat panel answers reference questions directly but responds to reasoning questions with counter-questions rather than fixes, refusing to do the student's thinking for them.
The Intent-Diff Review, the core of the tool, has Claude compare the spec against the final code, classify each divergence as drift, revision, or bug, and then surface a neutral, non-accusatory question prompting the student to explain the issue themselves.
For instructors, a live dashboard shows one row per student with a one-sentence cognitive summary (e.g., "written the spec three times, still hasn't considered empty input"). Teachers can click on individual students to monitor their specific interactions with Claude, which also analyzes the full cohort to identify and surface any shared misunderstandings across the whole class so instructors can close that gap.
Since the hackathon ended, researchers at the University of Houston have reached out about co-authoring a paper, and Paula is putting her prize credits toward developing the tool further. She says hackathon week showed her that the gap between understanding a problem and shipping a tool for it has collapsed.
“I’m an educator in Concepcion, Chile, not Silicon Valley,” she says. “I shipped a working full-stack product in a week because the tools let me stay in the role I'm genuinely expert in while they handle the rest. The people closest to real problems can now build for them directly.”
Advice to other builders: Think before you build.
This project was Paula dogfooding her own philosophy: specify before you build. “Maieutic exists because students jump straight to code, and the only way I built it well was by refusing to do exactly that myself,” she says. She dedicated two days to pure thought work, creating the design spec and the technical spec before writing a single line of code.
“Those two days of spec felt slow at the time, there's real pressure in a hackathon to start shipping immediately, but they were what let the rest of the week move fast,” she says.
Most Creative Use of Opus 4.7: Virtual Puppet Theater, Rene Hangstrup Møller
Intrigued with Opus 4.7’s spatial reasoning capabilities, full stack developer Rene Hangstrup Møller built Virtual Puppet Theater, a browser-based app that turns webcam video and voice into a dynamic interactive puppet show. A real-time animated puppet mirrors a user’s movements while a second AI-driven companion puppet banters with the user; spoken prompts can transform the scenery and spawn 3D props on the fly.
Rene used Claude across the full pipeline: concept discussion, planning, and code writing, while he handled direction, architecture, review, and decision-making. The app is based on Bun, Vite, and TypeScript, using MediaPipe hand tracking (running in WASM) and Three.js to render the puppet stage in 3D at 60 fps. A small WebSocket server connects to Claude Opus 4.7 via the Anthropic SDK to drive the AI puppet's dialogue and generate 3D props on the fly, while voice is handled by the Web Speech API for input and ElevenLabs for output (with browser speech synthesis as a fallback). Opus's spatial reasoning capabilities, refined through a screenshot-based feedback loop, handle the visual output.
There's no objective in Virtual Puppet Theater beyond open-ended play and Rene says she has no product plans for his winning project. For him, it was about learning and fun. "I tested it with my youngest son and he had a blast,” Rene says. “Seeing him interact with the puppet, describe scenes, and giggle at the responses was really the only user validation I needed.”
Virtual Puppet Theater’s source code is available on GitHub under MIT licensing, he adds, “if anyone wants to take it further.”
Advice to other builders: If you’re participating in a hackathon, plan time to create the demo video.
"It takes way longer than you think to produce a 3-minute video,” Rene says, noting that he went up against the hackathon deadline using Claude and Hyperframes to create and edit his Virtual Puppet Theater video. “Many people in the hackathon Discord warned about this, and they were right. Next time, I'd reserve that entire last day just for producing the demo."
Virtual Puppet Theater on Github
"Keep Thinking" Prize: MaestrIA, Benjamin Torralbo
Benjamin Torralbo grew up apprenticing alongside his father, Juan Rodrigo Torralbo, a certified *Maestro Mayor* carpenter in Chiloé, Chile. “My father has 30 years of craft, has restored UNESCO-listed churches, but is still invisible to the Chilean system, like hundreds of thousands of other tradespeople,” Benjamin says. “Meanwhile, people needing home repairs don't know what is wrong, what it costs, who to call, and whether they're being charged fairly.”
His MaestrIA hackathon project solves both sides as a web app that gives ordinary people master-level home repair diagnostics while giving skilled tradespeople a way to demonstrate expertise.
With MaestrIA, users photograph their problem, describe it in voice or text, and share their location. Claude streams its reasoning in real time with animated bounding boxes over the photos, then delivers structured diagnoses: what's broken, material, severity 1–5, project budget and time estimate. The agent then renders a map of nearby maestros filtered by trade while a second agent drafts a WhatsApp message to send.
MaestrIA’s technical heart is a JSON file, injected into every diagnosis, that contains 17 diagnostic rules, 7 native Chilote woods, 16 terms of local trade dialect, 19 benchmark prices, and 9 common mistakes of the craft all distilled from hours of interviews Benjamin did with his father. Without touching the system prompt, that single file lifted his eval seven points (74% to 81% against a human master's judgment) and is how MaestrIA can diagnose "rising damp on alerce wood siding" instead of generic "wood damage."
With no prior programming experience, Benjamin says his role was site foreman overseeing Claude’s technical execution. “Before writing any feature, I asked Claude Code to design the specs, the staged action plan, and the security model: input sanitization against prompt injection, rate limiting, origin validation, and Zod schemas as the single source of truth,” he says. “Then I reviewed each feature diff by diff.”
Benjamin wants MaestrIA to grow into new builds, hardware-store integration, formal budgets, contracts, reviews, and a certification system. Eventually, each trade will have its own Maestro Mayor encoded inside, including carpenters, architects, plumbers, electricians, and masons.
His prize credits go toward developing the app, digitizing his father's company as a live pilot, and his own technical growth. “Claude Code lets a 20-year-old from Chiloé with no programming experience build software that his own dad can use and that can help 280,000 more maestros like him in Chile,” he says. “And it opens the door for millions of people who've always had valuable ideas but no way to bring them to life."
Advice to other builders: Eval first, features later.
“The single most important thing I did was build an auditable 9-dimension eval against 12 real cases with ground truth recorded by my dad,” Benjamin says. “That eval, not my intuition, told me what was working and what wasn't. If I did another hackathon, the eval would be the first commit.”
Best Use of Claude Managed Agents: ARIA, Idriss Benguezzou & Adam Hnaien
Most factories have that one veteran technician who can tell when a machine is about to break, just by the sound it makes. The Best Use of Claude Managed Agents prize-winning project, ARIA (Adaptive Runtime Intelligence) turns an experienced maintenance engineer’s instincts into an affordable, fast-to-set-up AI system that continuously watches factory machines and generates custom diagnostics and repair plans the moment trouble appears.
With ARIA, a maintenance engineer uploads a manufacturer's PDF, answers four plain-language calibration questions, and within 15 minutes the plant is profiled. From there, five agents watch live signals. If an agent detects a failure or predicts one is imminent, it produces a work order analyzing component, failure mode, urgency, parts, and intervention window
The project’s builders, both of whom have on-the-floor industrial experience, met in the hackathon’s teammate-finding Discord channel. Idriss Benguezzou, a French industrial-software engineer with a Master's in data/AI, had been mapping out the idea and most of its architecture for a while. Adam Hnaien, a self-taught engineering student experienced with Claude Code and multi-agent workflows, immediately recognized ARIA as a valuable solution for industrial maintenance.
Idriss and Adam spent all of the hackathon’s second day in planning mode with a GitHub Project board, scoping every milestone, issue, and acceptance criterion before writing the first line of code. “We wanted to go in at 200% from M2 onward,” Adam says. “One day of planning let us spend the rest of the week executing, not improvising.”
Both estimate that Claude Code wrote ~80% of the raw lines while they made domain logic and design decisions by hand. Idriss handled threshold evaluation, KB schema, and anomaly detection because, he says, “you can't prompt your way to knowing what a maintenance technician actually looks at." Adam took on UX, visual language, and ARIA’s constellation concept because, he says, “you can't prompt your way to taste.”
Managed Agents handled agent infrastructure. “Without Claude Managed Agents, we'd have spent the week building infrastructure that Anthropic already hosts: a sandboxed Python environment, secure execution, session persistence, MCP dispatching,” Adam says. “Instead, we spent that week building the product around that infrastructure. That's the difference between shipping ARIA in five days and shipping ARIA in five weeks.”
After the hackathon’s results were announced, companies working on exactly this problem reached out about the project. Idriss will fold ARIA's agent architecture, KB schema, and signal pipeline into his own industrial IoT platform; his credits will go toward more building and experimentation. As for Adam, his plan is to continue exploring opportunities in industrial agentic AI and use the API credits to continue building and experimenting.
Advice to other builders: Let Claude audit. Ask Claude to find if there’s anything wrong with what you've already built before building the next thing, says Idriss. “That loop is underrated.”
Learn* about our Claude Community programs, including meetups, hackathons, and more.*
関連記事
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
Claude Fable 5 と Mythos 5 の能力に関する記事
Anthropic は、Claude Fable 5 が米政府から不正アクセス(ジャイルブレイク)の懸念によりリリース後わずか3日で利用停止を命じられたと報じています。この措置により、多くのユーザーが失った機能への愛着を表明しています。
Claude Code がアーティファクト機能をサポート
Anthropic は Claude Code に「アーティファクト」機能を追加し、PR の解説やシステム説明などの作業セッションをライブで共有可能な視覚ページに変換しました。この機能は自動更新やバージョン履歴をサポートし、チームと企業向けベータ版として提供されています。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み