生成AIの利活用事例に関するLT会を開催しました! Hacking Fest 2026 Spring 開催レポート
LY Corp のエンジニアが Hacking Fest 2026 Spring で発表した生成 AI 活用事例は、AI エージェントの安定化手法や自作自動化ツールの検証から、未来における人間の役割まで多角的な知見を提供した。
キーポイント
Harness Engineering の提案
AI コーディングエージェントの文脈喪失(Context Decay)や誤動作を防ぐため、プロンプト設計に加え、検証ループやフィードバック機構を環境レベルで設計するアプローチが示された。
Claude Code Hooks による自作 Auto Mode
公式機能の制約を回避するため、Hooks を活用して権限承認や自動続行ロジックを実装した事例と、その学習効果および公式機能への依存度低下が報告された。
未来の AI 社会における人間の役割
2028 年の生活予測ポエムを通じて、AI が業務や生活支援を担う時代でも、最終的な判断と責任は人間が負い続けるという結論が示された。
Harness EngineeringによるAIエージェントの安定化
コンテキストの劣化や意図しない動作を防ぐため、プロンプトだけでなく環境設計や検証ループ(Feedforward/Feedback)を組み合わせるアプローチが共有された。
コスト削減と初期投資の現実
ローカルLLMの実行や専用サーバー構築を試みた結果、無料・低価格・高性能を同時に満たす方法は難しく、コスト削減にはむしろ大きな初期投資が必要という教訓が得られた。
データ構造の重要性と人間の役割
個人秘書エージェントの改善事例から、単にデータを蓄積するだけでなく関係性を明示した構造で整理することが重要であり、未来においても最終判断と責任は人間が担うべきだと結論付けられた。
影響分析・編集コメントを表示
影響分析
この記事は、単なるツール利用報告を超え、AI エージェントの信頼性を高めるためのエンジニアリング的アプローチと、技術進化における人間性の重要性という二つの重要な視点を提示しています。特に「Harness Engineering」のような概念整理は、組織レベルでの生成 AI 導入を安全かつ効果的に推進する際の指針となるでしょう。
編集コメント
技術的な実装ノウハウと、未来社会における哲学的な考察が混在する貴重なレポートです。現場のエンジニアにとっては即座に活用できる「Harness Engineering」の概念と、長期的視点を持つべき人間性の重要性を同時に学べる内容となっています。
2026年5月のある日、生成AIの利活用を推進する有志による「Hacking Fest 2026 Spring」が開催されました。
Hacking Festは、ゴールデンウィーク期間中に行った技術キャッチアップや個人の成果を共有し、開発者間の相互学習の機会を提供するために開催しています。社内エンジニアが生成AIを活用して実際の業務と日常の問題を解決した事例が、9件のセッションで紹介されました。
前回冬の開催に続き、今回もゴールデンウィーク中の取り組みを中心に幅広いテーマが集まりました。AIエージェントの制御手法から個人開発、業務効率化、そして未来を想像するポエムまで、エンジニアたちの多彩な挑戦が共有されました。本記事では、どのようなセッションが行われたのかと、筆者の所感を紹介します。
セッション1:Harness Engineering 概念整理
発表者:Soonhwan Kwon
AIコーディングエージェントをより安定的に活用するためのアプローチとして、Harness Engineeringに関する調査内容が共有されました。
発表では、会話が長くなるほど前の文脈を参照しづらくなるContext Decay(コンテキストの減衰)や、指示だけでは意図しない動作を完全には防ぎにくいといった、AIエージェント活用時の課題が取り上げられました。これらの課題に対して、プロンプトやコンテキストを工夫するだけでなく、エージェントが動く環境や検証ループを設計することの重要性が説明されました。
具体例として、失敗から再発防止ルールを追加していく考え方、作業前後のFeedforward/Feedback(フィードフォワード/フィードバック)ループ、静的解析やテストによる機械的な検証、LLM判断を活用した推論的な検証などが紹介されました。最後に、AIによる自動化と人間による確認を組み合わせながら、より安全にAIエージェントを活用していく方向性が示されました。
セッション2:Claude Code HooksでAuto Modeを自作する

発表者:Suzuki Kosuke
鈴木さんはClaude CodeのHooks機能を活用してAuto Modeと同等の機能を自作した経験を発表しました。
個人開発ではClaude Proプランがコスト的に適切だと感じていたものの、当時のProプランではAuto Modeが使えなかったため、自分で似た動作を作ってみることにしたという経緯でした。まずClaude Code Hooksがセッション開始・終了、ツール呼び出し前後、権限リクエストなどさまざまなイベントでスクリプトやプロンプトを実行できる拡張機能であることを説明しました。
実装では PermissionRequest イベントを利用して「このツール使用を承認するか」を LLM に判断させ、Stop イベントを利用して作業終了後も残りタスクがあれば自動で続行するようにしました。自動承認機能は Claude API を呼び出すシェルスクリプトベースのフックで実装し、承認・拒否結果を JSON 形式で返すように構成しました。ただし Prompt Hook は出力スキーマが固定されていて望む JSON 形式を作りにくく、claude -p 方式も期待した形式を安定的に返せませんでした。発表者はこれを通じて実際の Auto Mode が想像以上に精緻に設計されていることを実感し、自作の実装は結局公式 Auto Mode が Pro プランにも提供されたことで実用の必要性は減ったものの、Hooks を深く理解する良い学習になったとまとめました。
セッション 3:2028 年のゴールデンウィークを想像したポエム

発表者:Maekawa Kohei
前川さんは技術的な開発成果の代わりに、「2026 年のゴールデンウィークが 2028 年だったらどう変わっていただろうか」という予想から出発した発表を行いました。
発表では、未来の生成 AI が予定管理、移動、家計管理、意思決定、健康管理、作業支援など、生活のさまざまな場面に自然に入り込む可能性が語られました。一方で、生成 AI が多くの提案や自動化を担うようになっても、人間関係や価値判断を含む領域では、最終的な判断は人間に残り続けるという視点が示されました。
発表の結論は、未来においても人間の中心的役割は「判断し、その判断に責任を持つこと」というメッセージでした。
セッション 4:Amazon Photos のデータを NAS にバックアップした話

発表者:Washizu Yoshitsugu
鷲巣さんは、長年クラウド上に保管してきた写真データを、ローカル環境にもバックアップした取り組みについて共有しました。
発表では、クラウドサービスの利便性を活用しつつも、サービス障害や利用条件の変更などに備えて、自分で管理できる場所にもデータを保持しておく重要性が語られました。大量の写真データを扱ううえでは、手作業だけで整理・移行することが難しいため、AI の支援も活用しながら、効率的にデータを整理・保存する方法を検討したとのことです。
最終的には、写真データをローカル環境にバックアップする仕組みを整え、個人データを長期的に守るためには、クラウドだけに依存しない備えが大切だというメッセージで締めくくられました。
セッション 5:AI 利用コストを抑えるための試行錯誤

発表者:Yoshizawa Takayuki
吉澤さんは、AI 利用コストを抑えるために試みたさまざまなアプローチとその失敗経験をユーモラスに共有しました。
問題意識はシンプルでした。AI API や有料ツールの使用コストが高いため、より安価に同等の効果を得る方法がないかという悩みです。
まずローカル LLM(大規模言語モデル)を直接実行すれば、使用量に応じたコスト負担を減らせるのではないかと実験しました。しかし個人の Mac 環境で動かせるモデルはサイズと性能に制約が大きく、期待した品質の出力を得にくかったり速度面で実用的ではありませんでした。続いて自宅に AI 専用サーバーを構築する選択肢も検討しましたが、一定水準以上のモデルを安定して動かすには大容量のメモリ(RAM)と高性能 GPU(グラフィックプロセッサ)が必要で初期コストが大きかったと説明しました。結論として、今回試した範囲では無料・低価格・自動化・高性能を同時に満たす方法は見つからず、コストを減らすにはむしろ先に大きな初期投資が必要だという現実的な教訓を共有しました。
セッション 6:LLM 評価ツールで Claude Skill を評価・改善

発表者:Inoue Satoshi
LLM 評価ツールを活用して自身が普段使用していた Claude Skill を評価・改善した実験を紹介しました。
対象の Skill は、Claude 関連のアップデート情報を収集して週次レポートに整理するツールで、Claude 公式ドキュメントや社内向けの共有情報を入力としてレポートを生成する仕組みでした。基本のサンプルスクリプトは AI とのプロンプト(指示)と応答中心のデータを送る構造でしたが、実際に評価したかったのは最終的に生成されたレポート内容だったため、スクリプトを修正して結果ドキュメント自体も収集するようにしました。
その後ツールの評価機能から簡潔性、内部整合性、ハルシネーション(幻覚・虚偽生成)、コンテキストとの一致度などを選んで評価を実施しました。評価の結果、レポートがやや冗長だという指摘、Skill に定義された一部ルールに違反しているという指摘、データソースが不足してハルシネーション判断が曖昧な部分などが確認されました。指摘事項を Claude に伝えて Skill を修正し再実行する改善ループ(PDCA サイクル)を実施したところ、スコアが単純に一貫して上がるわけではなかったものの、指摘の具体性が高まり一部の問題が改善される効果を確認しました。発表者はこうした LLM 評価ツールが AI ツールや Skill を定量・定性的に点検する上で有用な出発点になりうると整理しました。
セッション 7:個人秘書エージェントを少し改善した話

発表者:Liu Wenjie 氏
個人的に運用してきた秘書エージェントの改善に関する経験を共有しました。
このエージェントは、業務上必要な情報やタスク関連の情報をもとに、毎朝必要な情報を整理したり、会議の準備やレポート生成などに活用するために作成したツールでした。初期段階では有用に機能していましたが、約3か月間にわたってデータが蓄積されるにつれて、特定チケットの状態を誤って伝えたり、実際には行っていない作業を行ったかのように説明するなど、ハルシネーション(幻覚)が増加したと説明しました。その原因として、データ整理のフォーマットが最初から十分に設計されておらず、ドキュメント間の関係性や時系列情報が不足していたことを挙げました。
これを解決するために、Graph ベースのパーソナルナレッジマネジメントツールである「GBrain」を導入し、ドキュメント間のリンクや関係性、時間情報を自動的に補強する方式を実験しました。
導入後は、進行中ではないチケットを進行中だと誤って報告する問題などが改善され、時系列や関係性を反映した回答をより適切に生成できるようになりました。
また、LLM Judge(大規模言語モデルによる評価)を活用して改善前後を複数の評価軸で比較し、単純にデータを多く集めることよりも、AI が理解しやすい構造で整理することが重要だと強調しました。
セッション8:生成AIでモニタリング業務の効率化に挑戦
発表者:Koga Yasunori 氏
LINE関連サービスの運用業務において、生成AIを活用してモニタリング業務の効率化を目指す取り組みを共有しました。
ユーザー投稿コンテンツを確認し、必要に応じて適切な対応につなげる業務では、日々多くのコンテンツが扱われており、効率的な運用が課題になっているとのことでした。発表では、AIを活用して確認作業の一部を支援し、モニタリング業務の効率化を目指す取り組みが紹介されました。
既存の業務マニュアルや判断基準を参考に、生成AIがどの程度判断支援に活用できるかを検証しました。簡単なサンプルデータでは良好な結果が得られた一方で、曖昧なケースでは課題も確認されました。プロンプト(指示文)の改善により精度が向上する傾向も見られました。発表者は、実データの取り扱いには十分な配慮が必要であり、関係部門と確認しながら慎重に検証を進めていると説明しました。
セッション9:Claude Designで個人サービスを開発
発表者:Sueishi Hiroki 氏
居石さんは、Claude Designを活用した個人サービス開発の取り組みについて発表しました。
発表では、生成AIを使ってサービスの世界観やUIイメージを短時間で具体化し、画面モック(プロトタイプ)の作成から実装までを効率的に進める流れが紹介されました。デザインの初期検討やコンポーネント設計にもAIを活用することで、個人開発における試行錯誤の負荷を下げられる可能性が示されました。
また、生成されたデザインを実装へとつなげる流れや、クラウド環境を活用した公開方法についても触れられました。発表全体を通じて、生成 AI を活用することで、アイデアの具体化からサービス公開までをより軽量に進められるという学びが共有されました。
個人的な感想
今回の Hacking Fest で特に印象的だったのは、さまざまな分野を担当するエンジニアたちが、それぞれの日常や業務の中から AI を活用する独自の視点を見つけ出し、実験を重ねている姿でした。エージェントをいかに安定させるか、どう制御し改善するかという試行錯誤が多くのセッションに共通していた点も興味深く感じました。モデルとエージェントの進化が続く中、1 年後にはどのような新しいテーマが語られるのか、今から楽しみです。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
原文を表示
2026年5月某日、生成AI利活用を推進する有志による「Hacking Fest 2026 Spring」が開催されました。
Hacking Festは、ゴールデンウィーク期間中に行った技術キャッチアップや個人の成果を共有し、開発者間の相互学習の機会を提供するために開催しています。社内エンジニアが生成AIを活用して実際の業務と日常の問題を解決した事例が、9件のセッションで紹介されました。
前回冬の開催に続き、今回もゴールデンウィーク中の取り組みを中心に幅広いテーマが集まりました。AIエージェントの制御手法から個人開発、業務効率化、そして未来を想像するポエムまで、エンジニアたちの多彩な挑戦が共有されました。本記事では、どのようなセッションが行われたのかと、筆者の所感を紹介します。
セッション1:Harness Engineering 概念整理
発表者:Soonhwan Kwon
AIコーディングエージェントをより安定的に活用するためのアプローチとして、Harness Engineeringに関する調査内容が共有されました。
発表では、会話が長くなるほど前の文脈を参照しづらくなるContext Decayや、指示だけでは意図しない動作を完全には防ぎにくいといった、AIエージェント活用時の課題が取り上げられました。これらの課題に対して、プロンプトやコンテキストを工夫するだけでなく、エージェントが動く環境や検証ループを設計することの重要性が説明されました。
具体例として、失敗から再発防止ルールを追加していく考え方、作業前後のFeedforward/Feedbackループ、静的解析やテストによる機械的な検証、LLM判断を活用した推論的な検証などが紹介されました。最後に、AIによる自動化と人間による確認を組み合わせながら、より安全にAIエージェントを活用していく方向性が示されました。
セッション2:Claude Code HooksでAuto Modeを自作する

発表者:Suzuki Kosuke
鈴木さんはClaude CodeのHooks機能を活用してAuto Modeと同等の機能を自作した経験を発表しました。
個人開発ではClaude Proプランがコスト的に適切だと感じていたものの、当時のProプランではAuto Modeが使えなかったため、自分で似た動作を作ってみることにしたという経緯でした。まずClaude Code Hooksがセッション開始・終了、ツール呼び出し前後、権限リクエストなどさまざまなイベントでスクリプトやプロンプトを実行できる拡張機能であることを説明しました。
実装ではPermissionRequestイベントを利用して「このツール使用を承認するか」をLLMに判断させ、Stopイベントを利用して作業終了後も残りタスクがあれば自動で続行するようにしました。自動承認機能はClaude APIを呼び出すシェルスクリプトベースのフックで実装し、承認・拒否結果をJSON形式で返すように構成しました。ただしPrompt Hookは出力スキーマが固定されていて望むJSON形式を作りにくく、claude -p方式も期待した形式を安定的に返せませんでした。発表者はこれを通じて実際のAuto Modeが想像以上に精緻に設計されていることを実感し、自作の実装は結局公式Auto ModeがProプランにも提供されたことで実用の必要性は減ったものの、Hooksを深く理解する良い学習になったとまとめました。
セッション3:2028年のゴールデンウィークを想像したポエム

発表者:Maekawa Kohei
前川さんは技術的な開発成果の代わりに、「2026年のゴールデンウィークが2028年だったらどう変わっていただろうか」という予想から出発した発表を行いました。
発表では、未来の生成AIが予定管理、移動、家計管理、意思決定、健康管理、作業支援など、生活のさまざまな場面に自然に入り込む可能性が語られました。一方で、生成AIが多くの提案や自動化を担うようになっても、人間関係や価値判断を含む領域では、最終的な判断は人間に残り続けるという視点が示されました。
発表の結論は、未来においても人間の中心的役割は「判断し、その判断に責任を持つこと」というメッセージでした。
セッション4:Amazon PhotosのデータをNASにバックアップした話

発表者:Washizu Yoshitsugu
鷲巣さんは、長年クラウド上に保管してきた写真データを、ローカル環境にもバックアップした取り組みについて共有しました。
発表では、クラウドサービスの利便性を活用しつつも、サービス障害や利用条件の変更などに備えて、自分で管理できる場所にもデータを保持しておく重要性が語られました。大量の写真データを扱ううえでは、手作業だけで整理・移行することが難しいため、AIの支援も活用しながら、効率的にデータを整理・保存する方法を検討したとのことです。
最終的には、写真データをローカル環境にバックアップする仕組みを整え、個人データを長期的に守るためには、クラウドだけに依存しない備えが大切だというメッセージで締めくくられました。
セッション5:AI利用コストを抑えるための試行錯誤

発表者:Yoshizawa Takayuki
吉澤さんはAI利用コストを抑えるために試みたさまざまなアプローチとその失敗経験をユーモラスに共有しました。
問題意識はシンプルでした。AI APIや有料ツールの使用コストが高いため、より安価に同等の効果を得る方法がないかという悩みです。
まずローカルLLMを直接実行すれば使用量に応じたコスト負担を減らせるのではないかと実験しました。しかし個人のMac環境で動かせるモデルはサイズと性能に制約が大きく、期待した品質の出力を得にくかったり速度面で実用的ではありませんでした。続いて自宅にAI専用サーバーを構築する選択肢も検討しましたが、一定水準以上のモデルを安定して動かすには大容量のメモリと高性能GPUが必要で初期コストが大きかったと説明しました。結論として、今回試した範囲では無料・低価格・自動化・高性能を同時に満たす方法は見つからず、コストを減らすにはむしろ先に大きな初期投資が必要だという現実的な教訓を共有しました。
セッション6:LLM評価ツールでClaude Skillを評価・改善

発表者:Inoue Satoshi
LLM評価ツールを活用して自身が普段使用していたClaude Skillを評価・改善した実験を紹介しました。
対象のSkillはClaude関連のアップデート情報を収集して週次レポートに整理するツールで、Claude公式ドキュメントや社内向けの共有情報を入力としてレポートを生成する仕組みでした。基本のサンプルスクリプトはAIとのプロンプト・応答中心のデータを送る構造でしたが、実際に評価したかったのは最終的に生成されたレポート内容だったため、スクリプトを修正して結果ドキュメント自体も収集するようにしました。
その後ツールの評価機能から簡潔性、内部整合性、ハルシネーション、コンテキストとの一致度などを選んで評価を実施しました。評価の結果、レポートがやや冗長だという指摘、Skillに定義された一部ルールに違反しているという指摘、データソースが不足してハルシネーション判断が曖昧な部分などが確認されました。指摘事項をClaudeに伝えてSkillを修正し再実行する改善ループを実施したところ、スコアが単純に一貫して上がるわけではなかったものの、指摘の具体性が高まり一部の問題が改善される効果を確認しました。発表者はこうしたLLM評価ツールがAIツールやSkillを定量・定性的に点検する上で有用な出発点になりうると整理しました。
セッション7:個人秘書エージェントを少し改善した話

発表者:Liu Wenjie
個人的に運用してきた秘書エージェントを改善した経験を共有しました。
このエージェントは、業務上必要な情報やタスク関連情報をもとに、毎朝必要な情報を整理したり、会議準備・レポート生成などに活用するために作ったツールでした。初期は有用に機能していましたが、約3か月間データが蓄積されるにつれて特定チケットの状態を誤って伝えたり、実際にはやっていない作業をやったかのように説明するなどハルシネーションが増えたと説明しました。原因として、データ整理フォーマットが最初から十分に設計されておらず、ドキュメント間の関係や時系列情報が不足していたことを挙げました。
これを解決するために、GBrainというGraphベースのPersonal Knowledge Managementツールを導入し、ドキュメント間のリンクや関係性、時間情報を自動的に補強する方式を実験しました。
導入後は、進行中ではないチケットを進行中だと誤って報告する問題などが改善され、時系列や関係性を反映した回答をより適切に生成できるようになりました。
また、LLM Judgeを活用して改善前後を複数の評価軸で比較し、単純にデータを多く集めることよりも、AIが理解しやすい構造で整理することが重要だと強調しました。
セッション8:生成AIでモニタリング業務の効率化に挑戦
発表者:Koga Yasunori
LINE関連サービスの運用業務において、生成AIを活用してモニタリング業務の効率化を目指す取り組みを共有しました。
ユーザー投稿コンテンツを確認し、必要に応じて適切な対応につなげる業務では、日々多くのコンテンツが扱われており、効率的な運用が課題になっているとのことでした。発表では、AIを活用して確認作業の一部を支援し、モニタリング業務の効率化を目指す取り組みが紹介されました。
既存の業務マニュアルや判断基準を参考に、生成AIがどの程度判断支援に活用できるかを検証しました。簡単なサンプルデータでは良好な結果が得られた一方で、曖昧なケースでは課題も確認されました。プロンプトの改善により精度が向上する傾向も見られました。発表者は、実データの取り扱いには十分な配慮が必要であり、関係部門と確認しながら慎重に検証を進めていると説明しました。
セッション9:Claude Designで個人サービスを開発
発表者:Sueishi Hiroki
居石さんは、Claude Designを活用した個人サービス開発の取り組みについて発表しました。
発表では、生成AIを使ってサービスの世界観やUIイメージを短時間で具体化し、画面モックの作成から実装までを効率的に進める流れが紹介されました。デザインの初期検討やコンポーネント設計にもAIを活用することで、個人開発における試行錯誤の負荷を下げられる可能性が示されました。
また、生成されたデザインをもとに実装へつなげる流れや、クラウド環境を活用した公開方法にも触れられました。発表全体を通じて、生成AIを活用することで、アイデアの具体化からサービス公開までをより軽量に進められるという学びが共有されました。
個人的な感想
今回のHacking Festで特に印象的だったのは、さまざまな分野を担当するエンジニアたちが、それぞれの日常や業務の中からAIを活用する独自の視点を見つけ出し、実験を重ねている姿でした。エージェントをいかに安定させるか、どう制御し改善するかという試行錯誤が多くのセッションに共通していた点も興味深く感じました。モデルとエージェントの進化が続く中、1年後にはどのような新しいテーマが語られるのか、今から楽しみです。
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み