ABEJA Tech Blog の最新記事
25件の記事
エージェント能力を強化し長文脈対応のABEJA-Qwen3-14B-Agentic-256k-v0.1を公開
ABEJAは、経済産業省とNEDOのプロジェクト「GENIAC」3期で開発した大規模言語モデル「ABEJA-Qwen3-14B-Agentic-256k-v0.1」を公開した。同モデルは、長文脈処理性能とエージェントとしての能力向上に重点を置いている。
エッジ環境におけるローカルVLMを用いたセキュアOCR:文法制約による構造化出力の実現
ABEJAの伊藤祐希氏が、エッジ環境でVision Language Modelを使用し、文法制約(JSON Schema)を適用することで、セキュアな構造化データ抽出が可能であることを検証した。
LLMの自律的調査能力を高めるAgenticRLの取り組みと知見
ABEJAの服部氏が、LLMの自律的(Agentic)能力向上のためのPost Training(SFTと強化学習)の手法と知見を紹介した。SFTでの精度劣化回避やTool-Useを用いた強化学習タスク、実装上の課題などをまとめている。
GENIAC第3期のLLM開発で使用したロングコンテキスト評価のベンチマークを公開
ABEJAの藤原データサイエンティストが、経済産業省とNEDOのプロジェクト「GENIAC」第3期で、エージェント用基盤モデルの開発過程で使用したロングコンテキストLLM評価のベンチマークを公開した。
Mentor PiメカナムホイールをROS 2で動作させる〜macOS上でのシミュレーション環境構築とフロンティアベース探索による検証
ABEJAのインターン生が、メカナムホイール搭載ロボット「Mentor Pi」をROS 2で制御し、macOS上でシミュレーション環境を構築して自律探索を実証した。
SSHで1文字送信に100パケットが必要な理由とは?Claude Codeで調査
SSH通信の仕組みを調査し、1文字送信に多数のパケットが必要な理由をClaude Codeを使って分析した技術記事。
Differential Transformer V2が発表されたので、今更ながらV1論文を読んで差分を確認してみた
Differential Transformer V2は、V1の2つのアテンションの差分を取るシンプルなアイデアを発展させ、アテンションノイズ抑制やスケーリング効率向上などの改善を実現した。
二足歩行ロボットを作ってみよう(前編)
二足歩行ロボットの制作プロセスを解説。ハードウェア設計から強化学習による歩容改善、模倣学習の応用まで、実践的な開発手法を紹介。
NVIDIA Claraを使用して医療・創薬分野のAIモデルを実装した体験
ABEJAの開発者が、医療・創薬分野向けのAIモデルをNVIDIA Claraで動かした実践的な試みを紹介。
今さらながらDeepSeek-R1の論文を読んでみた
中国DeepSeek社が公開した軽量で高品質なLLMについて、蒸留手法を用いた軽量化の技術的観点から考察。高価なGPUが不要で動かせる点が特徴。
GPT-OSS-120Bに論理クイズや数学問題を解かせ、推論ログを詳細に分析した
オープンソースの大規模言語モデルGPT-OSS-120Bに論理クイズや数学問題を解かせ、その推論プロセスをログから詳細に分析した研究内容。
Strands + Amazon Bedrock AgentCore + Athenaで簡単データ分析システムを構築する
非エンジニアでも安全にデータ分析できる環境構築の課題を、Strands、Amazon Bedrock AgentCore、Athenaを組み合わせたシステムで解決する方法を紹介。
π0シリーズで使用されるaction expertをコードレベルで理解する
ABEJAのデータサイエンティストが、π0シリーズのaction expertの仕組みを、openpiの実装コードを基に解説するブログ記事。
初心者向けガイド:VLAでtoioを操作する
ABEJAの飯嶌が、高価なロボットアームではなくtoioを使い、低コストでVLA(Vision-Language-Action)の検証環境を構築する方法を紹介。Physical AIの実証実験のハードルを下げる取り組み。
最新AI技術情報をキャッチアップするAIエージェントを作成し、研究開発業務の一部を自動化した
AI技術の急速な進歩に追いつくため、AIエージェントを開発し、研究開発業務の一部を自動化する試みを実施した。
ターミナルで暮らそう(序章)
ABEJA社の合屋氏が、Claude CodeなどのAIエージェント活用でターミナル作業が増加したが、DB参照などで未だ外部ツールが必要な現状を述べている。
【ABEJAアジャイル活動記録】停滞を超え、再び合流へ。「象・死んだ魚・嘔吐」がつないだチームとプロダクトオーナーの関係
ABEJAのスクラムチームが、プロダクトオーナーとの関係が停滞する中、「象・死んだ魚・嘔吐」という手法で言語化できない違和感を整理し、再び同じ方向を向くまでの実践をスクラムマスターの視点で記録した。
【LeRobot】テレオペレーションで収集した模倣学習データの詳細分析
ABEJAの瀧田氏が、テレオペレーションで収集したロボットアームの模倣学習データセットの構造と可視化方法を解説している。
【年末大掃除】開発環境VMの再構築 - apt・brew・asdf・Dockerを使い分けたパッケージ管理
開発者が開発環境用仮想マシンを再構築し、apt・Homebrew・asdf・Dockerなどのパッケージ管理ツールを使い分けて、gcloud・Docker・Go・kubectl・poetryなどのツールを効率的にインストールする方法を紹介している。
余剰PCを活用したプライベートクラウド構築によるネットワーク実験
筆者が余剰PCを活用し、Proxmox VEやHAProxyなどのオープンソース技術を用いて検証用プライベートクラウド環境を構築し、ネットワーク設計と可用性向上の実践的実験を行った。
環境構築を爆速で!Python開発テンプレートの紹介
ABEJA社のシステム開発部エンジニアが、Python開発環境の最新テンプレートを紹介した。パッケージマネージャーがpoetryからuvへ移行し、ruffにformatter機能が統合されるなどの変更点を説明している。
Super AI Agent と呼んでみる
ABEJAの村主CTO室が、Claude CodeやCodexなどの既存AIツールを「Super AI Agent」と定義し、AIエージェントという用語の乱用に対する見解を示した。
ユーザー理解している“つもり”から脱却する──PdM視点で考察するアジャイルチームの陥りやすい課題
ABEJAの中村氏が、アジャイルチームが陥りがちな「ユーザーを理解しているつもり」という問題を指摘し、KA法分析や観察の仕組み化、POが正解を持たない前提など、真のユーザー理解に近づく方法を提案している。
ロングコンテキストLLMの汚染された長文コンテキストへの耐性評価
研究者が、ロングコンテキストLLMの評価タスクの一環として、汚染された長文コンテキストへの耐性を評価するタスクの検証を行った。
NotebookLMで技術書を読む:初期理解・深掘り・理解確認のフェーズ設計
株式会社ABEJAの近藤氏が、NotebookLMを技術書の理解に活用する方法を紹介。初期理解フェーズではインフォグラムやスライド資料で全体像を把握し、フェーズ別にNotebookLMの活用を評価する。