#llm のAIニュース
952件の記事
AIは法律業界の変革を始めているばかりである
ハーバード法科大学院の学生、ジャスティン・カール氏は、弁護士がAIをどの程度活用しているかについて言及した。調査結果にはばらつきがあるものの、AI導入は法律業界において始まったばかりの段階である。
Anthropic経済指数:AI利用を理解するための新たな構成要素
Anthropicが2026年1月15日に発表した経済研究では、AI利用を理解するための新たな指標「Anthropic Economic Index」を導入した。
ツール導入時の法務確認リードタイム削減
DeNAグループがSaaS導入時の法務確認プロセスを効率化し、リードタイム削減を実現した取り組みについて紹介。
Salesforce、Slackbot AIエージェントを刷新し、MicrosoftやGoogleと職場AIで競争
SalesforceはSlackbotを単なる通知ツールからAIエージェントに刷新し、MicrosoftやGoogleとの職場AI競争を強化。
事前学習済みLLMの位置埋め込みを削除することでコンテキストを拡張
SakanaAIが、事前学習済み大規模言語モデルの位置埋め込みを削除するDroPE手法を発表した。この手法は、大規模な計算コストを伴わずにコンテキスト長を拡張できる。
LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論
AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。
Nous ResearchのNousCoder-14B、オープンソースのコーディングモデルがClaude Codeの瞬間に着地
Nous Researchが公開したオープンソースのプログラミングモデルNousCoder-14Bは、より大規模な独自モデルと同等以上の性能を持つと主張している。
AIがコードの大半を書くときの悲しみ
AIがほとんどのコードを生成するようになると、ソフトウェアエンジニアリングはどうなるか。開発者には悲しみが伴うと指摘。
LWiAIポッドキャスト #230 - 2025年振り返り、NvidiaがGroqを買収、GLM 4.7、METR
NvidiaがAIチップスタートアップGroqを約200億ドルで買収。MetaもAIスタートアップManusを買収し、Z.AIはGLM-4.7を発表。
MITの科学者が臨床AI時代の記憶化リスクを調査
MITの科学者が、データ収集アルゴリズムとサイバー攻撃が増加する中、臨床AIにおける患者データの記憶化リスクと医療倫理(ヒポクラテスの誓い)の保護について調査している。
Claude Codeの開発者がワークフローを公開、開発者たちが熱狂
世界最先端のコーディングエージェントの開発者が自身のワークフローを公開し、エンジニアコミュニティが注目している。
2025年の大規模言語モデルの現状:進歩、課題、予測
DeepSeek R1やRLVRから推論時のスケーリング、ベンチマーク、アーキテクチャまで、2025年のLLMの進展と2026年予測を概観。
LLM研究論文:2025年リスト(7月から12月)
有料購読者向けに、2025年後半の注目すべきLLM研究論文リストを紹介する記事。著者が厳選した論文をまとめている。
Windsurf Next 1.13.106 の更新:Gemini 3 Flash が全ユーザーに提供開始
Windsurf Next 1.13.106 は、推論能力と高速性を兼ね備えた Gemini 3 Flash を全ユーザーに公開しました。このモデルはコーディングやエージェントワークフローに適しており、前世代より 3 倍高速な応答を実現しています。
Windsurf 1.13.5:Gemini 3 Flashの全ユーザー向け提供開始
Windsurfは、Gemini 3 Flashを全ユーザーに提供開始した。このモデルはPro級の推論能力とFlash級の速度を併せ持ち、反復開発やコーディング作業に最適化されている。
FDE募集開始から半年の振り返りと2026年の展望
LayerXのFDE(Forward Deployed Engineer)募集開始から半年を振り返り、組織と技術の両面から2026年の展望を述べる記事。
LWiAIポッドキャスト #229 - Gemini 3 Flash、ChatGPTアプリ、Nemotron 3
LWiAIポッドキャストが、OpenAIのGPT-5.2 Codex、GoogleのGemini Free Flash、NvidiaのTrion-3など、先週の主要なAIニュースを要約・議論した。
メルペイ インターンでの挑戦と学び:EGP Cardsと向き合った3ヶ月間
メルペイのGrowth Platformでフロントエンド・エンジニアとしてインターンした経験談。EGP Cardsというプロジェクトに3ヶ月間取り組み、技術的挑戦と学びについて述べている。
今さらながらDeepSeek-R1の論文を読んでみた
中国DeepSeek社が公開した軽量で高品質なLLMについて、蒸留手法を用いた軽量化の技術的観点から考察。高価なGPUが不要で動かせる点が特徴。
フォワード・デプロイド・エンジニア(FDE)とは?顧客の業務改革を技術でリードするエンジニアの実像
FDEは顧客の現場で技術を活用し、業務改革をリードするエンジニアの役割を解説。AI Shiftのエンジニアが実例を紹介。
Strands + Amazon Bedrock AgentCore + Athenaで簡単データ分析システムを構築する
非エンジニアでも安全にデータ分析できる環境構築の課題を、Strands、Amazon Bedrock AgentCore、Athenaを組み合わせたシステムで解決する方法を紹介。
Fintech事業部における2025年のAI効率化の取り組み、あるいはラーメンの話
LayerX Fintech事業部が2025年にAIを活用して複数プロダクトの高速改善・リリースを実現した事例についての記事。
Windsurf Next 1.13.104のアップデート
Windsurfはバージョン1.13.104で並列マルチエージェントセッションやGitワークツリー機能を追加した。また、高性能コードモデルSWE-1.5を3ヶ月間無償提供し、開発者の利用環境を整備した。
Cursorでプログラミング言語を再学習する方法――AI駆動学習の4ステップ
AI駆動の開発ツール「Cursor」を活用し、プログラミング言語を効率的に再学習するための4段階の実践的な学習方法を紹介する記事です。
最新AI技術情報をキャッチアップするAIエージェントを作成し、研究開発業務の一部を自動化した
AI技術の急速な進歩に追いつくため、AIエージェントを開発し、研究開発業務の一部を自動化する試みを実施した。
CocoIndexでナレッジグラフを更新しながらRAGを実施
LayerXの鷹取氏が、従来のNative RAGの構造的弱点を克服するため、CocoIndexを用いてナレッジグラフを更新しながらRAGを実行する手法を紹介している。
Grok コレクション API
xAIは、APIに最先端のRAGシステムを直接組み込んだ「Grok Collections API」を発表した。これにより、ユーザーはAPI経由でコレクション管理と高度な検索機能を利用可能になる。
AIタスクフォースにおける非AIタスク:AIツール開発の現場でこそ必要な「AI以外の」技術選定
メルカリのAIタスクフォース担当者が、AIツール開発においてAI以外の技術選定の重要性を述べる記事。
AIの形状:不規則性、ボトルネック、顕著な特徴
筆者らは2023年、「ジャグドフロンティア」という用語を提唱し、AIが人間の直感とかけ離れた能力の偏り(特定のタスクは超人的に優れ、他は著しく劣る)を説明した。この不規則性はAIの主要な特徴であり、混乱の原因となっている。
LLMを活用した「しゃべるおさいふ」のバックエンド設計
メルカリグループのエンジニアが、LLMを用いた「しゃべるおさいふ」機能のバックエンド設計について解説している。同社はAIネイティブ企業を目指し、開発プロセスや業務効率化にAIを活用している。
実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化
LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。
大規模言語モデルの能力を向上させる新手法
研究者が、言語の構文変化や状態遷移を追跡する手法を開発し、大規模言語モデルの逐次推論能力を向上させた。
プロジェクト・ヴェンド:フェーズ2
プロジェクト・ヴェンドがフェーズ2に移行した。具体的な内容は不明だが、AI/テクノロジー分野における継続的な取り組みを示している。
LWiAI Podcast #228 - GPT 5.2、スケーリングエージェント、奇妙な汎化
OpenAIは最新モデルGPT-5.2を発表し、性能向上とマルチモーダル機能強化を実現したが、コスト増と知識カットオフ日変更を伴う。ディズニーはOpenAIに10億ドル投資し、ディズニーコンテンツ生成を計画している。
ジェミニ3フラッシュ:速度のために構築された最先端の知能
ジェミニ3フラッシュは、低コストで高速な最先端の知能を提供するAIモデルです。
OpenAIのGemini 3への回答、Runwayのインタラクティブワールド、DisneyとOpenAIの提携、低データ領域へのLLM適応
LLMの知識向上は断片的なプロセスで進んでおり、OpenAIとDisneyの提携や低データ領域への適応など、AI分野の最新動向を紹介。
Gemma Scope 2:AI安全コミュニティが複雑な言語モデルの挙動理解を深める支援
GoogleはGemma 3ファミリー全体でGemma Scope 2をリリースし、言語モデルの解釈可能性ツールを公開した。これによりAI安全コミュニティが複雑な言語モデルの挙動をより深く理解できるよう支援する。
AI週間レビュー #329 - GPT 5.2、GenAI.mil、ディズニーとSora
OpenAIがGPT-5.2モデルシリーズをリリースし、日常業務での利用を想定した「Instant」「Thinking」「Pro」の3バージョンを提供した。
NotebookLMで技術書を読む:初期理解・深掘り・理解確認のフェーズ設計
株式会社ABEJAの近藤氏が、NotebookLMを技術書の理解に活用する方法を紹介。初期理解フェーズではインフォグラムやスライド資料で全体像を把握し、フェーズ別にNotebookLMの活用を評価する。
月末の「請求書まだですか?」をゼロに。LLM×Slackで構築した、フリーランスに優しい請求書回収アシスタント
LLMを活用したSlackボットで、フリーランスの請求書回収業務を効率化。AIが形式不備をアシストし、管理工数削減とパートナー体験向上を実現した事例。
Claude APIを組織導入する際の実務ポイント - 階層制限・権限設計・請求管理の注意点
Claude APIの組織導入では、公式ドキュメントに記載されていない実務上の課題(階層制限、権限設計、請求管理)を実際の導入経験から解説し、円滑な導入を支援する。
Tinker: 一般提供開始と視覚入力機能
Thinking Machines LabがTinkerの一般提供を開始し、視覚入力機能を追加しました。
GPT 5.2がWindsurfで利用可能に
WindsurfがGPT 5.2をリリースし、期間限定で無料提供する。GPT 5以降で最大の知能向上を実現し、価格帯で最高水準のコーディングモデルとして同プラットフォームのデフォルトモデルとなる。
Windsurf 1.12.43:GPT-5.2 が利用可能に
エディタ「Windsurf」がバージョン 1.12.43 に更新され、同社 CEO の Jeff Wang 氏によると、エージェント型コーディングで SOTA を達成した新モデル「GPT-5.2」がデフォルト設定として導入された。
Claude Opus 4.5がトークンを節約、ホワイトハウスがAI駆動科学を推進、AmazonがNova 2 Proチェックポイントを公開、小型モデルが難解パズルを解決
AnthropicがClaude Opus 4.5のトークン節約機能を発表し、ホワイトハウスがAI駆動科学研究を推進する政策を発表した。AmazonはNova 2 Proチェックポイントを公開し、小型AIモデルが複雑なパズル解決に成功した。
FACTSベンチマークスイート:大規模言語モデルの事実性を体系的に評価
研究者らがFACTSベンチマークスイートを開発し、大規模言語モデルの事実性を体系的に評価する手法を提案した。
LWiAIポッドキャスト第227回 - ジェレミーが帰ってきた!DeepSeek 3.2、TPU、ネスト学習
アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。
ナノチャットのオーケストレーション:モデルのトレーニング
DagsterがRunPod上でLLMトレーニングの各段階を調整し、再現性・拡張性・GPU効率性を確保する方法を示している。
Amazon Nova Forge:「オープントレーニング」パラダイムで誰もが最先端AIを構築可能に
AmazonはNova Forgeサービスを発表し、顧客が独自データとAmazon Novaのトレーニングデータをモデル開発の各段階で混合できる「オープントレーニング」パラダイムを提供する。これにより、深いドメイン理解を実現しつつ「破滅的忘却」を防止する。
先週のAI #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5
DeepSeekはGPT-5やGemini 3 Proと対抗する新推論モデル「DeepSeek 3.2」を公開した。高速・低コストで高性能なオープンソースモデルであり、業界の競争を激化させる重要なリリースである。