#llm のAIニュース

952件の記事

AIは法律業界の変革を始めているばかりである

ハーバード法科大学院の学生、ジャスティン・カール氏は、弁護士がAIをどの程度活用しているかについて言及した。調査結果にはばらつきがあるものの、AI導入は法律業界において始まったばかりの段階である。

Understanding AI·1月16日·★★★★

Anthropic経済指数:AI利用を理解するための新たな構成要素

Anthropicが2026年1月15日に発表した経済研究では、AI利用を理解するための新たな指標「Anthropic Economic Index」を導入した。

Anthropic Research·1月15日·★★★★

ツール導入時の法務確認リードタイム削減

DeNAグループがSaaS導入時の法務確認プロセスを効率化し、リードタイム削減を実現した取り組みについて紹介。

DeNA Engineering·1月15日

Salesforce、Slackbot AIエージェントを刷新し、MicrosoftやGoogleと職場AIで競争

SalesforceはSlackbotを単なる通知ツールからAIエージェントに刷新し、MicrosoftやGoogleとの職場AI競争を強化。

VentureBeat AI·1月13日·★★★★

事前学習済みLLMの位置埋め込みを削除することでコンテキストを拡張

SakanaAIが、事前学習済み大規模言語モデルの位置埋め込みを削除するDroPE手法を発表した。この手法は、大規模な計算コストを伴わずにコンテキスト長を拡張できる。

Sakana AI·1月12日·★★★★★

LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論

AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。

The Batch·1月9日

Nous ResearchのNousCoder-14B、オープンソースのコーディングモデルがClaude Codeの瞬間に着地

Nous Researchが公開したオープンソースのプログラミングモデルNousCoder-14Bは、より大規模な独自モデルと同等以上の性能を持つと主張している。

VentureBeat AI·1月8日·★★★★

AIがコードの大半を書くときの悲しみ

AIがほとんどのコードを生成するようになると、ソフトウェアエンジニアリングはどうなるか。開発者には悲しみが伴うと指摘。

Pragmatic Engineer·1月8日·★★★★

LWiAIポッドキャスト #230 - 2025年振り返り、NvidiaがGroqを買収、GLM 4.7、METR

NvidiaがAIチップスタートアップGroqを約200億ドルで買収。MetaもAIスタートアップManusを買収し、Z.AIはGLM-4.7を発表。

Last Week in AI·1月7日·★★★★★

MITの科学者が臨床AI時代の記憶化リスクを調査

MITの科学者が、データ収集アルゴリズムとサイバー攻撃が増加する中、臨床AIにおける患者データの記憶化リスクと医療倫理(ヒポクラテスの誓い)の保護について調査している。

MIT ML News·1月6日·★★★★

Claude Codeの開発者がワークフローを公開、開発者たちが熱狂

世界最先端のコーディングエージェントの開発者が自身のワークフローを公開し、エンジニアコミュニティが注目している。

VentureBeat AI·1月5日·★★★★

2025年の大規模言語モデルの現状:進歩、課題、予測

DeepSeek R1やRLVRから推論時のスケーリング、ベンチマーク、アーキテクチャまで、2025年のLLMの進展と2026年予測を概観。

Sebastian Raschka·12月30日·★★★★★

LLM研究論文:2025年リスト(7月から12月)

有料購読者向けに、2025年後半の注目すべきLLM研究論文リストを紹介する記事。著者が厳選した論文をまとめている。

Sebastian Raschka·12月30日·★★★★

Windsurf Next 1.13.106 の更新:Gemini 3 Flash が全ユーザーに提供開始

Windsurf Next 1.13.106 は、推論能力と高速性を兼ね備えた Gemini 3 Flash を全ユーザーに公開しました。このモデルはコーディングやエージェントワークフローに適しており、前世代より 3 倍高速な応答を実現しています。

Windsurf Next Changelog·12月27日·★★★★

Windsurf 1.13.5:Gemini 3 Flashの全ユーザー向け提供開始

Windsurfは、Gemini 3 Flashを全ユーザーに提供開始した。このモデルはPro級の推論能力とFlash級の速度を併せ持ち、反復開発やコーディング作業に最適化されている。

Windsurf Changelog·12月27日·★★★★

FDE募集開始から半年の振り返りと2026年の展望

LayerXのFDE(Forward Deployed Engineer)募集開始から半年を振り返り、組織と技術の両面から2026年の展望を述べる記事。

LayerX Tech Blog·12月26日

LWiAIポッドキャスト #229 - Gemini 3 Flash、ChatGPTアプリ、Nemotron 3

LWiAIポッドキャストが、OpenAIのGPT-5.2 Codex、GoogleのGemini Free Flash、NvidiaのTrion-3など、先週の主要なAIニュースを要約・議論した。

Last Week in AI·12月26日·★★★★★

メルペイ インターンでの挑戦と学び:EGP Cardsと向き合った3ヶ月間

メルペイのGrowth Platformでフロントエンド・エンジニアとしてインターンした経験談。EGP Cardsというプロジェクトに3ヶ月間取り組み、技術的挑戦と学びについて述べている。

Mercari Engineering·12月25日

今さらながらDeepSeek-R1の論文を読んでみた

中国DeepSeek社が公開した軽量で高品質なLLMについて、蒸留手法を用いた軽量化の技術的観点から考察。高価なGPUが不要で動かせる点が特徴。

ABEJA Tech Blog·12月24日·★★★★

フォワード・デプロイド・エンジニア(FDE)とは?顧客の業務改革を技術でリードするエンジニアの実像

FDEは顧客の現場で技術を活用し、業務改革をリードするエンジニアの役割を解説。AI Shiftのエンジニアが実例を紹介。

AI Shift Tech Blog·12月24日·★★★★

Strands + Amazon Bedrock AgentCore + Athenaで簡単データ分析システムを構築する

非エンジニアでも安全にデータ分析できる環境構築の課題を、Strands、Amazon Bedrock AgentCore、Athenaを組み合わせたシステムで解決する方法を紹介。

ABEJA Tech Blog·12月24日·★★★★

Fintech事業部における2025年のAI効率化の取り組み、あるいはラーメンの話

LayerX Fintech事業部が2025年にAIを活用して複数プロダクトの高速改善・リリースを実現した事例についての記事。

LayerX Tech Blog·12月24日

Windsurf Next 1.13.104のアップデート

Windsurfはバージョン1.13.104で並列マルチエージェントセッションやGitワークツリー機能を追加した。また、高性能コードモデルSWE-1.5を3ヶ月間無償提供し、開発者の利用環境を整備した。

Windsurf Next Changelog·12月24日·★★★★

Cursorでプログラミング言語を再学習する方法――AI駆動学習の4ステップ

AI駆動の開発ツール「Cursor」を活用し、プログラミング言語を効率的に再学習するための4段階の実践的な学習方法を紹介する記事です。

Mercari Engineering·12月23日

最新AI技術情報をキャッチアップするAIエージェントを作成し、研究開発業務の一部を自動化した

AI技術の急速な進歩に追いつくため、AIエージェントを開発し、研究開発業務の一部を自動化する試みを実施した。

ABEJA Tech Blog·12月23日

CocoIndexでナレッジグラフを更新しながらRAGを実施

LayerXの鷹取氏が、従来のNative RAGの構造的弱点を克服するため、CocoIndexを用いてナレッジグラフを更新しながらRAGを実行する手法を紹介している。

LayerX Tech Blog·12月22日

Grok コレクション API

xAIは、APIに最先端のRAGシステムを直接組み込んだ「Grok Collections API」を発表した。これにより、ユーザーはAPI経由でコレクション管理と高度な検索機能を利用可能になる。

xAI News·12月22日

AIタスクフォースにおける非AIタスク:AIツール開発の現場でこそ必要な「AI以外の」技術選定

メルカリのAIタスクフォース担当者が、AIツール開発においてAI以外の技術選定の重要性を述べる記事。

Mercari Engineering·12月21日·★★★★

AIの形状:不規則性、ボトルネック、顕著な特徴

筆者らは2023年、「ジャグドフロンティア」という用語を提唱し、AIが人間の直感とかけ離れた能力の偏り(特定のタスクは超人的に優れ、他は著しく劣る)を説明した。この不規則性はAIの主要な特徴であり、混乱の原因となっている。

One Useful Thing·12月21日·★★★★

LLMを活用した「しゃべるおさいふ」のバックエンド設計

メルカリグループのエンジニアが、LLMを用いた「しゃべるおさいふ」機能のバックエンド設計について解説している。同社はAIネイティブ企業を目指し、開発プロセスや業務効率化にAIを活用している。

Mercari Engineering·12月20日

実践!gpt-5-mini推論レイテンシ改善:パラメータ調整とプロンプトエンジニアリングによる高速化

LayerXのエンジニアが、推論モデルgpt-5-miniの本番運用で生じたレイテンシ問題を、推論パラメータ調整とプロンプトエンジニアリングにより精度を維持しながら改善した事例を紹介する。

LayerX Tech Blog·12月19日

大規模言語モデルの能力を向上させる新手法

研究者が、言語の構文変化や状態遷移を追跡する手法を開発し、大規模言語モデルの逐次推論能力を向上させた。

MIT ML News·12月18日·★★★★

プロジェクト・ヴェンド:フェーズ2

プロジェクト・ヴェンドがフェーズ2に移行した。具体的な内容は不明だが、AI/テクノロジー分野における継続的な取り組みを示している。

Anthropic Research·12月18日·★★★★

LWiAI Podcast #228 - GPT 5.2、スケーリングエージェント、奇妙な汎化

OpenAIは最新モデルGPT-5.2を発表し、性能向上とマルチモーダル機能強化を実現したが、コスト増と知識カットオフ日変更を伴う。ディズニーはOpenAIに10億ドル投資し、ディズニーコンテンツ生成を計画している。

Last Week in AI·12月18日·★★★★★

ジェミニ3フラッシュ:速度のために構築された最先端の知能

ジェミニ3フラッシュは、低コストで高速な最先端の知能を提供するAIモデルです。

Google DeepMind·12月17日·★★★★

OpenAIのGemini 3への回答、Runwayのインタラクティブワールド、DisneyとOpenAIの提携、低データ領域へのLLM適応

LLMの知識向上は断片的なプロセスで進んでおり、OpenAIとDisneyの提携や低データ領域への適応など、AI分野の最新動向を紹介。

The Batch·12月17日

Gemma Scope 2:AI安全コミュニティが複雑な言語モデルの挙動理解を深める支援

GoogleはGemma 3ファミリー全体でGemma Scope 2をリリースし、言語モデルの解釈可能性ツールを公開した。これによりAI安全コミュニティが複雑な言語モデルの挙動をより深く理解できるよう支援する。

Google DeepMind·12月16日

AI週間レビュー #329 - GPT 5.2、GenAI.mil、ディズニーとSora

OpenAIがGPT-5.2モデルシリーズをリリースし、日常業務での利用を想定した「Instant」「Thinking」「Pro」の3バージョンを提供した。

Last Week in AI·12月16日·★★★★

NotebookLMで技術書を読む:初期理解・深掘り・理解確認のフェーズ設計

株式会社ABEJAの近藤氏が、NotebookLMを技術書の理解に活用する方法を紹介。初期理解フェーズではインフォグラムやスライド資料で全体像を把握し、フェーズ別にNotebookLMの活用を評価する。

ABEJA Tech Blog·12月16日

月末の「請求書まだですか?」をゼロに。LLM×Slackで構築した、フリーランスに優しい請求書回収アシスタント

LLMを活用したSlackボットで、フリーランスの請求書回収業務を効率化。AIが形式不備をアシストし、管理工数削減とパートナー体験向上を実現した事例。

Algomatic Tech Blog·12月16日

Claude APIを組織導入する際の実務ポイント - 階層制限・権限設計・請求管理の注意点

Claude APIの組織導入では、公式ドキュメントに記載されていない実務上の課題(階層制限、権限設計、請求管理)を実際の導入経験から解説し、円滑な導入を支援する。

Mirai Translate Tech Blog·12月16日

Tinker: 一般提供開始と視覚入力機能

Thinking Machines LabがTinkerの一般提供を開始し、視覚入力機能を追加しました。

Thinking Machines Lab·12月12日·★★★★

GPT 5.2がWindsurfで利用可能に

WindsurfがGPT 5.2をリリースし、期間限定で無料提供する。GPT 5以降で最大の知能向上を実現し、価格帯で最高水準のコーディングモデルとして同プラットフォームのデフォルトモデルとなる。

Windsurf Blog·12月11日

Windsurf 1.12.43:GPT-5.2 が利用可能に

エディタ「Windsurf」がバージョン 1.12.43 に更新され、同社 CEO の Jeff Wang 氏によると、エージェント型コーディングで SOTA を達成した新モデル「GPT-5.2」がデフォルト設定として導入された。

Windsurf Changelog·12月11日

Claude Opus 4.5がトークンを節約、ホワイトハウスがAI駆動科学を推進、AmazonがNova 2 Proチェックポイントを公開、小型モデルが難解パズルを解決

AnthropicがClaude Opus 4.5のトークン節約機能を発表し、ホワイトハウスがAI駆動科学研究を推進する政策を発表した。AmazonはNova 2 Proチェックポイントを公開し、小型AIモデルが複雑なパズル解決に成功した。

The Batch·12月10日

FACTSベンチマークスイート:大規模言語モデルの事実性を体系的に評価

研究者らがFACTSベンチマークスイートを開発し、大規模言語モデルの事実性を体系的に評価する手法を提案した。

Google DeepMind·12月9日·★★★★

LWiAIポッドキャスト第227回 - ジェレミーが帰ってきた!DeepSeek 3.2、TPU、ネスト学習

アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。

Last Week in AI·12月9日·★★★★★

ナノチャットのオーケストレーション:モデルのトレーニング

DagsterがRunPod上でLLMトレーニングの各段階を調整し、再現性・拡張性・GPU効率性を確保する方法を示している。

Dagster Blog·12月9日

Amazon Nova Forge:「オープントレーニング」パラダイムで誰もが最先端AIを構築可能に

AmazonはNova Forgeサービスを発表し、顧客が独自データとAmazon Novaのトレーニングデータをモデル開発の各段階で混合できる「オープントレーニング」パラダイムを提供する。これにより、深いドメイン理解を実現しつつ「破滅的忘却」を防止する。

Amazon Science·12月9日·★★★★

先週のAI #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5

DeepSeekはGPT-5やGemini 3 Proと対抗する新推論モデル「DeepSeek 3.2」を公開した。高速・低コストで高性能なオープンソースモデルであり、業界の競争を激化させる重要なリリースである。

Last Week in AI·12月8日·★★★★