#llm のAIニュース

413件の記事

Claudeモデル廃止方針

古いClaudeモデルの廃止と保存に関する方針について

X: Anthropic·2月26日

体現LLMの反射的テスト計画

試行錯誤から学習する体現LLMの新たな研究手法

X: AK·2月26日·★★★★

LLM拡張のデータエンジニアリング

大規模言語モデルの拡張におけるデータエンジニアリング技術について

X: AK·2月26日

知性はパラメータ数ではなく時間についてである

AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。

Amazon Science·2月25日·★★★★

知識へのアクセスが制限ではなくなったとき

大規模言語モデルへの反論を箱に閉じ込める思考実験を通じ、知識アクセスの限界がなくなる新たな段階を考察。

Andrej Karpathy 厳選·2月25日·★★★★

Qwen 3.5ファミリー発表

Qwen 3.5モデルファミリーがリリース、ビジョン機能内蔵

X: ollama·2月25日·★★★★

Inception Labsの拡散LLM推論速度

Inception Labsの拡散LLMが高速な推論性能を示す技術的進展

X: Andrew Ng·2月25日

建設的回路増幅:標的サブネットワーク更新によるLLMの数学推論能力向上

LLM内部の特定タスクを担う「回路」と呼ばれる疎なサブネットワークを強化する手法を提案。標的的な更新により数学推論能力を向上させる研究。

Apple Machine Learning·2月25日·★★★★

Uberのエンジニアが上司のAI版を作成

Uberの従業員がCEOのチャットボットを作成し、プレゼン練習に活用している。同社はAIに全面的に取り組んでいる。

TechCrunch AI·2月25日

Qwen 3.5モデル発表

64GB Macで動作するQwen 3.5モデルの初公開

X: Simon Willison·2月25日

Anthropic、Claude Coworkプラグインでより多くの業界をターゲットに

AnthropicがClaude Coworkプラグインを拡大し、専門サービス業界など多様な業界へのAI導入を推進。

AI Business·2月25日

ロボティクス向け隠れ報酬手法

トークン確率を隠れゼロショット報酬として活用する新手法

X: AK·2月25日·★★★★

AWSでDottxt Outlinesを使用してLLMから構造化出力を生成する

AWS MarketplaceのAmazon SageMakerでDottxtのOutlinesフレームワークを実装し、LLMからの構造化出力を実現する実践的アプローチを解説。

AWS Machine Learning Blog·2月25日·★★★★

LFM2:24b-a2bモデル発表

Liquid AIの最新オンデバイスモデルLFM2:24b-a2bがリリース

X: ollama·2月24日

AI週間レビュー #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic対ペンタゴン

AnthropicがSonnet 4.6をリリース、GoogleはGemini 3.1 Proを発表。米国防総省はAI安全対策を巡りAnthropicとの契約停止を検討。

Last Week in AI·2月24日·★★★★

Ollama最新版リリース

AI開発ツールOllamaの最新版が公開されました

X: ollama·2月24日

Ollama 0.17でOpenClaw連携強化

Ollama 0.17リリース、OpenClawとの連携がより簡単に

X: ollama·2月24日

単一抽出器を超えて:LLM事前学習のためのHTMLからテキスト抽出の再考

大規模LLM事前学習データセット構築の初期段階であるHTMLからのテキスト抽出について、既存の単一抽出器の限界を指摘し、多様なウェブコンテンツに適応する抽出方法の必要性を提言する研究。

Apple Machine Learning·2月24日·★★★★

推論におけるCoTの可能性:トレースダイナミクスを詳しく見る

Chain-of-thought(CoT)プロンプトは、大規模言語モデルに人間のような推論を促す標準技術で、最終回答前に個々のステップを明示させる。

Apple Machine Learning·2月24日·★★★★

DeepMind新研究:LLMの多エージェント学習

Google DeepMindがLLMによる新たな多エージェント学習の可能性を研究

X: elvis·2月24日·★★★★

米Anthropic、中国AI研究所をClaudeの能力搾取で非難 米国はAIチップ輸出規制を議論

米Anthropicが中国AI企業3社をClaudeのAI能力を搾取したと非難。米国は中国のAI進展を遅らせるためチップ輸出規制を検討中。

TechCrunch AI·2月24日·★★★★

AIコーディング評価基準の変更

フロンティアAIモデルのコーディング評価基準が成熟に伴い変更

X: OpenAI Developers·2月24日·★★★★

Guide Labs、解釈可能な新種のLLMを発表

Guide Labsは、行動が容易に解釈可能な新アーキテクチャで訓練された80億パラメータのLLM「Steerling-8B」をオープンソース化しました。

TechCrunch AI·2月24日·★★★★

VESPO: LLM訓練の新手法

シーケンスレベル軟方策最適化による安定したオフポリシーLLM訓練手法

X: AK·2月23日·★★★★

国防長官、軍用AIを巡りAnthropic社CEOをペンタゴンに召喚

国防長官がAnthropic社CEOを召喚し、AI「Claude」の軍事利用を巡り緊張した協議を行った。供給網リスク指定の可能性を示唆。

TechCrunch AI·2月23日·★★★★

Apple 推論と計画ワークショップ 2025

AppleがAIの推論と計画能力を向上させる研究を進めており、自律的なAIシステムの開発を目指している。

Apple Machine Learning·2月23日·★★★★

Claude Cコンパイラ:ソフトウェアの未来を示すもの

AnthropicのNicholas Carliniが、Claude Cコンパイラプロジェクトを通じて、AIがソフトウェア開発の未来をどのように変えるかを考察している。

Andrej Karpathy 厳選·2月23日·★★★★

Google論文がLLM推論評価に新提案

Googleの新論文が大規模言語モデルの推論能力測定方法に疑問を提示

X: elvis·2月22日·★★★★

解釈可能性

解釈可能性は、AIや機械学習モデルの意思決定プロセスを人間が理解できるようにする概念で、透明性と信頼性の向上を目指します。

Anthropic Research·2月21日·★★★★

社会への影響

この記事は、様々な要因や出来事が社会全体に及ぼす影響について考察しています。

Anthropic Research·2月21日·★★★★

India’s Sarvam launches Indus AI chat app as competition heats up

TechCrunch AI·2月21日·★★★★

ClaudeがGitHubリポジトリをクローン可能

ClaudeチャットがGitHubリポジトリをクローンできる機能を確認

X: Simon Willison·2月21日

ClaudeのPR自動修正機能

PR監視とCI自動修正機能を発表。開発効率向上の新機能。

X: Claude·2月21日·★★★★

Gemini 3.1 Pro発表

Google AIが新モデルGemini 3.1 Proを発表

X: Google AI·2月21日·★★★★

オーケストレーション設計の最適化

LLMのオーケストレーション設計がモデルスケーリングとは独立した最適化目標に

X: elvis·2月20日·★★★★

日本語の自然さを測る評価手法の検証

Preferred NetworksがLLM PLaMo開発で、日本語の自然さを評価するベンチマーク手法を検証。英語と異なり日本語向けの評価基準構築が重要と指摘。

Preferred Networks·2月20日

UnslothとHugging Face Jobsで無料でAIモデルをトレーニング

UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。

Hugging Face Blog·2月20日

GGMLとllama.cppがHFに参加し、ローカルAIの長期的な進歩を確保

GGMLとllama.cppがHugging Faceに参加し、オープンソースのローカルAI開発を強化し、長期的な進歩とコミュニティ主導のイノベーションを促進します。

Hugging Face Blog·2月20日·★★★★

最先端のサイバーセキュリティ能力を防御側に提供する

最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。

Anthropic News·2月20日·★★★★

Gemini 3.1 Pro 全ユーザー公開

Perplexity Pro/Maxユーザー向けにGemini 3.1 Proが利用可能に

X: Perplexity·2月20日

Google AI 3.1 Pro リリース

GoogleがAIモデル3.1 Proを消費者・開発者向け製品に導入

X: Google AI·2月20日

Gemini 3.1 Pro発表

Google AIが新モデルGemini 3.1 Proを発表。推論能力が大幅向上。

X: Google AI·2月20日·★★★★

特定のAnthropicおよびOpenAIモデルの提供終了

GitHub Copilotの全機能で、特定のAnthropicとOpenAIモデルが2026年2月17日に提供終了されました。

GitHub Changelog·2月20日

Gemini 3.1 ProがGitHub Copilotでパブリックプレビュー開始

Googleの最新コーディングモデルGemini 3.1 ProがGitHub Copilotに導入。編集とテストの効率的なループに優れ、開発者の生産性向上が期待される。

GitHub Changelog·2月20日·★★★★

Gemini 3.1 Pro発表

Demis HassabisがGemini 3.1 Proを発表、推論能力など大幅改善

X: Demis Hassabis·2月20日·★★★★

Gemini 3.1 Pro リリース

WindsurfでGemini 3.1 Proが利用可能に、Arena Modeでも提供開始

X: Windsurf·2月20日

Gemini 3.1 Pro 提供開始

Gemini 3.1 ProがGeminiアプリで提供開始、Google AI Pro/Ultraユーザー限定

X: Google DeepMind·2月20日·★★★★

Gemini 3.1 Pro発表

Google DeepMindがGemini 3.1 Proを発表、知能を大幅改善

X: Google DeepMind·2月20日·★★★★

Qwen3.5がDifyで利用可能に

長文コンテキストとマルチモーダル対応のQwen3.5がDifyでリリース

X: Dify·2月18日

Gradioのgr.HTMLによるワンショットWebアプリケーション

Gradioのgr.HTMLコンポーネントを使うと、HTMLコードを1回書くだけで、どんなWebアプリでも簡単に作れます。

Hugging Face Blog·2月18日·★★★★