#llm のAIニュース
413件の記事
Claudeモデル廃止方針
古いClaudeモデルの廃止と保存に関する方針について
体現LLMの反射的テスト計画
試行錯誤から学習する体現LLMの新たな研究手法
LLM拡張のデータエンジニアリング
大規模言語モデルの拡張におけるデータエンジニアリング技術について
知性はパラメータ数ではなく時間についてである
AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。
知識へのアクセスが制限ではなくなったとき
大規模言語モデルへの反論を箱に閉じ込める思考実験を通じ、知識アクセスの限界がなくなる新たな段階を考察。
Qwen 3.5ファミリー発表
Qwen 3.5モデルファミリーがリリース、ビジョン機能内蔵
Inception Labsの拡散LLM推論速度
Inception Labsの拡散LLMが高速な推論性能を示す技術的進展
建設的回路増幅:標的サブネットワーク更新によるLLMの数学推論能力向上
LLM内部の特定タスクを担う「回路」と呼ばれる疎なサブネットワークを強化する手法を提案。標的的な更新により数学推論能力を向上させる研究。
Uberのエンジニアが上司のAI版を作成
Uberの従業員がCEOのチャットボットを作成し、プレゼン練習に活用している。同社はAIに全面的に取り組んでいる。
Qwen 3.5モデル発表
64GB Macで動作するQwen 3.5モデルの初公開
Anthropic、Claude Coworkプラグインでより多くの業界をターゲットに
AnthropicがClaude Coworkプラグインを拡大し、専門サービス業界など多様な業界へのAI導入を推進。
ロボティクス向け隠れ報酬手法
トークン確率を隠れゼロショット報酬として活用する新手法
AWSでDottxt Outlinesを使用してLLMから構造化出力を生成する
AWS MarketplaceのAmazon SageMakerでDottxtのOutlinesフレームワークを実装し、LLMからの構造化出力を実現する実践的アプローチを解説。
LFM2:24b-a2bモデル発表
Liquid AIの最新オンデバイスモデルLFM2:24b-a2bがリリース
AI週間レビュー #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic対ペンタゴン
AnthropicがSonnet 4.6をリリース、GoogleはGemini 3.1 Proを発表。米国防総省はAI安全対策を巡りAnthropicとの契約停止を検討。
Ollama最新版リリース
AI開発ツールOllamaの最新版が公開されました
Ollama 0.17でOpenClaw連携強化
Ollama 0.17リリース、OpenClawとの連携がより簡単に
単一抽出器を超えて:LLM事前学習のためのHTMLからテキスト抽出の再考
大規模LLM事前学習データセット構築の初期段階であるHTMLからのテキスト抽出について、既存の単一抽出器の限界を指摘し、多様なウェブコンテンツに適応する抽出方法の必要性を提言する研究。
推論におけるCoTの可能性:トレースダイナミクスを詳しく見る
Chain-of-thought(CoT)プロンプトは、大規模言語モデルに人間のような推論を促す標準技術で、最終回答前に個々のステップを明示させる。
DeepMind新研究:LLMの多エージェント学習
Google DeepMindがLLMによる新たな多エージェント学習の可能性を研究
米Anthropic、中国AI研究所をClaudeの能力搾取で非難 米国はAIチップ輸出規制を議論
米Anthropicが中国AI企業3社をClaudeのAI能力を搾取したと非難。米国は中国のAI進展を遅らせるためチップ輸出規制を検討中。
AIコーディング評価基準の変更
フロンティアAIモデルのコーディング評価基準が成熟に伴い変更
Guide Labs、解釈可能な新種のLLMを発表
Guide Labsは、行動が容易に解釈可能な新アーキテクチャで訓練された80億パラメータのLLM「Steerling-8B」をオープンソース化しました。
VESPO: LLM訓練の新手法
シーケンスレベル軟方策最適化による安定したオフポリシーLLM訓練手法
国防長官、軍用AIを巡りAnthropic社CEOをペンタゴンに召喚
国防長官がAnthropic社CEOを召喚し、AI「Claude」の軍事利用を巡り緊張した協議を行った。供給網リスク指定の可能性を示唆。
Apple 推論と計画ワークショップ 2025
AppleがAIの推論と計画能力を向上させる研究を進めており、自律的なAIシステムの開発を目指している。
Claude Cコンパイラ:ソフトウェアの未来を示すもの
AnthropicのNicholas Carliniが、Claude Cコンパイラプロジェクトを通じて、AIがソフトウェア開発の未来をどのように変えるかを考察している。
Google論文がLLM推論評価に新提案
Googleの新論文が大規模言語モデルの推論能力測定方法に疑問を提示
解釈可能性
解釈可能性は、AIや機械学習モデルの意思決定プロセスを人間が理解できるようにする概念で、透明性と信頼性の向上を目指します。
社会への影響
この記事は、様々な要因や出来事が社会全体に及ぼす影響について考察しています。
India’s Sarvam launches Indus AI chat app as competition heats up
ClaudeがGitHubリポジトリをクローン可能
ClaudeチャットがGitHubリポジトリをクローンできる機能を確認
ClaudeのPR自動修正機能
PR監視とCI自動修正機能を発表。開発効率向上の新機能。
Gemini 3.1 Pro発表
Google AIが新モデルGemini 3.1 Proを発表
オーケストレーション設計の最適化
LLMのオーケストレーション設計がモデルスケーリングとは独立した最適化目標に
日本語の自然さを測る評価手法の検証
Preferred NetworksがLLM PLaMo開発で、日本語の自然さを評価するベンチマーク手法を検証。英語と異なり日本語向けの評価基準構築が重要と指摘。
UnslothとHugging Face Jobsで無料でAIモデルをトレーニング
UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。
GGMLとllama.cppがHFに参加し、ローカルAIの長期的な進歩を確保
GGMLとllama.cppがHugging Faceに参加し、オープンソースのローカルAI開発を強化し、長期的な進歩とコミュニティ主導のイノベーションを促進します。
最先端のサイバーセキュリティ能力を防御側に提供する
最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。
Gemini 3.1 Pro 全ユーザー公開
Perplexity Pro/Maxユーザー向けにGemini 3.1 Proが利用可能に
Google AI 3.1 Pro リリース
GoogleがAIモデル3.1 Proを消費者・開発者向け製品に導入
Gemini 3.1 Pro発表
Google AIが新モデルGemini 3.1 Proを発表。推論能力が大幅向上。
特定のAnthropicおよびOpenAIモデルの提供終了
GitHub Copilotの全機能で、特定のAnthropicとOpenAIモデルが2026年2月17日に提供終了されました。
Gemini 3.1 ProがGitHub Copilotでパブリックプレビュー開始
Googleの最新コーディングモデルGemini 3.1 ProがGitHub Copilotに導入。編集とテストの効率的なループに優れ、開発者の生産性向上が期待される。
Gemini 3.1 Pro発表
Demis HassabisがGemini 3.1 Proを発表、推論能力など大幅改善
Gemini 3.1 Pro リリース
WindsurfでGemini 3.1 Proが利用可能に、Arena Modeでも提供開始
Gemini 3.1 Pro 提供開始
Gemini 3.1 ProがGeminiアプリで提供開始、Google AI Pro/Ultraユーザー限定
Gemini 3.1 Pro発表
Google DeepMindがGemini 3.1 Proを発表、知能を大幅改善
Qwen3.5がDifyで利用可能に
長文コンテキストとマルチモーダル対応のQwen3.5がDifyでリリース
Gradioのgr.HTMLによるワンショットWebアプリケーション
Gradioのgr.HTMLコンポーネントを使うと、HTMLコードを1回書くだけで、どんなWebアプリでも簡単に作れます。