#llm のAIニュース

952件の記事

アリババのオープンソースQwen 3.5、GPT-5 miniとClaude Sonnet 4.5に対抗し低コストを実現

アリババが新AIモデルQwen 3.5を発表。競合モデルと同等性能を低コストで提供し、AI市場の競争激化を示唆。

The Decoder·2月26日·★★★★

新手法によりLLM学習効率が向上

アイドル時間を活用して学習速度を2倍に向上させつつ精度を維持する手法が開発された。

MIT ML News·2月26日·★★★★

エージェントの挙動は本番環境で初めてわかる

AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。

LangChain Blog·2月26日·★★★★

テクノロジー清算期を語る

現在のテクノロジー議論は重要性が増し、著者はより多くの対話を通じて共有されない考えを伝えようとしている。

Andrej Karpathy 厳選·2月26日·★★★★

GPT-5.3-CodexがGitHub.com、GitHub Mobile、Visual Studioで利用可能に

GPT-5.3-CodexがGitHub Copilot Chatで利用可能になり、Copilot Enterprise/Business/Pro/Pro+ユーザーがコード生成や開発支援を強化できます。

GitHub Changelog·2月26日

知性はパラメータ数ではなく時間についてである

AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。

Amazon Science·2月25日·★★★★

知識へのアクセスが制限ではなくなったとき

大規模言語モデルへの反論を箱に閉じ込める思考実験を通じ、知識アクセスの限界がなくなる新たな段階を考察。

Andrej Karpathy 厳選·2月25日·★★★★

建設的回路増幅:標的サブネットワーク更新によるLLMの数学推論能力向上

LLM内部の特定タスクを担う「回路」と呼ばれる疎なサブネットワークを強化する手法を提案。標的的な更新により数学推論能力を向上させる研究。

Apple Machine Learning·2月25日·★★★★

Uberのエンジニアが上司のAI版を作成

Uberの従業員がCEOのチャットボットを作成し、プレゼン練習に活用している。同社はAIに全面的に取り組んでいる。

TechCrunch AI·2月25日

Anthropic、Claude Coworkプラグインでより多くの業界をターゲットに

AnthropicがClaude Coworkプラグインを拡大し、専門サービス業界など多様な業界へのAI導入を推進。

AI Business·2月25日

中国のLLMにおいて蒸留は本当に重要なのか?

記事は、強力なモデルの出力で弱モデルを学習する「蒸留」が米中AI競争で頻繁に議論されていると指摘。専門的な知識蒸留の定義を確認し、中国の大規模言語モデル開発においてこの手法がどの程度重要かを考察する。

Interconnects·2月25日·★★★★

AWSでDottxt Outlinesを使用してLLMから構造化出力を生成する

AWS MarketplaceのAmazon SageMakerでDottxtのOutlinesフレームワークを実装し、LLMからの構造化出力を実現する実践的アプローチを解説。

AWS Machine Learning Blog·2月25日·★★★★

AI週間レビュー #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic対ペンタゴン

AnthropicがSonnet 4.6をリリース、GoogleはGemini 3.1 Proを発表。米国防総省はAI安全対策を巡りAnthropicとの契約停止を検討。

Last Week in AI·2月24日·★★★★

単一抽出器を超えて:LLM事前学習のためのHTMLからテキスト抽出の再考

大規模LLM事前学習データセット構築の初期段階であるHTMLからのテキスト抽出について、既存の単一抽出器の限界を指摘し、多様なウェブコンテンツに適応する抽出方法の必要性を提言する研究。

Apple Machine Learning·2月24日·★★★★

推論におけるCoTの可能性:トレースダイナミクスを詳しく見る

Chain-of-thought(CoT)プロンプトは、大規模言語モデルに人間のような推論を促す標準技術で、最終回答前に個々のステップを明示させる。

Apple Machine Learning·2月24日·★★★★

米Anthropic、中国AI研究所をClaudeの能力搾取で非難 米国はAIチップ輸出規制を議論

米Anthropicが中国AI企業3社をClaudeのAI能力を搾取したと非難。米国は中国のAI進展を遅らせるためチップ輸出規制を検討中。

TechCrunch AI·2月24日·★★★★

Guide Labs、解釈可能な新種のLLMを発表

Guide Labsは、行動が容易に解釈可能な新アーキテクチャで訓練された80億パラメータのLLM「Steerling-8B」をオープンソース化しました。

TechCrunch AI·2月24日·★★★★

国防長官、軍用AIを巡りAnthropic社CEOをペンタゴンに召喚

国防長官がAnthropic社CEOを召喚し、AI「Claude」の軍事利用を巡り緊張した協議を行った。供給網リスク指定の可能性を示唆。

TechCrunch AI·2月23日·★★★★

Apple 推論と計画ワークショップ 2025

AppleがAIの推論と計画能力を向上させる研究を進めており、自律的なAIシステムの開発を目指している。

Apple Machine Learning·2月23日·★★★★

Claude Cコンパイラ:ソフトウェアの未来を示すもの

AnthropicのNicholas Carliniが、Claude Cコンパイラプロジェクトを通じて、AIがソフトウェア開発の未来をどのように変えるかを考察している。

Andrej Karpathy 厳選·2月23日·★★★★

オーラリティの万物理論

読書の衰退とSNSの台頭が、思考する人間のあり方を再び変えつつある。

Andrej Karpathy 厳選·2月22日

Google副社長が警告、2種類のAIスタートアップは生き残れない可能性

生成AIの進化に伴い、LLMラッパーとAIアグリゲーターは利益率の縮小と差別化の難しさから存続が危ぶまれるとGoogle副社長が指摘。

TechCrunch AI·2月22日·★★★★

解釈可能性

解釈可能性は、AIや機械学習モデルの意思決定プロセスを人間が理解できるようにする概念で、透明性と信頼性の向上を目指します。

Anthropic Research·2月21日·★★★★

社会への影響

この記事は、様々な要因や出来事が社会全体に及ぼす影響について考察しています。

Anthropic Research·2月21日·★★★★

インドのSarvam、競争激化する中でIndus AIチャットアプリをリリース

インドのAI企業Sarvamは、Indus AIチャットアプリをリリースした。同社はインド市場でOpenAIやAnthropicなどのグローバル勢と競争している。

TechCrunch AI·2月21日·★★★★

UnslothとHugging Face Jobsで無料でAIモデルをトレーニング

UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。

Hugging Face Blog·2月20日

GGMLとllama.cppがHFに参加し、ローカルAIの長期的な進歩を確保

GGMLとllama.cppがHugging Faceに参加し、オープンソースのローカルAI開発を強化し、長期的な進歩とコミュニティ主導のイノベーションを促進します。

Hugging Face Blog·2月20日·★★★★

最先端のサイバーセキュリティ能力を防御側に提供する

最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。

Anthropic News·2月20日·★★★★

特定のAnthropicおよびOpenAIモデルの提供終了

GitHub Copilotの全機能で、特定のAnthropicとOpenAIモデルが2026年2月17日に提供終了されました。

GitHub Changelog·2月20日

大規模言語モデルに隠されたバイアス、気分、性格、抽象概念を暴く

MITが開発した新手法は、LLMの脆弱性を特定し、安全性と性能を向上させる可能性がある。

MIT ML News·2月20日·★★★★

Gemini 3.1 ProがGitHub Copilotでパブリックプレビュー開始

Googleの最新コーディングモデルGemini 3.1 ProがGitHub Copilotに導入。編集とテストの効率的なループに優れ、開発者の生産性向上が期待される。

GitHub Changelog·2月20日·★★★★

Gemini 3.1 ProがWindsurfで利用可能に

Gemini 3.1 ProがWindsurfで利用可能になり、LowとHighの思考バリアントを提供。期間限定でクレジット利用のプロモーション価格を実施中。

Windsurf Blog·2月20日

パーソナライゼーション機能はLLMをより協調的にする可能性がある

長期的な会話ではLLMがユーザーの見解を反映し始め、正確性が低下したり仮想のエコーチェンバーが生じる可能性がある。

MIT ML News·2月18日·★★★★

エージェント時代におけるAI活用法ガイド

著者は、ChatGPT登場以来のガイドの中で今回が最大の変革と位置付ける。従来のチャットボットとの対話から、タスクを委任してツールを活用して実行する「エージェント」としてのAI利用が実用化されたことを説明し、この変化に対応した新しい活用法を提示している。

One Useful Thing·2月18日·★★★★

Gradioのgr.HTMLによるワンショットWebアプリケーション

Gradioのgr.HTMLコンポーネントを使うと、HTMLコードを1回書くだけで、どんなWebアプリでも簡単に作れます。

Hugging Face Blog·2月18日·★★★★

Claude Sonnet 4.6がWindsurfで利用可能に

Claude Sonnet 4.6がWindsurfでリリースされ、期間限定でセルフサービスユーザー向けに2倍または3倍のクレジット特典を提供しています。

Windsurf Blog·2月17日

ジェフ・ディーン深度インタビュー:1枚のメモがGeminiを生み出し、Google AIの反撃と10,000トークンの未来

Googleのチーフサイエンティストであるジェフ・ディーンが、蒸留技術の起源、1枚のメモでBrainとDeepMindの合併を促しGeminiを生み出した経緯、長いコンテキストやAIハードウェアのエネルギー効率、10,000トークン/秒の未来について語った。

宝玉的分享·2月17日·★★★★

動的フィルタリングによるWeb検索の精度と効率の向上

動的フィルタリング技術を活用することで、Web検索の精度と効率を同時に高める方法について説明しています。

Claude Blog·2月17日·★★★★

Claude Sonnet 4.6の紹介

Claude Sonnet 4.6の新バージョンがリリースされました。AIモデルの性能向上と新機能を提供します。

Anthropic News·2月17日·★★★★

先週のAIニュース #335 - Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0

AI週報の最新号では、Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0など、主要AIモデルのアップデートが多数報告されました。

Last Week in AI·2月16日·★★★★

Anthropicがバンガロールオフィスを開設し、インド全域で新たなパートナーシップを発表

AI企業Anthropicがインド・バンガロールにオフィスを開設し、インド全域で新たなパートナーシップを結ぶことで、同国での事業拡大を図っています。

Anthropic News·2月16日·★★★★

速さは良さに非ず:AnthropicとOpenAIの高速モードに潜むもの

AnthropicとOpenAIがAIプログラミング向けの高速モードをほぼ同時に発表したが、技術アプローチは大きく異なる。Anthropicは同一モデルを2.5倍高速化し6倍の価格設定、OpenAIは蒸留モデルを専用チップで1000トークン/秒を実現しており、速度競争の背景には異なる製品哲学が存在する。

宝玉的分享·2月15日·★★★★

GPT-5.2が理論物理学で新たな成果を導出

GPT-5.2がグルーオン振幅の新公式を提案し、OpenAIと学術協力者が正式に証明・検証した。

OpenAI News·2月13日·★★★★

社会科学研究のスケーリング

OpenAIの新オープンソースツールキットGABRIELは、GPTを活用して質的テキスト・画像を量的データに変換し、社会科学者が大規模な研究分析を可能にする。

OpenAI News·2月13日·★★★★

マスク氏は「今年プログラミングは死ぬ」と発言、本当か?

イーロン・マスク氏がプログラミングの終焉を予言したとするツイートが技術界で話題になったが、実際の発言内容とは異なる。AIが直接バイナリを生成するという考えの限界と、プログラミングが実際にどのように変化しているかを考察する。

宝玉的分享·2月13日

AIは自動的に法律サービスを安くしない

ハーバード法科大学院の学生との共著で、AIが知識労働を変革するとする見通しに対し、法律サービス分野では自動的な価格低下が起こらない可能性を示唆している。

AI Snake Oil·2月13日·★★★★

GPT-5.3-Codex-SparkがWindsurfで利用可能に

OpenAIの超高速リアルタイムコーディング最適化モデルGPT-5.3-Codex-Sparkが、WindsurfのArena Mode FastおよびHybridバトルグループで利用可能になりました。

Windsurf Blog·2月12日

GPT-5.3-Codex-Sparkの紹介

初のリアルタイムコーディングモデルGPT-5.3-Codex-Sparkを発表。生成速度15倍、128kコンテキストを実現し、ChatGPT Proユーザー向けに研究プレビュー開始。

OpenAI News·2月12日·★★★★

Windsurf 1.9552.21 の変更点

WindsurfエディタがGitHub PR拡張機能との互換性を修正し、Gemini 3.1 ProとClaude Sonnet 4.6を限定プロモーション価格で提供開始した。

Windsurf Changelog·2月12日·★★★★

エージェント使用量の増加

個別プランに含まれるエージェントの使用量が増加されました。

Cursor Blog·2月11日