#llm のAIニュース
952件の記事
アリババのオープンソースQwen 3.5、GPT-5 miniとClaude Sonnet 4.5に対抗し低コストを実現
アリババが新AIモデルQwen 3.5を発表。競合モデルと同等性能を低コストで提供し、AI市場の競争激化を示唆。
新手法によりLLM学習効率が向上
アイドル時間を活用して学習速度を2倍に向上させつつ精度を維持する手法が開発された。
エージェントの挙動は本番環境で初めてわかる
AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。
テクノロジー清算期を語る
現在のテクノロジー議論は重要性が増し、著者はより多くの対話を通じて共有されない考えを伝えようとしている。
GPT-5.3-CodexがGitHub.com、GitHub Mobile、Visual Studioで利用可能に
GPT-5.3-CodexがGitHub Copilot Chatで利用可能になり、Copilot Enterprise/Business/Pro/Pro+ユーザーがコード生成や開発支援を強化できます。
知性はパラメータ数ではなく時間についてである
AIモデルは大きくなるほど洞察力が低下するため、学習を継続させるには推論時間を短縮する必要がある。
知識へのアクセスが制限ではなくなったとき
大規模言語モデルへの反論を箱に閉じ込める思考実験を通じ、知識アクセスの限界がなくなる新たな段階を考察。
建設的回路増幅:標的サブネットワーク更新によるLLMの数学推論能力向上
LLM内部の特定タスクを担う「回路」と呼ばれる疎なサブネットワークを強化する手法を提案。標的的な更新により数学推論能力を向上させる研究。
Uberのエンジニアが上司のAI版を作成
Uberの従業員がCEOのチャットボットを作成し、プレゼン練習に活用している。同社はAIに全面的に取り組んでいる。
Anthropic、Claude Coworkプラグインでより多くの業界をターゲットに
AnthropicがClaude Coworkプラグインを拡大し、専門サービス業界など多様な業界へのAI導入を推進。
中国のLLMにおいて蒸留は本当に重要なのか?
記事は、強力なモデルの出力で弱モデルを学習する「蒸留」が米中AI競争で頻繁に議論されていると指摘。専門的な知識蒸留の定義を確認し、中国の大規模言語モデル開発においてこの手法がどの程度重要かを考察する。
AWSでDottxt Outlinesを使用してLLMから構造化出力を生成する
AWS MarketplaceのAmazon SageMakerでDottxtのOutlinesフレームワークを実装し、LLMからの構造化出力を実現する実践的アプローチを解説。
AI週間レビュー #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic対ペンタゴン
AnthropicがSonnet 4.6をリリース、GoogleはGemini 3.1 Proを発表。米国防総省はAI安全対策を巡りAnthropicとの契約停止を検討。
単一抽出器を超えて:LLM事前学習のためのHTMLからテキスト抽出の再考
大規模LLM事前学習データセット構築の初期段階であるHTMLからのテキスト抽出について、既存の単一抽出器の限界を指摘し、多様なウェブコンテンツに適応する抽出方法の必要性を提言する研究。
推論におけるCoTの可能性:トレースダイナミクスを詳しく見る
Chain-of-thought(CoT)プロンプトは、大規模言語モデルに人間のような推論を促す標準技術で、最終回答前に個々のステップを明示させる。
米Anthropic、中国AI研究所をClaudeの能力搾取で非難 米国はAIチップ輸出規制を議論
米Anthropicが中国AI企業3社をClaudeのAI能力を搾取したと非難。米国は中国のAI進展を遅らせるためチップ輸出規制を検討中。
Guide Labs、解釈可能な新種のLLMを発表
Guide Labsは、行動が容易に解釈可能な新アーキテクチャで訓練された80億パラメータのLLM「Steerling-8B」をオープンソース化しました。
国防長官、軍用AIを巡りAnthropic社CEOをペンタゴンに召喚
国防長官がAnthropic社CEOを召喚し、AI「Claude」の軍事利用を巡り緊張した協議を行った。供給網リスク指定の可能性を示唆。
Apple 推論と計画ワークショップ 2025
AppleがAIの推論と計画能力を向上させる研究を進めており、自律的なAIシステムの開発を目指している。
Claude Cコンパイラ:ソフトウェアの未来を示すもの
AnthropicのNicholas Carliniが、Claude Cコンパイラプロジェクトを通じて、AIがソフトウェア開発の未来をどのように変えるかを考察している。
オーラリティの万物理論
読書の衰退とSNSの台頭が、思考する人間のあり方を再び変えつつある。
Google副社長が警告、2種類のAIスタートアップは生き残れない可能性
生成AIの進化に伴い、LLMラッパーとAIアグリゲーターは利益率の縮小と差別化の難しさから存続が危ぶまれるとGoogle副社長が指摘。
解釈可能性
解釈可能性は、AIや機械学習モデルの意思決定プロセスを人間が理解できるようにする概念で、透明性と信頼性の向上を目指します。
社会への影響
この記事は、様々な要因や出来事が社会全体に及ぼす影響について考察しています。
インドのSarvam、競争激化する中でIndus AIチャットアプリをリリース
インドのAI企業Sarvamは、Indus AIチャットアプリをリリースした。同社はインド市場でOpenAIやAnthropicなどのグローバル勢と競争している。
UnslothとHugging Face Jobsで無料でAIモデルをトレーニング
UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。
GGMLとllama.cppがHFに参加し、ローカルAIの長期的な進歩を確保
GGMLとllama.cppがHugging Faceに参加し、オープンソースのローカルAI開発を強化し、長期的な進歩とコミュニティ主導のイノベーションを促進します。
最先端のサイバーセキュリティ能力を防御側に提供する
最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。
特定のAnthropicおよびOpenAIモデルの提供終了
GitHub Copilotの全機能で、特定のAnthropicとOpenAIモデルが2026年2月17日に提供終了されました。
大規模言語モデルに隠されたバイアス、気分、性格、抽象概念を暴く
MITが開発した新手法は、LLMの脆弱性を特定し、安全性と性能を向上させる可能性がある。
Gemini 3.1 ProがGitHub Copilotでパブリックプレビュー開始
Googleの最新コーディングモデルGemini 3.1 ProがGitHub Copilotに導入。編集とテストの効率的なループに優れ、開発者の生産性向上が期待される。
Gemini 3.1 ProがWindsurfで利用可能に
Gemini 3.1 ProがWindsurfで利用可能になり、LowとHighの思考バリアントを提供。期間限定でクレジット利用のプロモーション価格を実施中。
パーソナライゼーション機能はLLMをより協調的にする可能性がある
長期的な会話ではLLMがユーザーの見解を反映し始め、正確性が低下したり仮想のエコーチェンバーが生じる可能性がある。
エージェント時代におけるAI活用法ガイド
著者は、ChatGPT登場以来のガイドの中で今回が最大の変革と位置付ける。従来のチャットボットとの対話から、タスクを委任してツールを活用して実行する「エージェント」としてのAI利用が実用化されたことを説明し、この変化に対応した新しい活用法を提示している。
Gradioのgr.HTMLによるワンショットWebアプリケーション
Gradioのgr.HTMLコンポーネントを使うと、HTMLコードを1回書くだけで、どんなWebアプリでも簡単に作れます。
Claude Sonnet 4.6がWindsurfで利用可能に
Claude Sonnet 4.6がWindsurfでリリースされ、期間限定でセルフサービスユーザー向けに2倍または3倍のクレジット特典を提供しています。
ジェフ・ディーン深度インタビュー:1枚のメモがGeminiを生み出し、Google AIの反撃と10,000トークンの未来
Googleのチーフサイエンティストであるジェフ・ディーンが、蒸留技術の起源、1枚のメモでBrainとDeepMindの合併を促しGeminiを生み出した経緯、長いコンテキストやAIハードウェアのエネルギー効率、10,000トークン/秒の未来について語った。
動的フィルタリングによるWeb検索の精度と効率の向上
動的フィルタリング技術を活用することで、Web検索の精度と効率を同時に高める方法について説明しています。
Claude Sonnet 4.6の紹介
Claude Sonnet 4.6の新バージョンがリリースされました。AIモデルの性能向上と新機能を提供します。
先週のAIニュース #335 - Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0
AI週報の最新号では、Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0など、主要AIモデルのアップデートが多数報告されました。
Anthropicがバンガロールオフィスを開設し、インド全域で新たなパートナーシップを発表
AI企業Anthropicがインド・バンガロールにオフィスを開設し、インド全域で新たなパートナーシップを結ぶことで、同国での事業拡大を図っています。
速さは良さに非ず:AnthropicとOpenAIの高速モードに潜むもの
AnthropicとOpenAIがAIプログラミング向けの高速モードをほぼ同時に発表したが、技術アプローチは大きく異なる。Anthropicは同一モデルを2.5倍高速化し6倍の価格設定、OpenAIは蒸留モデルを専用チップで1000トークン/秒を実現しており、速度競争の背景には異なる製品哲学が存在する。
GPT-5.2が理論物理学で新たな成果を導出
GPT-5.2がグルーオン振幅の新公式を提案し、OpenAIと学術協力者が正式に証明・検証した。
社会科学研究のスケーリング
OpenAIの新オープンソースツールキットGABRIELは、GPTを活用して質的テキスト・画像を量的データに変換し、社会科学者が大規模な研究分析を可能にする。
マスク氏は「今年プログラミングは死ぬ」と発言、本当か?
イーロン・マスク氏がプログラミングの終焉を予言したとするツイートが技術界で話題になったが、実際の発言内容とは異なる。AIが直接バイナリを生成するという考えの限界と、プログラミングが実際にどのように変化しているかを考察する。
AIは自動的に法律サービスを安くしない
ハーバード法科大学院の学生との共著で、AIが知識労働を変革するとする見通しに対し、法律サービス分野では自動的な価格低下が起こらない可能性を示唆している。
GPT-5.3-Codex-SparkがWindsurfで利用可能に
OpenAIの超高速リアルタイムコーディング最適化モデルGPT-5.3-Codex-Sparkが、WindsurfのArena Mode FastおよびHybridバトルグループで利用可能になりました。
GPT-5.3-Codex-Sparkの紹介
初のリアルタイムコーディングモデルGPT-5.3-Codex-Sparkを発表。生成速度15倍、128kコンテキストを実現し、ChatGPT Proユーザー向けに研究プレビュー開始。
Windsurf 1.9552.21 の変更点
WindsurfエディタがGitHub PR拡張機能との互換性を修正し、Gemini 3.1 ProとClaude Sonnet 4.6を限定プロモーション価格で提供開始した。
エージェント使用量の増加
個別プランに含まれるエージェントの使用量が増加されました。