Jay Alammar の最新記事
研究10件の記事
Substackへの移行
著者がブログを凍結し、Substackでの投稿を開始。執筆体験がより便利で、DeepSeek R-1の解説やTransformer LLMコースを紹介。
Jay Alammar·3月26日
生成AIとAI製品の競争優位性
生成AIの重要性と現状、AIが世界を変革する可能性について論じた記事。Cohereブログでの8つの観察を紹介。
Jay Alammar·5月9日
AI画像生成で古いコンピューターグラフィックスを再構築
AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。
Jay Alammar·1月1日
図解でわかるStable Diffusion
AI画像生成モデルStable Diffusionを図解で解説。テキストから画像を生成する技術の仕組みを説明し、AI画像生成の最新動向を紹介。
Jay Alammar·10月4日
Cohereによる大規模言語モデルの実世界への応用
CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。
Jay Alammar·3月7日
図解リトリーバルトランスフォーマー
最新の言語モデルは、データベースやウェブ検索を活用することで小型化しつつGPT-3並みの性能を実現。リトリーバルトランスフォーマーが鍵となる技術。
Jay Alammar·1月3日·★★★★
説明可能なAIチートシート
AI/MLモデルとその予測を人間が理解するためのツール・手法をまとめたガイドを紹介。
Jay Alammar·5月4日
言葉を見つけること:言語モデルの隠れ状態可視化
言語モデルの層間の隠れ状態を可視化することで、モデルの「思考プロセス」の手がかりを得られる。
Jay Alammar·1月19日·★★★★
トランスフォーマー言語モデルを説明するためのインターフェース
トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。
Jay Alammar·12月17日
GPT3の仕組み - ビジュアライゼーションとアニメーション
GPT3などの大規模言語モデルの能力が注目を集め、技術界で話題となっている。
Jay Alammar·7月27日