Jay Alammar の最新記事

研究

10件の記事

Substackへの移行

著者がブログを凍結し、Substackでの投稿を開始。執筆体験がより便利で、DeepSeek R-1の解説やTransformer LLMコースを紹介。

生成AIの重要性と現状、AIが世界を変革する可能性について論じた記事。Cohereブログでの8つの観察を紹介。

AI画像生成ツールを使用して、古いビデオゲームのグラフィックスを高解像度で再現する実験。Stable Diffusion、Dall-E、Midjourneyを比較検証。

AI画像生成モデルStable Diffusionを図解で解説。テキストから画像を生成する技術の仕組みを説明し、AI画像生成の最新動向を紹介。

CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。

最新の言語モデルは、データベースやウェブ検索を活用することで小型化しつつGPT-3並みの性能を実現。リトリーバルトランスフォーマーが鍵となる技術。

AI/MLモデルとその予測を人間が理解するためのツール・手法をまとめたガイドを紹介。

言語モデルの層間の隠れ状態を可視化することで、モデルの「思考プロセス」の手がかりを得られる。

トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。

GPT3などの大規模言語モデルの能力が注目を集め、技術界で話題となっている。