#llm のAIニュース
413件の記事
LLMデータをキュレーションするツール
OpenAIが、大規模言語モデル(LLM)の学習データを管理・精査するためのツールを発表した。このツールは、データ品質の向上とモデル性能の最適化を目的としている。
Grokの発表
『銀河ヒッチハイク・ガイド』に着想を得たAI「Grok」は、ほぼあらゆる質問に答え、さらに適切な質問を提案することを目指しています。
vLLMと大規模モデル
vLLMは大規模言語モデルの推論速度と効率を向上させる推論エンジンであり、AI業界で注目されている技術です。
クライアントサイド技術でLLM搭載Webアプリを構築する
オープンソースのローカルソフトウェアを使用し、LangChainの人気ユースケースであるRAG(文書検索拡張生成)を実装し、文書との対話を可能にする方法を紹介。
Ollamaが公式Dockerイメージとして利用可能に
Ollamaが公式Dockerイメージで提供開始。MacではDocker Desktopで、LinuxではGPUアクセラレーション付きコンテナ内で実行可能になりました。
ObsidianノートでのLLM活用
ObsidianなどのノートツールでOllamaを使用してローカルLLMを組み込む方法について解説しています。
Code Llamaのプロンプト方法
Code Llamaのプロンプト構造、バリエーション、機能(指示、コード補完、中間補完)について解説するガイドです。
ローカルでCode Llamaを実行する
MetaのCode LlamaがOllamaで利用可能になり、ローカル環境で試せるようになりました。
ローカルでLlama 2の検閲なしモデルを実行する
Llama 2の検閲ありモデルと検閲なしモデルの実行例を比較し、ローカル環境での使用方法を解説します。
BERTを用いたスクレイピング記事からのノイズ除去とChatGPTとの比較
研究者が、インターネットからスクレイピングしたHTML記事から広告やメタデータなどのノイズを除去するためにBERTモデルを使用し、その性能をChatGPTと比較した研究を発表した。
500件の検索クエリでChatGPTとGoogleを評価
研究者が500件の検索クエリでChatGPTとGoogleを比較した結果、ChatGPTはコーディング分野でGoogleを圧倒し、一般情報では互角の性能を示した。これは検索体験に最適化されていないにもかかわらず達成された。
大規模言語モデルの人間評価:Hugging FaceのBLOOMはどれほど優れているか?
Hugging Faceが1760億パラメータの多言語大規模言語モデルBLOOMを発表し、7つの実世界カテゴリーで人間による評価を実施して他の最先端LLMとの比較を行った。
言葉を見つけること:言語モデルの隠れ状態可視化
言語モデルの層間の隠れ状態を可視化することで、モデルの「思考プロセス」の手がかりを得られる。