#自然言語処理 のAIニュース
73件の記事
ビジネスROI向上のための自律型財務AIの導入
自律型財務AIは厳格なガバナンスと明確なROI目標のもとで導入された場合にのみ、業務効率と投資収益率を向上させる。調査では61%が実験的に導入している。
Spotify、AI搭載の「Prompted Playlists」を英国などで展開
SpotifyがAIを活用した「Prompted Playlists」機能を英国、アイルランド、オーストラリア、スウェーデンの有料会員向けに試験的に提供開始。
社会科学研究のスケーリング
OpenAIの新オープンソースツールキットGABRIELは、GPTを活用して質的テキスト・画像を量的データに変換し、社会科学者が大規模な研究分析を可能にする。
コンテキストエンジニアリングの歴史:RAGの過去から現在をたどる
RAGは2020年に提案され、検索と生成の組み合わせから自己反省機構やグラフ構造、エージェント型へ進化し、現在はコンテキストエンジニアリングの一部として位置づけられている。
Alyah ⭐️: アラビア語LLMにおけるエミレーツ方言能力の堅牢な評価に向けて
研究者らが、アラビア語大規模言語モデル(LLM)のエミレーツ方言理解能力を評価するための堅牢なベンチマーク「Alyah」を開発した。
あなたのGTMデータ、ついに解きほぐされる
Compassがマーケティングツールに直接接続し、CSV出力やデータチーム待ちなしでSlack内でパイプラインや広告費、営業会話について質問可能に。
CocoIndexでナレッジグラフを更新しながらRAGを実施
LayerXの鷹取氏が、従来のNative RAGの構造的弱点を克服するため、CocoIndexを用いてナレッジグラフを更新しながらRAGを実行する手法を紹介している。
社D、生き残っています
平日フルタイム勤務の社会人が、業後・休日に博士課程や連携研究を始めて半年。具体的な成果を紹介する。
LLMに日本語をフランス語のつづりで書かせると?
OpenAIのGPT-4が日本語をフランス語のつづりで表記する実験を行い、言語モデルの多言語処理能力を検証した。
ChatGPTにおける言語的バイアス:言語モデルが方言差別を強化する
ChatGPTなどの言語モデルは、標準語を優遇し方言を劣位に扱うバイアスを示し、方言差別を強化する可能性がある。
チェーン・オブ・テーブル:表理解のための推論チェーンにおける表の進化
Google Cloud AIチームの研究者が、表データを段階的に拡張・推論する「チェーン・オブ・テーブル」手法を発表した。この手法は表理解タスクの精度向上を目指すもので、AIによるデータ分析能力の進展を示している。
社会的学習:大規模言語モデルを用いた協調学習
Google Researchの研究者らが、複数の大規模言語モデルが協力して学習し、単一モデルよりも優れた性能を発揮する「社会的学習」手法を発表した。
GPT連携アプリ開発の必須知識、RAGをゼロから解説する。概要&Pythonコード例
著者のわいけいは、生成AIアプリ開発で低予算で使えるRAG(Retrieval-Augmented Generation)技術を、自然言語処理の観点から解説し、Pythonコード例を交えて実装知見を共有する。
BERTを用いたスクレイピング記事からのノイズ除去とChatGPTとの比較
研究者が、インターネットからスクレイピングしたHTML記事から広告やメタデータなどのノイズを除去するためにBERTモデルを使用し、その性能をChatGPTと比較した研究を発表した。
6千万記事レコードの大規模データマイグレーション
ストックマーク社が2022年12月に実施した、6千万件を超える記事レコードの大規模データ基盤マイグレーションについて、背景・検討方法・課題・知見を実例から紹介している。
日本語ビジネスニュースコーパスで学習したBART事前学習済モデルの公開
ストックマーク社が、日本語ビジネスニュースの分類・要約向けに、BART事前学習済モデルを開発・公開した。
顧客体験向上のための自然言語処理技術活用:定義文抽出
北山氏が、Astrategy社が自然言語処理技術を用いてニュース記事から主題企業・取り組み・フェーズなどの情報を抽出・構造化し、顧客体験向上に取り組んだ事例を紹介した。
Googleの感情データセットの30%が誤ってラベル付けされている
Googleが昨年公開した「GoEmotions」データセット(Redditコメント5.8万件を27の感情で分類した人間によるラベル付きデータ)の30%が誤ってラベル付けされていることが判明した。
Kaggle「chaii - ヒンディー語とタミル語の質問応答」コンペで2位入賞した話と解法解説
エクサウィザーズの神戸氏が、Kaggleのヒンディー語とタミル語の質問応答コンペで「tkm kh」チームとして943チーム中2位に入賞し、金メダルを獲得した。
CodeSearchNetチャレンジ:意味的コード検索の現状評価
CodeSearchNetチャレンジは、コードの意味的理解に基づく検索技術の現状を評価する取り組みで、自然言語クエリによるコード検索の精度向上を目指しています。
機械学習でGitHubタスクを自動化して楽しみと利益を得る方法
機械学習を活用してGitHub上の反復作業を自動化し、効率化と収益向上を実現する方法を解説。
深層学習を用いた任意のオブジェクトに対する自然言語意味検索の構築方法
深層学習を活用し、自然言語クエリで任意のオブジェクトを意味的に検索するシステムの構築方法を解説。
スパム対策計画
ポール・グレアム氏が、スパム対策にはコンテンツベースのフィルターが有効だと主張している。スパマーはメッセージ内容を変えられない弱点があり、この手法で阻止可能と述べている。