Stockmark Tech Blog の最新記事
20件の記事
コアメンバーの連続退職から組織崩壊の危機を乗り越え、退職ゼロ・人員倍増を実現した道のり
エンジニア組織が短期間で3人退職する危機的状況から、エンゲージメントと開発品質の改善に取り組み、半年間で退職ゼロ・人員倍増を達成した経験と学びを共有。
Vue 3への移行を成功させた経験談:破壊的変更を乗り越えて
AnewsのVue 2からVue 3への移行プロジェクトを紹介。サポート期限に合わせた戦略と、Vue 2と3の違いや対応策をまとめた知見を共有。
Anewsのドキュメントを1年かけて改善した取り組み
エンジニアが組織開発においてドキュメントの重要性を認識し、Anewsのドキュメント改善に1年間取り組んだ経験を共有しています。
改善計画がカギを握る - 大規模バッチ処理テストフレームワーク刷新プロジェクト
AI情報収集プラットフォームAnewsのバッチ処理テストフレームワーク刷新プロジェクトの進め方と、工数がかかる改善施策への取り組み方を紹介。
指示チューニングを施した130億パラメータ日本語LLM「Stockmark-13b-instruct」を公開
ストックマークが、ビジネスドメインと最新情報に対応した130億パラメータ日本語LLMに指示追従訓練を追加し、Huggingface Hubで公開しました。
ビジネス情報収集のAI化を支えるデータ組織の挑戦
ストックマークのデータチームは、AIを活用して国内外35,000メディアから情報を収集・データベース化し、企業向けに最適な情報配信サービスを提供しています。
ビジネスドメインと最新情報に対応した130億パラメータ日本語LLMの公開
ストックマークが商用利用可能な130億パラメータの日本語LLMを公開。ビジネス関連データを含む2200億トークンで学習し、2023年9月までの最新情報に対応。
より多くの「気づき」を届ける - 世界中のテキストの構造化に挑むKnowledge Unitの紹介
StockmarkのKnowledge Unitは、自然言語処理を用いて知識グラフを自動構築し、企業向け情報収集ツールAnewsを通じて、市場・技術・競合情報などの未発見の情報を提供する取り組みを紹介。
最近の話題にも詳しい14億パラメータの日本語LLMが公開
ストックマークが14億パラメータの日本語大規模言語モデルをオープンソース公開。GPT-NeoXベースで最新Webデータを学習し、Hugging Faceから利用可能。
エンジニア採用候補者の皆様へ
エンジニア組織の採用観点を説明。選考プロセス前後の魅力発信と、カルチャー面での不一致解消を目的とし、組織の特徴を紹介している。
開発チームが価値検証を高速化するために意識していること
ストックマーク社は、自社プロダクト「Anews」の論文配信機能を例に、高速な価値提供・フロー効率の極大化・中期目線での開発速度維持の3点を実践している。
BERTを用いたスクレイピング記事からのノイズ除去とChatGPTとの比較
研究者が、インターネットからスクレイピングしたHTML記事から広告やメタデータなどのノイズを除去するためにBERTモデルを使用し、その性能をChatGPTと比較した研究を発表した。
記事中のノイズ削除方式 - ChatGPTとの比較
ストックマーク社が自社製品で実装している記事中のノイズ削除技術を、ChatGPT Plus(GPT-4)と比較検証している。プロダクトへの組み込み可能性を探る実践的な比較記事である。
Perceiver IOを用いた多目的レコメンダープラットフォーム
Stockmark社が、Perceiver IOを活用してニュース記事やカテゴリーなど多様なレコメンデーションサービスを統合するプラットフォームを開発した。
AWSのコスト削減: ストレージクラスの最適化
ストックマーク社が、AWSのコスト削減手法として、コスト分析・監視、ストレージの最適化、リソースの削除・停止の3つを実例と共に紹介している。特にストレージの最適化に焦点を当てている。
6千万記事レコードの大規模データマイグレーション
ストックマーク社が2022年12月に実施した、6千万件を超える記事レコードの大規模データ基盤マイグレーションについて、背景・検討方法・課題・知見を実例から紹介している。
日本語ビジネスニュースコーパスで学習したBART事前学習済モデルの公開
ストックマーク社が、日本語ビジネスニュースの分類・要約向けに、BART事前学習済モデルを開発・公開した。
キーフレーズ抽出で振り返る2022年の業界別ニュース
ストックマーク社が、自社のAI情報収集プラットフォーム「Anews」で配信した2022年のニュース記事をキーフレーズ抽出で分析し、業界別の年間トレンドを振り返るとともに、その抽出ロジックを解説している。
顧客体験向上のための自然言語処理技術活用:定義文抽出
北山氏が、Astrategy社が自然言語処理技術を用いてニュース記事から主題企業・取り組み・フェーズなどの情報を抽出・構造化し、顧客体験向上に取り組んだ事例を紹介した。
CIは命綱 - 開発プロセスで意識・工夫していること
ストックマークの開発チームが、スキーマ駆動開発、API設計、リグレッションテスト、CI/CD、計測によるユーザー体験向上など、効率的で堅実な開発プロセスを実践している取り組みを紹介している。