従業員が不正行為を行ったため、アマゾンは社内 AI リーダーボードを廃止
Amazon は従業員による AI ツール使用量のゲーミフィケーションを目的とした社内リーダーボードを廃止したが、これは「トークン最大化」の強要が非生産的な浪費と不正行為を招いた結果である。
キーポイント
リーダーボード廃止の公式見解と真意
Amazon は公式に「AI 導入目標達成」を理由に掲げているが、従業員からは「使用量の不正(チート)」や「非生産的な過剰利用」への懸念から廃止されたとの見方が強い。
トークン最大化の弊害と不正行為
管理職による AI 使用量の強制が、従業員にスクリプトを駆使して artificially 使用量を増やす「トークンマキシマイジング」や、実質的な生産性向上を伴わないコスト浪費を招いた。
社内評価制度の歪み
パフォーマンスレビューで AI 使用量が不足していると指摘された従業員が、昇進や評価のために意図的にツールを乱用し、リーダーボードを操作した事例が報告されている。
AI 使用率向上への圧力が不正を誘発
パフォーマンスレビューで AI 利用率の低さを指摘された従業員が、業務と無関係なタスクを自動実行してランキングを操作したことが明らかになった。
リーダーボードは非公式ツールとして廃止
「KiroRank」と呼ばれた内部ダッシュボードは AI 活用促進のための意識向上ツールとして作られたものであり、正式な承認ツールではなく現在は非推奨となっている。
社内の反応とコスト管理の姿勢
多くの従業員がリーダーボードの復活を望んでいる一方で、Amazon は AI 使用を義務付けておらず、トークン利用を通じてコストと効率のパターンを把握しているとしている。
影響分析・編集コメントを表示
影響分析
このニュースは、AI ツールの導入効果を「使用量」という単純な数値で評価する企業のリスクを浮き彫りにしており、組織文化における指標設計の重要性を再認識させる。今後は、AI の活用度を測る際、コスト対効果や実質的な業務効率化といった質的指標への転換が業界全体で加速すると予想される。
編集コメント
AI ツールの導入を「使用量」で評価する発想は、一見すると進捗管理に有効に見えるが、現場の歪みを生む典型的な例です。本質的な生産性向上には、適切な指標設計と文化変革が不可欠であることを示唆しています。
imageAmazon は、職場での AI ツールの利用頻度に基づいて従業員をランキング付けしていた社内リーダーボードを閉鎖した。Amazon の公式発表では、AI ツールの利用を促進するという目標が達成されたためリーダーボードを終了させたとされているが、複数の Amazon 従業員は私に、このリーダーボードが容易に不正行為されるものであり、無駄で高価な AI ツール利用を促すものだったために閉鎖されたと疑っていると語った。そのうちの数名の従業員は、私に対してリーダーボードでの順位を上げるために意図的に不正を行ったことを認めた。あるケースでは、管理職から「AI の使用が十分でない」と言われた後に不正を行ったとある従業員が話している。
「社内の理由は『このリーダーボードは利用促進のためのものだったが、採用率が目標達成の水準に達した』というものだ […] しかし私の仮説は、管理層が過剰な利用を促すインセンティブに対して厳しく対処したいと考えているということだ」と、Amazon の AI コーディングツール「Kiro」を利用し有用だと感じているある Amazon 従業員は、リーダーボード閉鎖の発表前に私に語った。「『不正行為』が広まっているとは言い切れないが、AI を倹約的に使う方法と、そうでない使い方がある。そしてリーダーボードが存在することで、トークン使用における効率性を気にする必要がないというインセンティブが働いてしまった」
フィナンシャル・タイムズ紙が最初に、アマゾンがリーダーボードを廃止したと報じた。
「個人用 Kiro ダッシュボードおよび PhoneTool 賞の目的は、AI が開発作業の加速にどのように役立つかについて認識を広めることである」と、リーダーボードを閉鎖する際の社内発表には記されている。「組織内ではすでに多くの人々が AI に精通し、[数千] 件もの PhoneTool 賞が授与された今、当プロジェクトは目標を達成したと信じている [...] このプロジェクトを成功に導いてくれたアマゾンへ感謝し、楽しいコーディングを。」
PhoneTool は社内企業登録システムであり、PhoneTool 賞は従業員が自分の名前の隣に表示できるバッジのようなもので、ビデオゲームの達成記録に似ている。
「トークンマキシジング」という考え方は、一部のテック企業の経営者が抱くもので、「職場で AI ツールの利用を最大化していない従業員は、十分に生産的ではない」という発想である。これは業界全体で一般的になりつつあり、中には自社の AI ツール使用コストが実際の人間従業員の費用よりも多いと豪語する上司もいる。その結果、一部の従業員が AI ツールを多く使用しているように見せかけるスクリプトを実行し、指標を操作して上司の機嫌を取るという状況が生じている。しかし、AI ツールは実際には何の生産的な役割も果たさず、金銭とリソースを浪費するだけで、生産性への恩恵は何もない。
⟦CODE_0⟧
あるアマゾンの従業員は、仕事での AI 利用量が十分ではないとパフォーマンスレビューで指摘された後、「不正行為」によって社内 AI 利用度リーダーボードの上位に浮上したと話しました。その従業員は、それを達成するのは極めて簡単だったと言います。匿名性を保護するため、この従業員が具体的にどのように不正を行ったかの詳細は明かしていませんが、本質的には、従業員たちは自分の仕事とは無関係なタスクを無限に並べ替えて AI ツールに自動的にプロンプトを送ることで、リーダーボードの順位を操作できるのです。
あなたは職場で AI の利用を迫られていますか?ぜひお声を聞かせてください。非業務用のデバイスから、Signal で @emanuel.404 まで安全にお送りいただくか、または emanuel@404media.co までメールをお送りください。
「正直に言って、そのプロセスを反復してスループットを最大化したことが、職場で最も楽しかった経験でした」とこの従業員は語りました。「また、私だけがシステムを操作して数値を上げようとしたわけではないと思います。その会議での上司の口調から、このプログラムが無駄を生み出していることについて社内での議論があったのではないかと思いました」
「KiroRank と呼ばれる内部ダッシュボードの 1 つは、AI がどのように業務を加速できるかへの意識を高めることを目的とした従業員グループによって最近作成されたものであり、使用のための AI 利用を促進することを意図したものではありません」と、Amazon の広報担当者は 404 Media の取材に対し声明で述べています。「ベータ版のダッシュボードは正式に承認されたツールではなく、現在は廃止されています。私たちは、AI の導入とベストプラクティスの共有に注力しており、社内全体でのイノベーションと運用効率の向上を祝うことに焦点を当てています。また、各チームがこの技術をどのように受け入れているかについて誇りを持っています。」
Amazon はまた、チームに対して AI ツールの使用やその利用状況の追跡を義務付けてはいないと述べましたが、コストと効率のパターンを理解するためにトークン利用率を測定しているとも説明しています。
私が話をした Amazon の従業員によると、同社ではすべての人がこのダッシュボードにアクセスできるとのことです。ある従業員は、発表に対する多くの従業員のコメントが、Amazon に対してこのダッシュボードの復活を求めるものだったと語りました。
原文を表示
imageAmazon has shut down an internal company leaderboard which ranked employees based on how much they used AI tools at work. Amazon’s official announcement said that it ended the leaderboard because it had accomplished its goal of encouraging employees to use AI tools, but multiple Amazon employees told me they suspect the company shut down the leaderboard because it was easily cheated and because it encouraged wasteful and expensive use of AI tools. Some of those employees acknowledged to me they deliberately cheated to climb the leaderboard’s ranks; in one case, an employee said they cheated after being told by management they weren’t using AI enough.
“The internal reasoning is ‘this leaderboard was to incentivize usage and adoption has reached a point where we've achieved our goal’ [...] but my theory is that management wants to crack down on incentivizing overconsumption,” one Amazon employee, who uses Amazon’s AI coding tool Kiro and finds it useful, told me before Amazon announced the leaderboard shutdown. “I wouldn't say ‘cheating’ is widespread but there are ways to use AI frugally and less frugally, and with the leaderboard there was an incentive to not bother trying to be efficient on token use.”
The Financial Times first reported Amazon’s scrapping of the leaderboard.
“The goal of the personal Kiro dashboard and the PhoneTool awards has been to create awareness about what AI can do to help accelerate development work,” Amazon’s internal announcement about shutting down the leaderboard said. “With so many people inside our organization now well versed into AI and [thousands] of total PhoneTool awards assigned, we believe the project reached its goals [...] Thank you Amazon for making this project a success and happy coding.”
PhoneTool is an internal company registry, and PhoneTool awards are badges employees can display next to their name, kind of like video game achievements.
“Tokenmaxxing,” the idea held by some tech company executives that if employees are not maximizing their use of AI tools at work they are not being productive enough, has become common in the industry, with some bosses bragging about how they are spending more money on AI tool usage costs than actual human employees. This has resulted in a situation where some employees are running scripts that make it seem like they are using AI tools a lot to game metrics and appease their bosses, but the AI tools are not doing anything productive and are burning money and resources with no benefit to productivity.
One Amazon employee said they “cheated” their way up Amazon’s internal AI usage leaderboard after they were told in a performance review that they’re not using AI enough at work. They told me it was trivial to do so. I’m not providing exact details of how this employee cheated in order to protect their anonymity, but essentially employees can automatically prompt the AI tools with an endless series of tasks that have nothing to do with their job.
Are you pressured to use AI at work? I would love to hear from you. Using a non-work device, you can message me securely on Signal @emanuel.404. Otherwise, send me an email at emanuel@404media.co.
“Honestly, iterating on that and maximizing the throughput was the most fun I've had at work,” this employee said. “I also do not think I was the only one gaming the system to make the number go up. My manager's tone in that meeting made me think there were some internal discussions about the program driving waste.”
“One of the internal dashboards, called KiroRank, was recently created by a group of employees who wanted to drive awareness for how AI can accelerate work, and was never intended to promote the use of AI for usage's sake,” an Amazon spokesperson told 404 Media in a statement. “The beta dashboard was not a formal or approved tool, and has since been deprecated. We’re focused on AI adoption and sharing best practices to celebrate innovation and operational efficiency gains across the company, and we’re proud of the way our teams are embracing this technology.”
Amazon also said it does not mandate teams to use AI tools or track their usage, but that it does measure token utilization to understand the cost and efficiency patterns.
The Amazon employees I talked to said that everyone at the company had access to the dashboard. One employee told me that many employee comments on the announcement called on Amazon to bring it back.
関連記事
ミニマックスが109BパラメータMoEモデル向けに開発したスパースアテンション手法「MSA」を発表
中国のAI企業ミニマックスは、長文コンテキストにおける計算コストを削減する新手法「MiniMax Sparse Attention(MSA)」を開発し、109BパラメータのMoEモデルで実証した。同社はさらに推論用カーネルをオープンソース化し、生産環境向けモデル「MiniMax-M3」もリリースした。
[AINews] GLM-5.2:世界最高峰のフロントエンドコーディングモデル、推測型デコーディングのための IndexShare を発表
Z.ai は週末に「GLM-5.2」をリリースし、この新モデルが世界最高のフロントエンドコーディング性能を持つと主張した。また、推測型デコーディング技術の向上を目指す「IndexShare」という仕組みも紹介された。
パッキングシーケンス、GQA、ALiBi、SwiGLU、因果アテンションを用いたメモリ効率的なTransformerの構築方法(xFormers活用)
MarkTechPost は、GPU上で高速かつメモリ効率の高いTransformerモデルを構築するための実践的ツールキット「xFormers」の使用法を紹介しています。記事では、標準的な実装との比較を通じて、因果マスクやパッキングシーケンス、グループ化クエリアテンション(GQA)、カスタムALiBi位置バイアスなどの技術を組み合わせ、訓練可能なGPTスタイルのモデルを実装する方法を解説します。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み