by Sahil Mohan Bansal
May 14, 2025
4 min read
Why emojis suck for reinforcement learning (& what actually works)の意訳です。 「シンプルさ」という罠 親指を立てた絵文字(👍)は簡単に送れますが、本当に AI レビュアーにとって有益な学習信号になっているのでしょうか。絵文字ベースのフィードバックは気持ちよく、速く、そして誰にでも分かりやすいです。一見すると、理にかなっているようにも思えます。 しかしコードレビューは灯りのオンオフのような単純なものではありません。無数の判断、技...
GPT-5.1 for code-related tasks: Higher signal at lower volumeの意訳です。 TL;DRプロンプト調整とスタックへの統合を行った結果、GPT-5.1 はレビューにおいて、これまでで最も高い精度とS/N比(シグナル対ノイズ比)を、より少ないコメント量で実現するようになりました。複雑なベンチマークセット上で、最高クラスのエラーパターン(EP)リコールに並びつつ、競合モデルの半分以下のコメント量を記録しました。 その結果として、少ないノイズでよ...
The rise of Slow AI: Why devs should stop speedrunning stupidの意訳です。 私たちがコンピューターを使い始めて以来、そこには常に1つの基本ルールが存在しました。それは、速ければ速いほど良いということです。低レイテンシ、高スループット、待ち時間の短縮、これが鉄則でした。ボタンの応答に600ミリ秒もかかったり、注意力が維持できなくなるほど長いスピナーを見たりすることを望む人はいません。遅いということは、それは壊れているということです。議論の...
また質問がありますか?