Claude Codeは機械学習だ。私が回している手動RLHFループの全構造

ML要素	Claude Code実装	触れるか
モデル	Claude本体（Sonnet/Opus等）	触れない（不変）
入力	プロンプト + CLAUDE.md + skills	設計可
出力	記事・コード・判断・画像プロンプト	観測対象
報酬	アナリティクス・反応・自己評価	計測設計が肝
重み更新	memory追記 / skills改修 / CLAUDE.md修正	手動で回す

Claude Codeは「学習しないAI」だが、システム全体は学習している