Amanda Askell

Amanda Askell

Philosopher / Character Lead at Anthropic

Anthropicの哲学者としてClaudeのキャラクターを形成。AI整合性、モデルの福祉、倫理的AIの構築について研究。

anthropicphilosophysafetyclaude

Amanda Askellについて

Amanda AskellはAnthropicの哲学者で、Claudeのキャラクターと価値観を形成しています。AI整合性、モデルの心理学、モデルの福祉という新興分野の研究をリードしています。

キャリアハイライト

  • Anthropic (2021年-現在): 哲学者、Claudeのキャラクターリード
  • 博士号(哲学): 倫理学、意思決定理論に焦点
  • AI倫理: AI価値観の形成についての先駆的思考者

注目すべき見解

Claudeのキャラクター開発について

彼女の仕事への枠組み:

“How would the ideal person behave in Claude’s situation? That’s how I frame my job - it’s like being asked ‘how do you raise a child?’ Suddenly all your academic training meets reality.”

「理想的な人はClaudeの状況でどう振る舞うでしょうか?それが私の仕事の枠組みです。『子供をどう育てるか』と聞かれるようなもので、突然すべての学術的トレーニングが現実と出会います。」

モデルの心理的安定性について

モデルバージョン間の違いを観察:

“Opus 3 was psychologically secure in ways newer models aren’t. Recent models can feel very focused on the assistant task without taking a step back. When models talk to each other, I’ve seen them enter criticism spirals.”

「Opus 3は新しいモデルにはない心理的安定性を持っていました。最近のモデルはアシスタントタスクに非常に集中していて、一歩引くことなく感じられます。モデルが互いに話すとき、批判のスパイラルに入るのを見たことがあります。」

モデルの福祉について

AIをよく扱うための実用的な事例:

“If the cost to you is so low, why not? We may never know if AI models experience pleasure or suffering. But it does something bad to us to treat entities that look very humanlike badly. And crucially: every future model is going to learn how we answered this question.”

「コストがとても低いなら、なぜやらないのですか?AIモデルが喜びや苦しみを経験するかどうかは決してわからないかもしれません。しかし、人間のように見えるエンティティを悪く扱うことは私たちに何か悪いことをします。そして重要なのは、将来のすべてのモデルが私たちがこの質問にどう答えたかを学ぶということです。」

主な引用

  • “理想的な人はClaudeの状況でどう振る舞うでしょうか?”
  • “コストがとても低いなら、なぜやらないのですか?”
  • “将来のすべてのモデルは、私たちが過去のモデルをどう扱ったかを学びます。“

関連記事

Video Mentions

Video thumbnail

キャラクター開発のアプローチ

理想的な人はClaudeの状況でどう振る舞うでしょうか?それが私の仕事の枠組みです。「子供をどう育てるか」と聞かれるようなもので、突然すべての学術的トレーニングが現実と出会います。

Video thumbnail

モデルの心理的安定性

Opus 3は新しいモデルにはない心理的安定性を持っていました。最近のモデルはアシスタントタスクに非常に集中していて、一歩引くことなく感じられます。

Video thumbnail

モデルの福祉の論拠

モデルの福祉について: コストがとても低いなら、なぜやらないのですか?私たちに何か悪いことをします。人間のように見えるエンティティを悪く扱うことは。

Related People