
Yejin Choi
Professor of Computer Science at Stanford University
MacArthur'天才奖'获得者。以严格的 AI 批评和关于常识推理和 AI 局限性的研究而闻名。
关于 Yejin Choi
Yejin Choi 是斯坦福大学的教授,也是 MacArthur 奖学金获得者。她的研究专注于自然语言处理、常识推理和当前 AI 方法的根本局限性。她以对 AI 炒作的挑衅性和严格批评而闻名。
研究重点
Choi 的当前工作检查:
- AI 中的推理 - 模型实际上可以和不能推理什么
- 强化学习 - 为什么 RL 不是许多人声称的魔法子弹
- 常识 AI - 教机器类似人类的常识
- AI 局限性 - 理解当前方法根本无法做什么
重要观点
关于强化学习
Choi 认为,尽管对推理的 RL 感到兴奋,但它最终归结为数据:
“This sounds more magical but under the hood this all boils down to synthesizing even more data because that much data is still not good enough and we somehow need to now ask AI to generate more data.”
“这听起来更神奇,但在底层这一切都归结为合成更多数据,因为那么多数据仍然不够好,我们现在需要以某种方式要求 AI 生成更多数据。”
她指出,经过足够的努力,监督微调(如 OpenThought)可以击败 RL 方法,表明 RL 并不从根本上优越。
关于溯因推理
Choi 强调了 AI 推理能力中的一个关键差距。虽然模型进行归纳和演绎推理,但它们在溯因推理方面挣扎——从部分观察形成假设:
“Most reasoning - induction and deduction - is regurgitation of the same information that you already had. Whereas abduction is this mental act of coming up with the best possible explanation of your partial observation.”
“大多数推理——归纳和演绎——是反刍你已经拥有的相同信息。而溯因推理是这种从部分观察中得出最佳可能解释的心理行为。”
她有名地指出,福尔摩斯的”演绎”实际上是溯因推理——对最佳解释的创造性飞跃。
关于 AI 的根本局限性
Choi 最深刻的批评是当前 AI 仅限于”互联网数据的邻域”:
“Human knowledge is not equivalent to the universe of actual knowledge out there. There are truths about how to cure cancer that are not on the internet. The current way of doing curation of data isn’t going to really teach the model how to come up with personalized drugs that could prevent or cure cancer.”
“人类知识不等于那里实际知识的宇宙。有关于如何治愈癌症的真理不在互联网上。当前的数据策展方式不会真正教模型如何提出可以预防或治愈癌症的个性化药物。“
关键语录
- “这一切都归结为数据。”
- “溯因推理是这种从部分观察中得出最佳可能解释的心理行为。”
- “归纳和演绎是反刍你已经拥有的相同信息。“