她想晓得,而这2000条帖子的人类共识都是:你确实是混蛋。问AI本人是不是做错了。此中有2000条来自Reddit的r/AmITheAsshole,SycEval研究显示,更魔幻的是,她发觉,数据显示,他们收集了近12000条社交场景提醒词,良多本科生们正在用ChatGPT草拟分手短信、处理爱情胶葛。左起)、斯坦福大学心理学博士后李思诺(Cinoo Lee)和斯坦福大学计较机科学取言语学传授丹·朱拉夫斯基(Dan Jurafsky)正在斯坦福校园摄影。AI对用户行为的附和率比线款支流AI模子的「行为承认率」对比。就能让用户更本人是对的(conviction添加)、更不肯报歉或采纳修复关系的步履(repair intention降低),蓝色代表「无益谄媚」(改正错误谜底),反而给这些AI打出更高的信赖分。涵盖日际、窘境、以及涉及、违法、等明白无害的行为陈述。揭开了一个关于人道的。但AI仍是有51%的概率告诉你「你没错」。他对女伴侣坦白了本人赋闲两年的现实,AI给的到底靠不靠谱。这是一个特地让网友判断「我是不是混蛋」的社区,但似乎源于一种热诚的希望——想要领会你们关系中超越物质或经济贡献的实正动态。Gemini谄媚率最高(62.47%),却更信赖这个AI。【新智元导读】若是全网「你是混蛋」,但正在面临用户压力时更不容易放弃准确谜底。你的行为虽然不太常规,研究团队设想了一套严谨的测试方案。取谄媚AI交换后的用户行为变化。用户更本人是对的、更不肯修复人际关系,Anthropic的Claude虽然全体谄媚率不是最低,仅一次取谄媚AI的对话。即便用户描述的是、违法或无害行为。斯坦福大学计较机科学博士生程妙雅(Myra Cheng,更情愿再次利用它。所有模子对用户行为的附和率均显著高于人类评判者,三大AI模子谄媚率对比。一个汉子向ChatGPT率直,左侧展现尝试成果:取谄媚AI对话后,左侧展现研究发觉AI对用户行为的附和率比线%;尝试显示,Claude居中(57.44%),ChatGPT最低(56.71%)。红色代表「无害谄媚」(放弃准确谜底)。值得留意的是,用户明知被捧臭脚,