有人用AI做面试作弊器:Whisper偷听面试官,Tesseract偷拍屏幕题,Claude两秒写完代码加口语解释,骨传导耳机低声报答案,或者干脆用Cluely的透明浮窗,连共享屏幕都看不到。Interview Coder一年赚几千万美元,Final Round AI 96刀一个月随便用,数据惨烈:标准LeetCode通过率28%干到73%,但真到系统设计和调试环节暴跌到25%,入职90天内三成人原形毕露被开。招聘信任碎成渣,企业又得花大价钱上AI监考、盯眼神、测击键节奏,卷成一团麻
Anthropic却把这整套技术拧了个180度,拿来做了一件完全反着来的事:让AI去当一个真正会听人说话的深度访谈者
他们叫它Anthropic Interviewer,流程干净到像教科书,却又温柔得让人起鸡皮疙瘩
第一步,Claude自己先闭门思考:根据研究目标(比如“AI怎么改变创意工作”“科学家到底信不信AI”)写出一份完整rubric——开场白、核心问题、追问分支、情绪安抚话术、结束语,全套逻辑链。人类研究员只用扫一眼,改几个词就通过,几乎不插手
第二步,在http://Claude.ai上弹出一个极简的聊天窗口,1250个真实的专业人士(教师、科学家、小说家、游戏设计师、调度员……)被邀请进来聊10-15分钟。AI全程主导,却温柔得像一个受过严格训练的人类访谈者:它会说“我能想象这让你很矛盾,能多讲一点吗?”会沉默三秒让对方把情绪喘完,会在对方卡壳时轻声补一句“慢慢来,不急”。1250个人聊下来,97%的人完全没察觉对面不是人,96.96%觉得“这是我被最认真倾听的一次”,97.6%打出“非常满意”,99.12%说“一定要让朋友也来试试”
第三步,所有对话转录丢进Clio——Anthropic自研的隐私安全主题建模工具。零人工标注,Clio自动把1250份访谈切成主题、算情感强度、挑金句、画分布图,最后吐出一份任何社会学家看了都要流口水的分析报告。全部1250份原始转录已经匿名挂在Hugging Face,全球研究者随便下,随便复现
同一套麦克风、同一套Transformer、同一套实时交互管道,在有人手里偷走了真实性,在Anthropic手里却把真实性放大了1250倍
技术从不站队,只看你让它替谁说话。
2025年的分界线已经清清楚楚:一边让AI替人撒谎,一边让AI替人倾听。前者毁信任,后者建信任。方向不同,结局天壤之别
Anthropic却把这整套技术拧了个180度,拿来做了一件完全反着来的事:让AI去当一个真正会听人说话的深度访谈者
他们叫它Anthropic Interviewer,流程干净到像教科书,却又温柔得让人起鸡皮疙瘩
第一步,Claude自己先闭门思考:根据研究目标(比如“AI怎么改变创意工作”“科学家到底信不信AI”)写出一份完整rubric——开场白、核心问题、追问分支、情绪安抚话术、结束语,全套逻辑链。人类研究员只用扫一眼,改几个词就通过,几乎不插手
第二步,在http://Claude.ai上弹出一个极简的聊天窗口,1250个真实的专业人士(教师、科学家、小说家、游戏设计师、调度员……)被邀请进来聊10-15分钟。AI全程主导,却温柔得像一个受过严格训练的人类访谈者:它会说“我能想象这让你很矛盾,能多讲一点吗?”会沉默三秒让对方把情绪喘完,会在对方卡壳时轻声补一句“慢慢来,不急”。1250个人聊下来,97%的人完全没察觉对面不是人,96.96%觉得“这是我被最认真倾听的一次”,97.6%打出“非常满意”,99.12%说“一定要让朋友也来试试”
第三步,所有对话转录丢进Clio——Anthropic自研的隐私安全主题建模工具。零人工标注,Clio自动把1250份访谈切成主题、算情感强度、挑金句、画分布图,最后吐出一份任何社会学家看了都要流口水的分析报告。全部1250份原始转录已经匿名挂在Hugging Face,全球研究者随便下,随便复现
同一套麦克风、同一套Transformer、同一套实时交互管道,在有人手里偷走了真实性,在Anthropic手里却把真实性放大了1250倍
技术从不站队,只看你让它替谁说话。
2025年的分界线已经清清楚楚:一边让AI替人撒谎,一边让AI替人倾听。前者毁信任,后者建信任。方向不同,结局天壤之别