推出 Anthropic Interviewer：1250 位专业人士如何看待与 AI 共事

摘要

1) 一句话总结 Anthropic 推出了由 Claude 驱动的自动化定性研究工具 Anthropic Interviewer，并通过对 1250 名专业人士的访谈，揭示了不同领域工作者在利用 AI 提升生产力时所面临的职场角色转变、社会偏见与信任瓶颈。

2) 核心要点

工具运作机制：Anthropic Interviewer 能够大规模自动执行深度访谈，工作流包含规划（生成大纲）、访谈（10-15分钟实时自适应对话）和分析（提取并聚类主题）三个阶段。
测试样本构成：共访谈 1250 名专业人士，包括大众职场人群（1000人）、创意工作者（125人）和科学家（125人）。
大众职场人群：86% 表示 AI 节省了时间，但 69% 担忧使用 AI 会带来“社会污名”；48% 的人考虑未来将职业方向转向 AI 系统的管理与监督。
创意工作者：97% 报告生产力提升，但普遍面临经济焦虑与同行评判压力；所有受访者均希望保持对创意的控制权，尽管实际应用中 AI 主导决策的界限已趋于模糊。
科学家：91% 渴望 AI 成为能提出新想法的科研伙伴，但 79% 将“信任和可靠性”视为主要障碍，目前仅将 AI 用于文献回顾、编码和写作等辅助任务。
认知与实际偏差：受访者自我报告的 AI 角色（65% 增强，35% 自动化）与 Claude 实际使用数据（47% 增强，49% 自动化）存在差异。
后续合作计划：Anthropic 正与文化机构、科学资助者及美国教师联合会（AFT）等社区合作，将特定人群的视角直接引入 AI 系统的开发中。

3) 风险与局限性

选择偏差：参与者通过众包平台招募，可能比普通人群对 AI 更有经验或持更积极态度。
心理预期影响：参与者知晓访谈者是 AI，这可能改变了他们的回答方式。
数据与形式局限：研究仅为当前的静态快照，无法追踪态度演变；纯文本访谈无法捕捉语气、面部表情或肢体语言。
自我报告偏差：访谈数据与客观使用数据存在差异，受访者的回答可能带有理想化色彩或受社会期望影响。
主观性与普适性：定性分析不可避免地反映了研究者的主观视角；样本主要反映西方工作者观点，可能缺乏全球普适性。
缺乏因果关系：作为非实验性研究，无法确定 AI 使用与生产力提升之间的直接因果关系。

正文

如今，每天都有数以百万计的人在使用 AI。作为一家开发 AI 系统的公司，我们不仅希望利用用户的反馈来开发更好的产品，更因为“理解人类与 AI 的互动”已成为我们这个时代最伟大的社会学议题之一。我们想知道人们如何使用 AI、为什么使用，以及 AI 对他们产生了怎样的影响。

此前，我们设计过一款保护用户隐私的分析工具，用于研究经济领域中 AI 使用模式的变迁。但该工具只能让我们了解在与 Claude 的对话框内发生了什么。对话结束之后呢？人们究竟是如何使用 Claude 的输出结果的？他们对此有何感受？他们如何想象 AI 在自己未来的角色？

为了全面了解 AI 在人们生活中不断变化的角色，并在模型开发中以人类为中心，我们需要直接向人们提问。然而，这样的项目通常需要进行成百上千次访谈。为此，我们借助 AI 的力量，构建了一款名为 Anthropic Interviewer 的访谈工具。

在 Claude 的驱动下，Anthropic Interviewer 能够以前所未有的规模自动进行深度访谈，并将结果反馈给人类研究员进行分析。为了测试该工具，我们让它对 1250 名专业人士进行了关于 AI 看法的访谈，其中包括大众职场人群（1000人）、科学家（125人）和创意工作者（125人）。

核心发现概览

通过初步测试，我们得出了以下核心发现：

整体持乐观态度，但局部存在担忧： 在我们的样本中，人们对 AI 在工作中的作用感到乐观，大多数话题都带有积极的情绪。然而，在教育整合、艺术家被取代以及安全隐患等少数话题上，人们的看法较为悲观。
大众职场人群： 他们希望保留定义其职业身份的核心任务，同时将常规工作交给 AI。他们设想的未来是：常规任务被自动化，而他们的角色将转变为 AI 系统的监督者。
创意工作者： 尽管面临同行的评判和对未来的焦虑，他们仍在使用 AI 来提高生产力。他们正在创意社区对 AI 的偏见，与对经济取代及人类创意身份消亡的深层担忧之间艰难平衡。
科学家： 他们渴望与 AI 建立合作关系，但目前还无法信任 AI 能胜任核心研究工作。科学家们一致希望 AI 能够提出假设并设计实验，但目前他们实际只将 AI 用于撰写论文或调试分析代码等辅助任务。

研究方法与工具运作机制

本次测试旨在探索工作者如何将 AI 融入职业实践，以及他们对 AI 未来角色的感受。我们通过访谈获取定性数据，并辅以问卷调查获取受访者行为和职业背景的定量数据。此外，我们还使用了一个独立的 AI 分析工具来阅读访谈记录，从非结构化数据中提取并聚类出总体主题。

受访者构成： 我们招募了 1250 名拥有主要职业的专业人士。其中 1000 人来自大众职业样本（主要包括教育指导占 17%、计算机与数学占 16%、艺术/设计/娱乐和媒体占 14%）。另外招募了两个各 125 人的特定领域样本：创意工作者（主要是作家、视觉艺术家等）和科学家（包括物理学家、化学家、数据科学家等）。选择这两个领域是因为 AI 在其中的作用仍备受争议且发展迅速。

Anthropic Interviewer 的三个工作阶段：

规划阶段： 工具根据系统提示词（包含研究假设和最佳实践）生成访谈大纲和问题流。人类研究员会参与审查和编辑，以最终确定计划。
访谈阶段： Anthropic Interviewer 在 Claude.ai 上与受访者进行 10-15 分钟的实时自适应访谈。
分析阶段： 访谈结束后，人类研究员与工具合作分析文字记录，输出对研究问题的解答和典型引言，并量化各主题的普遍程度。

深入解析：AI 对不同领域的影响

大众职场人群：生产力提升与职场隐忧

总体而言，大众职场样本认为 AI 提升了生产力。86% 的专业人士表示 AI 节省了时间，65% 对 AI 在工作中的角色感到满意。

然而，职场动态显著影响了 AI 的采用。69% 的人提到了在工作中使用 AI 工具可能带来的“社会污名”。一位事实核查员表示：“我不会告诉任何人我的工作流程，因为我知道很多人对 AI 反感。”

虽然 41% 的受访者对工作感到安全，认为人类技能不可替代，但 55% 的人对 AI 的未来影响表达了焦虑。为了应对焦虑，25% 的人设定了 AI 使用边界（例如教育工作者坚持自己制定教案），另外 25% 的人则调整了职场角色，承担更多责任或追求更专业的任务。

增强（Augmentation）与自动化（Automation）： 在访谈中，65% 的参与者将 AI 的主要作用描述为“增强”（协作完成任务），35% 描述为“自动化”（直接执行任务）。这与我们之前对 Claude 实际使用数据的分析（增强 47%，自动化 49%）存在差异。这可能是因为用户在对话结束后会自行修改输出，或者自我报告与实际使用习惯存在偏差。

专业人士设想的未来是两者的结合：自动化处理日常行政任务，同时保持人类的监督。48% 的受访者考虑将职业方向转向管理和监督 AI 系统。一位牧师提到，利用 AI 处理行政工作可以腾出时间去陪伴信众，但同时也强调了设定“良好边界”的重要性。

创意工作者：效率提升与身份认同的挣扎

创意工作者同样报告了生产力的提升：97% 表示节省了时间，68% 表示提高了工作质量。一位摄影师指出，AI 处理常规编辑任务将交付时间从 12 周缩短到了 3 周。

与大众人群类似，70% 的创意人员试图应对同行对 AI 使用的评判。经济焦虑在访谈中随处可见。配音演员感叹某些配音领域因 AI 而消亡；作曲家担心 AI 生成的廉价音乐会淹没市场；一位创意总监则坦言，自己使用 AI 意味着其他创意人员（如产品摄影师）失去了业务。

所有 125 名创意参与者都表示希望保持对创意输出的控制权。但在实践中，这种界限并不稳定。许多人承认 AI 在某些时刻主导了创意决策。不同创意学科的情绪特征差异显著：游戏开发者和视觉艺术家满意度高但担忧也高；设计师则表现出低满意度和高挫败感。这种情绪的广泛分散，凸显了创意人员在拥抱工具与担忧人类创造力未来之间的矛盾。

科学家：渴望科研伙伴，但信任度不足

在化学、物理、生物和计算领域的科研人员访谈中，我们发现 AI 目前还无法处理假设生成和实验设计等核心研究环节。科学家主要将 AI 用于文献回顾、编码和写作。

79% 的访谈将“信任和可靠性”视为主要障碍，27% 提到了当前 AI 系统的技术局限性。一位信息安全研究员抱怨说，如果必须仔细检查 AI 提供的每一个细节，就失去了使用它的意义。一位化学工程师则指出了 AI 的“迎合倾向”——它会根据用户提问的方式改变答案，这种不一致性令人怀疑。

尽管如此，科学家们对 AI 导致失业的恐惧较低。他们指出，许多隐性知识（如观察细胞颜色变化）难以数字化，且研究决策具有内在的人类属性。此外，机密环境的安全规定、预算和样本限制等外部因素也构成了 AI 替代的壁垒。

91% 的科学家表达了希望获得更多 AI 协助的愿望。他们最普遍的诉求是希望 AI 能够产生新的科学想法。正如一位医学科学家所说：“我希望 AI 能够感觉像是一个有价值的研究伙伴……能带来一些新的东西。”

展望未来与合作计划

这次初步测试证明了 Anthropic Interviewer 在大规模定性研究中的潜力。它不仅改变了研究方法，更从根本上改变了我们能够提出和解答关于 AI 社会角色的问题的维度。

为了让 AI 模型的开发以人类声音为中心，我们正在采取实际步骤与特定社区探索合作：

创意工作者： 我们正与领先的文化机构（如 LAS 艺术基金会、Mori 美术馆等）及创意社区合作，了解 AI 如何增强创造力，并探索通过模型上下文协议（MCP）辅助创意工作。
科学家： 我们与“AI for Science”受资助者合作，收集科学家对 AI 的看法和期望，结合定量与定性数据来改进专为科学家打造的 Claude。
教师： 我们最近与美国教师联合会（AFT）合作，旨在支持 40 万名教师进行 AI 教育，并将他们的视角引入 AI 系统的开发中。

我们还启动了一项公开的试点访谈，邀请公众参与，以进一步探索人们的经历、价值观和需求如何塑造他们对 AI 未来角色的愿景。

结论与局限性

对 1250 名专业人士的访谈表明，职场人群正在积极调整与 AI 的关系。人们倾向于保留核心职业身份任务，同时将常规工作委派给 AI 以提高生产力。通过大规模部署 Anthropic Interviewer，我们希望在人们的 AI 体验与我们的开发方向之间建立反馈循环。

研究局限性： 我们的发现应被视为 AI 对工作影响的早期信号，而非最终结论。本研究存在以下局限：

选择偏差： 参与者通过众包平台招募，可能比普通人群对 AI 持更积极或更有经验的态度。
受访者心理预期： 参与者知道自己在接受 AI 访谈，这可能改变了他们的回答方式。
静态分析： 我们只捕捉了当前的快照，无法追踪态度随时间的演变。
情感分析受限： 纯文本访谈无法捕捉语气、面部表情或肢体语言。
自我报告与客观指标的差异： 访谈数据与实际使用数据存在差异，受访者的回答可能带有理想化色彩或受社会期望影响。
研究者主观解释： 定性分析不可避免地反映了研究者自身的视角和侧重点。
全球普适性： 样本主要反映西方工作者的观点，不同文化背景下的态度可能存在显著差异。
非实验性研究： 我们无法确定 AI 使用与生产力提升之间的直接因果关系。

(注：参与本次访谈的受访者对 Anthropic Interviewer 给出了极高的评价，97.6% 的人满意度在 5 分及以上，99.12% 的人表示愿意向他人推荐这种访谈形式。)

wsl-docs

探索