摘要
1) 一句话总结 Anthropic 推出了由 Claude 驱动的自动化定性研究工具 Anthropic Interviewer,并通过对 1250 名专业人士的访谈,揭示了不同领域工作者在利用 AI 提升生产力时所面临的职场角色转变、社会偏见与信任瓶颈。
2) 核心要点
- 工具运作机制:Anthropic Interviewer 能够大规模自动执行深度访谈,工作流包含规划(生成大纲)、访谈(10-15分钟实时自适应对话)和分析(提取并聚类主题)三个阶段。
- 测试样本构成:共访谈 1250 名专业人士,包括大众职场人群(1000人)、创意工作者(125人)和科学家(125人)。
- 大众职场人群:86% 表示 AI 节省了时间,但 69% 担忧使用 AI 会带来“社会污名”;48% 的人考虑未来将职业方向转向 AI 系统的管理与监督。
- 创意工作者:97% 报告生产力提升,但普遍面临经济焦虑与同行评判压力;所有受访者均希望保持对创意的控制权,尽管实际应用中 AI 主导决策的界限已趋于模糊。
- 科学家:91% 渴望 AI 成为能提出新想法的科研伙伴,但 79% 将“信任和可靠性”视为主要障碍,目前仅将 AI 用于文献回顾、编码和写作等辅助任务。
- 认知与实际偏差:受访者自我报告的 AI 角色(65% 增强,35% 自动化)与 Claude 实际使用数据(47% 增强,49% 自动化)存在差异。
- 后续合作计划:Anthropic 正与文化机构、科学资助者及美国教师联合会(AFT)等社区合作,将特定人群的视角直接引入 AI 系统的开发中。
3) 风险与局限性
- 选择偏差:参与者通过众包平台招募,可能比普通人群对 AI 更有经验或持更积极态度。
- 心理预期影响:参与者知晓访谈者是 AI,这可能改变了他们的回答方式。
- 数据与形式局限:研究仅为当前的静态快照,无法追踪态度演变;纯文本访谈无法捕捉语气、面部表情或肢体语言。
- 自我报告偏差:访谈数据与客观使用数据存在差异,受访者的回答可能带有理想化色彩或受社会期望影响。
- 主观性与普适性:定性分析不可避免地反映了研究者的主观视角;样本主要反映西方工作者观点,可能缺乏全球普适性。
- 缺乏因果关系:作为非实验性研究,无法确定 AI 使用与生产力提升之间的直接因果关系。
正文
如今,每天都有数以百万计的人在使用 AI。作为一家开发 AI 系统的公司,我们不仅希望利用用户的反馈来开发更好的产品,更因为“理解人类与 AI 的互动”已成为我们这个时代最伟大的社会学议题之一。我们想知道人们如何使用 AI、为什么使用,以及 AI 对他们产生了怎样的影响。
此前,我们设计过一款保护用户隐私的分析工具,用于研究经济领域中 AI 使用模式的变迁。但该工具只能让我们了解在与 Claude 的对话框内发生了什么。对话结束之后呢?人们究竟是如何使用 Claude 的输出结果的?他们对此有何感受?他们如何想象 AI 在自己未来的角色?
为了全面了解 AI 在人们生活中不断变化的角色,并在模型开发中以人类为中心,我们需要直接向人们提问。然而,这样的项目通常需要进行成百上千次访谈。为此,我们借助 AI 的力量,构建了一款名为 Anthropic Interviewer 的访谈工具。
在 Claude 的驱动下,Anthropic Interviewer 能够以前所未有的规模自动进行深度访谈,并将结果反馈给人类研究员进行分析。为了测试该工具,我们让它对 1250 名专业人士进行了关于 AI 看法的访谈,其中包括大众职场人群(1000人)、科学家(125人)和创意工作者(125人)。
核心发现概览
通过初步测试,我们得出了以下核心发现:
- 整体持乐观态度,但局部存在担忧: 在我们的样本中,人们对 AI 在工作中的作用感到乐观,大多数话题都带有积极的情绪。然而,在教育整合、艺术家被取代以及安全隐患等少数话题上,人们的看法较为悲观。
- 大众职场人群: 他们希望保留定义其职业身份的核心任务,同时将常规工作交给 AI。他们设想的未来是:常规任务被自动化,而他们的角色将转变为 AI 系统的监督者。
- 创意工作者: 尽管面临同行的评判和对未来的焦虑,他们仍在使用 AI 来提高生产力。他们正在创意社区对 AI 的偏见,与对经济取代及人类创意身份消亡的深层担忧之间艰难平衡。
- 科学家: 他们渴望与 AI 建立合作关系,但目前还无法信任 AI 能胜任核心研究工作。科学家们一致希望 AI 能够提出假设并设计实验,但目前他们实际只将 AI 用于撰写论文或调试分析代码等辅助任务。
研究方法与工具运作机制
本次测试旨在探索工作者如何将 AI 融入职业实践,以及他们对 AI 未来角色的感受。我们通过访谈获取定性数据,并辅以问卷调查获取受访者行为和职业背景的定量数据。此外,我们还使用了一个独立的 AI 分析工具来阅读访谈记录,从非结构化数据中提取并聚类出总体主题。
受访者构成: 我们招募了 1250 名拥有主要职业的专业人士。其中 1000 人来自大众职业样本(主要包括教育指导占 17%、计算机与数学占 16%、艺术/设计/娱乐和媒体占 14%)。另外招募了两个各 125 人的特定领域样本:创意工作者(主要是作家、视觉艺术家等)和科学家(包括物理学家、化学家、数据科学家等)。选择这两个领域是因为 AI 在其中的作用仍备受争议且发展迅速。
Anthropic Interviewer 的三个工作阶段:
- 规划阶段: 工具根据系统提示词(包含研究假设和最佳实践)生成访谈大纲和问题流。人类研究员会参与审查和编辑,以最终确定计划。
- 访谈阶段: Anthropic Interviewer 在 Claude.ai 上与受访者进行 10-15 分钟的实时自适应访谈。
- 分析阶段: 访谈结束后,人类研究员与工具合作分析文字记录,输出对研究问题的解答和典型引言,并量化各主题的普遍程度。
深入解析:AI 对不同领域的影响
大众职场人群:生产力提升与职场隐忧
总体而言,大众职场样本认为 AI 提升了生产力。86% 的专业人士表示 AI 节省了时间,65% 对 AI 在工作中的角色感到满意。
然而,职场动态显著影响了 AI 的采用。69% 的人提到了在工作中使用 AI 工具可能带来的“社会污名”。一位事实核查员表示:“我不会告诉任何人我的工作流程,因为我知道很多人对 AI 反感。”
虽然 41% 的受访者对工作感到安全,认为人类技能不可替代,但 55% 的人对 AI 的未来影响表达了焦虑。为了应对焦虑,25% 的人设定了 AI 使用边界(例如教育工作者坚持自己制定教案),另外 25% 的人则调整了职场角色,承担更多责任或追求更专业的任务。
增强(Augmentation)与自动化(Automation): 在访谈中,65% 的参与者将 AI 的主要作用描述为“增强”(协作完成任务),35% 描述为“自动化”(直接执行任务)。这与我们之前对 Claude 实际使用数据的分析(增强 47%,自动化 49%)存在差异。这可能是因为用户在对话结束后会自行修改输出,或者自我报告与实际使用习惯存在偏差。
专业人士设想的未来是两者的结合:自动化处理日常行政任务,同时保持人类的监督。48% 的受访者考虑将职业方向转向管理和监督 AI 系统。一位牧师提到,利用 AI 处理行政工作可以腾出时间去陪伴信众,但同时也强调了设定“良好边界”的重要性。
创意工作者:效率提升与身份认同的挣扎
创意工作者同样报告了生产力的提升:97% 表示节省了时间,68% 表示提高了工作质量。一位摄影师指出,AI 处理常规编辑任务将交付时间从 12 周缩短到了 3 周。
与大众人群类似,70% 的创意人员试图应对同行对 AI 使用的评判。经济焦虑在访谈中随处可见。配音演员感叹某些配音领域因 AI 而消亡;作曲家担心 AI 生成的廉价音乐会淹没市场;一位创意总监则坦言,自己使用 AI 意味着其他创意人员(如产品摄影师)失去了业务。
所有 125 名创意参与者都表示希望保持对创意输出的控制权。但在实践中,这种界限并不稳定。许多人承认 AI 在某些时刻主导了创意决策。不同创意学科的情绪特征差异显著:游戏开发者和视觉艺术家满意度高但担忧也高;设计师则表现出低满意度和高挫败感。这种情绪的广泛分散,凸显了创意人员在拥抱工具与担忧人类创造力未来之间的矛盾。
科学家:渴望科研伙伴,但信任度不足
在化学、物理、生物和计算领域的科研人员访谈中,我们发现 AI 目前还无法处理假设生成和实验设计等核心研究环节。科学家主要将 AI 用于文献回顾、编码和写作。
79% 的访谈将“信任和可靠性”视为主要障碍,27% 提到了当前 AI 系统的技术局限性。一位信息安全研究员抱怨说,如果必须仔细检查 AI 提供的每一个细节,就失去了使用它的意义。一位化学工程师则指出了 AI 的“迎合倾向”——它会根据用户提问的方式改变答案,这种不一致性令人怀疑。
尽管如此,科学家们对 AI 导致失业的恐惧较低。他们指出,许多隐性知识(如观察细胞颜色变化)难以数字化,且研究决策具有内在的人类属性。此外,机密环境的安全规定、预算和样本限制等外部因素也构成了 AI 替代的壁垒。
91% 的科学家表达了希望获得更多 AI 协助的愿望。他们最普遍的诉求是希望 AI 能够产生新的科学想法。正如一位医学科学家所说:“我希望 AI 能够感觉像是一个有价值的研究伙伴……能带来一些新的东西。”
展望未来与合作计划
这次初步测试证明了 Anthropic Interviewer 在大规模定性研究中的潜力。它不仅改变了研究方法,更从根本上改变了我们能够提出和解答关于 AI 社会角色的问题的维度。
为了让 AI 模型的开发以人类声音为中心,我们正在采取实际步骤与特定社区探索合作:
- 创意工作者: 我们正与领先的文化机构(如 LAS 艺术基金会、Mori 美术馆等)及创意社区合作,了解 AI 如何增强创造力,并探索通过模型上下文协议(MCP)辅助创意工作。
- 科学家: 我们与“AI for Science”受资助者合作,收集科学家对 AI 的看法和期望,结合定量与定性数据来改进专为科学家打造的 Claude。
- 教师: 我们最近与美国教师联合会(AFT)合作,旨在支持 40 万名教师进行 AI 教育,并将他们的视角引入 AI 系统的开发中。
我们还启动了一项公开的试点访谈,邀请公众参与,以进一步探索人们的经历、价值观和需求如何塑造他们对 AI 未来角色的愿景。
结论与局限性
对 1250 名专业人士的访谈表明,职场人群正在积极调整与 AI 的关系。人们倾向于保留核心职业身份任务,同时将常规工作委派给 AI 以提高生产力。通过大规模部署 Anthropic Interviewer,我们希望在人们的 AI 体验与我们的开发方向之间建立反馈循环。
研究局限性: 我们的发现应被视为 AI 对工作影响的早期信号,而非最终结论。本研究存在以下局限:
- 选择偏差: 参与者通过众包平台招募,可能比普通人群对 AI 持更积极或更有经验的态度。
- 受访者心理预期: 参与者知道自己在接受 AI 访谈,这可能改变了他们的回答方式。
- 静态分析: 我们只捕捉了当前的快照,无法追踪态度随时间的演变。
- 情感分析受限: 纯文本访谈无法捕捉语气、面部表情或肢体语言。
- 自我报告与客观指标的差异: 访谈数据与实际使用数据存在差异,受访者的回答可能带有理想化色彩或受社会期望影响。
- 研究者主观解释: 定性分析不可避免地反映了研究者自身的视角和侧重点。
- 全球普适性: 样本主要反映西方工作者的观点,不同文化背景下的态度可能存在显著差异。
- 非实验性研究: 我们无法确定 AI 使用与生产力提升之间的直接因果关系。
(注:参与本次访谈的受访者对 Anthropic Interviewer 给出了极高的评价,97.6% 的人满意度在 5 分及以上,99.12% 的人表示愿意向他人推荐这种访谈形式。)