摘要

1) 一句话总结 印度科技巨头(Wipro、Tech Mahindra、Infosys 和 Persistent)正借助 NVIDIA 的代理型 AI 技术和企业级软件,在呼叫中心、电信网络、软件工程和药物发现等领域重塑业务流程并大幅提升生产力。

2) 关键要点

  • 宏观经济影响:得益于 AI 的推动(包括 9 月份获得的 38,000 块 GPU),印度科技行业总营收预计将从 2023 年的 2500 亿美元翻倍至 2030 年的 5000 亿美元。
  • Wipro 呼叫中心转型:利用 WEGA 平台和 NVIDIA AI 为美国大型医保提供商部署智能体,目前已能独立处理 42% 的呼入电话。
  • Wipro 性能指标:在 900 个并发通话和每秒 164 个请求的高负载下,实现低于 200 毫秒的极速响应,并采用 NeMo Guardrails 确保受监管环境下的安全性。
  • Tech Mahindra 电信自动化:开发大型电信模型(LTM),结合 NVIDIA Nemotron 模型和 NeMo Agent Toolkit,为现场技术人员生成基于数据的修复优先级建议,推动网络运营自主化。
  • Infosys 编程模型:利用 NeMo 框架开发了 25 亿参数的编程小型语言模型(SLM),集成于 Infosys Topaz Fabric,支持在本地数据中心、云端或标准台式机上部署。
  • Infosys 模型基准:该 SLM 在 MBPP 和 BFCL 等基准测试中媲美前沿模型,并通过 Stanford AIR-Bench 和 Meta CyberSecEval 等行业基准验证了其安全性。
  • Persistent 药物发现:推出基于 NVIDIA BioNeMo 和 NeMo Agent Toolkit 构建的 GenMoIVS 解决方案,在进入湿实验室前通过高精度模拟和虚拟筛选评估候选化合物,缩短开发周期。

3) 风险/缺口

  • 传统运营模式的局限性:传统呼叫中心高度依赖季节性招聘和漫长的培训周期,已无法跟上高峰期的客户需求,行业急需能控制成本的新型运营模式。
  • 呼叫中心业务痛点:客服运营面临呼叫量不断攀升、数据碎片化以及行政工作繁重等现实缺口。

正文

代理型 AI(Agentic AI)正在重塑印度的科技产业,为全球服务带来飞跃。借助 NVIDIA AI Enterprise 软件和 NVIDIA Nemotron 模型,印度的科技领军企业正在加速呼叫中心、电信和医疗保健等各行业的生产力与效率。

Infosys、Persistent、Tech Mahindra 和 Wipro 正在引领这场业务转型。他们利用基于 NVIDIA AI Enterprise 构建的集成代理型 AI 平台,大幅提升了后台生产力和客户服务水平。在今年的印度 AI 影响力峰会(India AI Impact Summit)上,由代理型和生成式 AI 驱动的下一代商业服务的前沿成果得到了全面展示。

根据 IBEF 的数据,得益于 9 月份获得的 38,000 块 GPU 所带来的 AI 发展势头,印度科技行业的总营收预计将从 2023 年的约 2500 亿美元增长至 2030 年的 5000 亿美元。

Wipro:借助 WEGA 平台与 NVIDIA AI 提升呼叫中心效率

在受政府监管的医疗保险市场中,客户体验至关重要,尤其是在注册高峰期。此时截止日期临近,用户需要全天候的支持来评估选项并为家人做出最佳的参保决策。传统的呼叫中心依赖季节性招聘和漫长的培训,已无法跟上需求,行业急需一种既能改善客户体验又能控制服务成本的新型运营模式。

Wipro 推出了一款由 WEGA 平台和 NVIDIA AI Enterprise 软件驱动的 AI 智能体辅助解决方案。该系统已在美国一家大型医疗保险提供商中部署,通过赋能客服代表处理更复杂的请求、加快解决速度、提供个性化支持并提高运营效率,重塑了会员体验。

AI 智能体能够满足客户对医保计划的期望:即时获取准确信息、对话式自助服务、无缝注册以及跨渠道的一致指导。面对不断攀升的呼叫量、碎片化的数据和繁重的行政工作,AI 智能体通过即时扩展、全天候运行以及为人类代表提供实时智能支持,成功弥合了这一差距。

其成果十分显著:

  • 高效分流:目前 42% 的呼入电话由 AI 智能体处理。
  • 极速响应:在 900 个并发通话和每秒 164 个请求的情况下,实现近乎即时的响应(延迟低于 200 毫秒)。
  • 体验升级:会员享受自然的对话式自助服务,人类客服获得实时提示和知识检索,集中式数据中心提供个性化洞察,自动化数字化流程则消除了下游的手动工作。

该解决方案使用了生产级、可水平扩展的 NVIDIA NIM 微服务和 NVIDIA NeMo Guardrails,确保了在受监管的医疗环境中所需的性能、治理和安全性。目前,其影响力正扩展至金融服务领域——在任何看重准确性、合规性和规模化的领域,AI 智能体正成为一股变革力量。

Tech Mahindra:部署大型电信模型,驱动自主网络运营

Tech Mahindra 正与 NVIDIA 合作构建新平台,加速向 AI 辅助的网络运营转型。其核心是一个大型电信模型(LTM),能够生成基于数据的优先级建议,帮助现场技术人员根据历史成功率对整个网络中的修复方案进行排序。这带来了更快、更准确的故障排除(通常在一次访问内即可解决),并为迈向 L4 级以上的运营成熟度铺平了道路。

一家大型电信服务提供商已采用该 LTM 基础架构作为其运营路线图的一部分,旨在通过更高质量的工单和更少的升级流程,改善服务层问题解决效率、客户体验和后台效率。

该平台的技术亮点包括:

  • 使用 NVIDIA Nemotron 嵌入模型对遥测数据进行语义搜索。
  • 使用 **Nemotron 重排模型(reranking model)**提高决策的相关性。
  • 通过 NVIDIA NIM 微服务部署模型,实现快速可靠的加速 AI 推理。
  • 利用 NVIDIA NeMo Agent Toolkit 编排跨网络域的智能体工作流,实现真正的大规模代理型运营。

通过拥抱自主网络运营,Tech Mahindra 展示了 AI 如何改变年收入超 1.5 万亿美元的全球电信行业——在这个行业中,即使是正常运行时间和效率上的微小提升,也能带来巨大的经济效益。

Infosys:构建企业级编程小型语言模型

Infosys 使用 NVIDIA AI Enterprise 中的 NeMo 框架开发了一款用于编程的新型小型语言模型(SLM),并将其集成到 Infosys Topaz Fabric 中。该模型在保持轻量化的同时,以媲美前沿模型的性能加速了软件交付,并且可以部署在企业本地数据中心、云环境甚至标准台式机上。

该模型拥有 25 亿参数,支持智能体开发、代码生成、重构和端到端软件工程工作流。它基于高质量代码、合成数据、数学推理和自然语言输入的混合数据进行训练,使其在 MBPP、MBPP+ 和 BFCL 等基准测试中能够匹敌前沿模型的表现。

Infosys 还高度重视安全与信任。该模型结合了安全对齐训练和负责任的 AI 实践,在保持流畅度的同时减少了有害输出。其安全编程能力已通过 Stanford AIR-Bench 和 Meta CyberSecEval 等行业基准验证,让企业能够放心地将其部署到代码生成、调试和多智能体开发流水线中。

Persistent:加速 AI 驱动的分子发现

Persistent Systems 正在与 NVIDIA 合作,将早期药物发现推向速度和科学保真度的新纪元。此次合作将 Persistent 深厚的生命科学工程专业知识与 NVIDIA 的全栈加速计算平台相结合,为研究人员提供了一条从 AI 实验到生产级发现工作流的强大路径。

该项目的核心是 Persistent 全新的生成式分子与虚拟筛选(GenMoIVS)解决方案。该方案基于 NVIDIA BioNeMo 平台和 NeMo Agent Toolkit 构建,使用大型特定领域模型高精度模拟分子行为,在进入湿实验室(wet lab)之前生成并评估候选化合物。这些代理型工作流在虚拟筛选、优先级排序和实验规划中进行持续推理,帮助团队降低早期发现的风险并缩短开发周期。

该平台运行在包含 NVIDIA AI Enterprise 软件和 NIM 微服务的加速计算平台上,支持受监管环境下的高通量模拟和实时科学决策。通过将可扩展的基础设施与生产就绪的代理型 AI 相结合,Persistent 正在为生命科学组织提供一种更快、更具成本效益的方式来探索化合物空间,并提高下游的成功率。

关联主题