摘要

1) 一句话总结 B站近期内测上线了AI视频总结功能,通过将视频语音转文字并提取核心内容,生成带有可跳转时间轴的章节摘要,大幅提升了用户在长视频和学习类内容中的信息获取效率。

2) 核心要点

  • 核心功能:AI可精准总结视频内容,并生成时间轴形式的章节摘要,用户点击对应时间点即可直接跳转至该视频片段。
  • 多语言支持:该功能不仅适用于中文视频,对英文视频的总结同样准确有效。
  • 适用场景:极大地优化了B站核心的“长视频”及“硬核学习类视频”的观看体验(如长达30分钟以上的游戏评测),帮助用户快速掌握优缺点及核心观点。
  • 技术实现与优势:B站利用自身平台数据优势,直接将视频语音识别为文字(类似Whisper技术)再进行大模型总结,降维打击了仅能依赖已有字幕文件的第三方AI总结工具(如BibiGPT)。
  • 测试覆盖率:据作者近千个视频的测试样本,约80%的视频已支持生成AI总结。
  • 功能限制规则
    • 舞蹈区、音乐区、鬼畜区的所有视频不支持总结(按钮置灰)。
    • 所有的竖版短视频不支持总结。
    • 时长低于30秒的视频不支持总结。
    • 涉及经济、国际环境等敏感话题的视频一律不支持总结。

3) 风险与不足(基于原文明确提及)

  • 内容误导风险:对于部分以音乐配音为主的视频(如纯英文歌配乐的纪念视频),AI可能会被误导,直接将背景音乐的歌词作为视频总结输出。
  • 敏感信息合规风险:涉及经济、国际环境等领域的视频存在生成不当言论的合规风险,因此平台主动屏蔽了此类内容的总结功能。
  • 第三方创业风险:基于大厂平台内容且无垂直行业数据保护的AI应用(如第三方视频总结插件),缺乏护城河,极易被官方原生功能挤压生存空间。
  • C端AI通用痛点:当前C端AI应用(如AI搜索)普遍缺乏深度的用户个人隐私数据,无法真正理解用户意图,导致输出结果有时“驴唇不对马嘴”。

正文

今天睡醒,吃饭的时候照例打开B站,准备找个视频看看,好下饭。

然后在B站发现一个有趣的小功能,AI视频总结。

之前就有消息B站在做这个功能,且要开始逐渐开放给用户了。

这玩意在我这昨晚肯定还没有的,因为我昨晚高强度刷美女跳舞视频刷到了夜里1点,当时也没看到这个功能。一觉起床,来了。

我直接在影视飓风这个转笔的视频下,试了一下AI视频总结这个功能,给出来的总结还是比较精准。并且B站这个AI总结最大的特色就是, 将这个视频给你抽离成时间轴的形式,每一条的总结,都可以直接跳转到视频的对应时间点。

可以这么说,B站直接用AI的功能,给绝大部分的视频,不仅做了总结,还都分了章节,这在用户体验的效率上,是一个飞跃版的提升。

影视飓风这个视频只有5分钟,可能体现的还不是很明显。

要知道,B站最核心受众最广的内容,是 长视频,甚至是那种硬核的长视频 。

比如我最爱看到的一个UP,Tdogegg,之前有一个视频评测游戏《星空》的,直接就干到32分钟,这个时长对很多的观众来说,已经很吃力了。关键是,他还不分章节,你想知道他的观点,想知道他的评价,就只能全部看完。

而有了AI视频总结之后,你可以快速的知道《星空》的优点和缺点。

比如总结中所给出的:

… 游戏《星空》的加点系统和装备驱动玩法,以及游戏的预期管理和宣发误导问题 08:07本作的加点系统与上古卷轴五相似,但运动效果不理想 10:30贝寒斯达构建出一套系统规则,可以尽情胡闹 12:35贝塞斯达的游戏实力一根尖锐的针,除了BRPG的核心体验外,其他部分糊弄过来的 等等

快速知道大致观点以后,你可以选择从头开始看,也可以选择快速跳到AI给出的某一个时间点,去看那个特定的章节。

而这个功能用在学习上,更是尤为好用。一键总结,条理清晰,分门别类,一键跳转。而且对于英文的视频,总结起来同样没有任何问题。

B站的AI视频总结,是我认为至今为止,大模型跟旧有的C端互联网产品,结合的最好的一个功能,也是真正的痛点功能。

国内厂商搞AI这么久了,但是大家都发现,AI在C端应用上,好像鸦雀无声,被寄予厚望的搜索革命,百度、淘宝、B站什么的都在做,但是都打不到用户的痛点。

因为AI对你的了解,还没有到真正到“懂你”那种随心所欲的地步,你让你老婆帮你挑件衣服,甚至有时候都不是你想要的,你觉得现在的AI搜索或者推荐能达到那个地步?缺太多数据了, 缺太多你个人隐私信息的数据了 。

有些隐私数据是能真正帮你了解一个人的,比如他深夜喜欢在一些XX网站上搜什么关键词,搜big还是huge,比如他喜欢吃什么菜,喜欢吃紫燕百味鸡还是沙县,等等。AI不了解这些信息,就没有办法真正“懂”你,没有办法做到真正理解你的意图。导致有时候AI搜出来的东西,驴唇不对马嘴。

至于隐私数据和数据安全的平衡,还有边缘计算的解决方案等等,那就是另一个话题了,后面有机会再说,暂且按下不表。

回到B站的AI总结,你会发现,这玩意 有且也只有B站能做, 毕竟抖音、 快手、视频号上那些视频, 需要总结个鬼 。 。 。 。

并且这是一个已经被验证的痛点,3月份 吕立青_JimmyLv大佬做的BibiGPT,就是做B站视频AI总结的,一度火出圈。不过他只能基于字幕总结,没有上传字幕文件的视频就无能为力了,作用不是很大。

而B站明显就是仗着视频数据都是自己的以及财大气粗,直接将数据库中的视频全部将语音识别成文字(这块已经有极其成熟的生态,比如 Whisper ) ,然后再将文字 进行总结并加工。直接降维打击了。

所以其实我一直都很不看好基于别人家产品以及没有垂直行业数据保护所做的AI应用创业,很容易被大厂直接下场而挤压生存空间,毕竟,真的没有护城河。

当然,B站的AI视频总结也还在内测阶段,我大概花了1个多小时时间,测试了近千个视频,80%的视频基本都是可以总结出来的,但是也发现了一些B站有意思的规则。

  1. 舞蹈区、音乐区、鬼畜区的所有视频都是灰色的不能总结。(废话,这三玩意总结个屁,一句正经话都没有)

不过有些其他区的视频是音乐配音的,直接给B站的AI误导了。比如科比的这个纪念视频,全程是一首英文歌配乐,总结就直接把歌词拿来总结了,笑死我了。

  1. 比如所有的竖版短视频都不能总结。这个能理解。

  2. 比如低于30秒的视频都不能总结。太低的时长有那总结功夫,看都看完了。

  3. 涉及经济、国际环境等等的,一律不能总结。同样能理解,防止敏感信息,那些玩意里面可能有些坑,到时候总结说了一些不该说的,那就直接炸了。

总结一下,B站跟AI的这个结合,还是属于让我比较惊喜的程度,虽说是内测,但是已经做的非常完善了。至少在体验层和数据准确层,很棒。

也做到了目前AI最核心最成熟的用处:“降本增效”,让用户在观看视频获取信息的时候,进一步提升效率。

AI的关注度,经历了2~3月的巅峰,随后就陷入了漫长的低谷。

但是谁都知道,AI的时代,真的已经,逐渐到来了。

B站这一枪。

划破了黑暗,惊醒了黎明。

⭐~感 恩。

关联主题