摘要
1) 一句话总结 2023世界人工智能大会(WAIC)的参展体验显示,主流AI大模型及应用普遍缺乏突破性创新,但以出门问问和商汤为代表的数字人技术在交互精度与低硬件门槛上展现出了显著的进步与应用潜力。
2) 核心要点
- 展区分布:展览主要分为“机器人与硬件”和“AI大模型及应用”两大板块。
- 大模型缺乏新意:文心、通义、优图、星火等主流大模型展出的多为已上线的旧产品,未展示全新的杀手锏级技术。
- 出门问问大模型应用:展示了自研大模型“序列猴子”及AI写作应用“奇妙文”(支持直接生成脚本并配图),以及基于自研AI绘图工具“言之画”生成的画展。
- 金山WPS AI实机演示:现场开放了结合具体场景的实机操作,吸引大量用户,但功能与线上版本一致。
- 出门问问数字人动捕:其“奇妙元”产品支持用户选择数字人形象、服装与场景,并接入全身动捕,画面质量与流畅度极高。
- 商汤数字人低门槛与高精度:仅需一张GTX 1060显卡和80元的普通摄像头,即可在复杂人群中精准识别操控者,并完美模拟复杂的手部骨骼动作。
- 商汤“如影”APP公测:用户仅需录制几分钟视频,即可快速生成专属的数字人分身。
- 其他特色展品:包括美团景区无人机外卖配送、中科曙光液冷服务器(《流浪地球2》同款根服务器)、XMOV精细虚拟人直播以及商汤AI投篮等。
3) 风险与不足(基于原文明确提及)
- 过度监控与封闭:大部分大模型公司在用户交互试用时进行严格的人工监控,且拒绝媒体/观众的拍摄与直播介绍诉求。
- 虚假宣传问题:部分厂商将开源模型(如Stable Diffusion)进行修改后,包装成“自研”AI绘图技术进行宣传。
- 产品优化空间大:金山WPS AI的实际生成效果仍有非常大的优化空间。
- 前沿技术滞后:作为顶级行业大会,展出的AI大模型和应用多为两三个月前已发布的技术,缺乏最新前沿成果。
正文
今天终于来了心心念念的2023世界人工智能大会。
9点进场,一直到下午5点半出场。
我整整逛了8个小时,暴走2万步,在场馆内溜了一圈又一圈。算是逛了个遍。
展览馆分为两边,一边偏机器人和硬件的,一边偏AI大模型和应用的。
机器人和硬件展区很新奇,但是我也确实不太懂。
聊聊右半拉AI这块的展区。特别是右上角的AI大模型及应用。
可能是预期打的太高,在深度体验了每个展台的生成式产品后,我只能用一个词来形容:
失望。
文心、通义、优图、星火等等,展出的都是老玩意,基本没有什么新奇的东西,就是把线上搬上了台上,仅此而已。
不仅如此,最基本的试用,去跟大模型交互问问题,都在工作人员的严格监控下,他们生怕出一点点🤏问题。
在我早上跟朋友公司直播的过程中,大部分的大模型公司都拒绝了我们想拍摄或介绍一下的诉求。
只有出门问问非常自信的欢迎我们 ,热情的给我们介绍他们自研大模型“序列猴子”,在我们镜头前也给我们尝试了基于序列猴子做的AI写作应用奇妙文。
有一说一,直接生成脚本,再用脚本直接生成不同场景的配图,这个真的很酷。
而且他们可能是整个场馆里最具有艺术气息的公司了,直接办了一个画廊,挂上了他们言之画做出来的AI画作,命名为《交响》,很有诗意。 而且据我了解,他们的AI绘图是正儿八经自研的,不像某些厂商直接拿开源SD魔改一下直接摇身一变变自研。。。嗯说的就是你,XX。
最后还送了我们明信片,相当漂亮!
金山展台的WPS AI也人员爆满,直接放出来了实机操作,可以看出来结合具体场景,打用户痛点,还是最吸引人的。但是跟线上可体验的WPS AI也别无二致,效果怎么说呢,还有非常非常大的优化空间。
整体上,AI大模型和AI应用这块,挺失望的,最前沿的世界人工智能大会,展览出来的东西,却都是玩了2、3个月的东西了。
并没有让人眼前一亮的,没见过的掏出来的杀手锏。
平淡如水。
但是 无心插柳柳成荫。
AI的失望,却被数字人的惊喜所填平了。
首先自然是这个火爆全网的视频。
当你亲眼看到时,还是相当震撼的。
又是你,出门问问。。。出门问问打钱!
现场观众可以直接在他们的奇妙元里,选一个喜欢 的数字人形象,搭配服装和场景然后接全身动捕,操作虚拟世界中的数字分身,质量极高,流畅度极高,感觉是元宇宙未来的基建之一了。。。可惜我社恐,要不然高低上去体验一把。。。
另一个惊喜就是商汤的数字人,在早上直播的时候,同行的大佬给我力荐商谈的数字人。
实际一看,相当猛。
只需要一个摄像头,人可以站在摄像头面前,实时控制屏幕中的数字人,在当时超级复杂的人员密度里,居然可以精确的识别出来正在操控的人。
而且众所周知,在AI的处理里,手一直是最麻烦的。
不管是AI绘图还是建模等等,手部骨骼处理一直是个老大难。
但是商汤的数字人在手部的处理上居然已经趋近完美,多么复杂的手部动作都可以模拟出来。
最恐怖的是,他们的工作人员介绍说,用来演示的这台电脑显卡是1060,摄像头是随便买的80块钱的摄像头。。。
这配置,简直是普度众生,有手就行。。。
目前他们就在前两天,公测了数字人APP,如影,录几分钟的视频,就能快速生成一个你的专属数字人。
借助生成式大模型的涌现,数字人在最薄弱的内容生成上,也如虎添翼。
这次。
可能是真的要崛起了。
最后,再放一些这次世界人工智能大会的有意思的照片。
商汤的AI投篮。
美团的无人机,能将外卖直接给你送到正在景区中游览的你的手上。
有点傻傻的机器人。
XMOV的精细虚拟人直播。
中科曙光的液冷服务器(流浪地球2的北京互联网根服务器就是这玩意)
最后的最后。
世界人工智能大会值得一来,可以涨不少知识,开拓不少视野。
但是如果你是想看最新的黑科技大模型或者AI应用,那你可能就要失望了。
放低预期,你会有全新的感受。
⭐吧, 感恩。