华军软件园发布9月AI产品榜丨零一万物发布新版大模型Yi-Lightning丨李开复:中美顶尖大模型性能差距只有五个月
AI奇点网2024年10月17日报道丨AI资讯早报
今年9月中上旬,华军软件园对外发布2024年8月国内AI产品排行榜,这是该网站推出的第一期AI产品榜。该榜单通过综合分析市场数据、用户反馈和产品性能,评选出在AI领域表现卓越的产品,为行业内外的观察者提供了一份权威的参考指南。
时隔一个月,10月14日,华军软件园通过公众号对外正式发布第二期榜单。
在最新的9月份总榜中,字节跳动旗下的豆包、百度旗下的文小言APP,以及百度翻译AI服务成为了本期榜单的TOP3产品。
具体来说,本期榜单的看点如下:
华军AI产品榜旨在构建和维护国内AI产品权威评价体系的新举措。通过这个榜单,聚焦国产的AI产品开发团队,挖掘在AI技术革新、应用实践、用户体验上表现出色的AI产品。
AI产品榜不仅关注产品的市场表现,还深入分析了AI技术在不同场景下的应用效果,如AI数字人、AI搜索和AI教育工具等。这些细分榜单为用户和行业从业者提供了更为精准的市场洞察。
完整榜单地址访问:
10月16日,国内人工智能大模型创业公司“零一万物”正式发布了新的预训练模型 Yi-Lightning。
零一万物发布的最新旗舰模型 Yi-Lightning,与零一万物上半年发布的千亿参数模型 Yi-Large 相比,在性能更进一步的前提下,推理速度方面有着极大提升。
根据官方发布的评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统返回响应的结果的时间差)仅为 Yi-Large 的一半,最高生成速度也提升了近四成,实现了旗舰模型的性能升级。
在国际权威盲测榜单 LMSYS 上,Yi-Lightning 排名第六,暂时位列于OpenAI的GPT-4o-2024-05-13、Anthropic的Claude 3.5 Sonnet之前,排名世界第六、国内第一,稳居世界第一梯队的大模型公司之列。
根据李开复介绍,模型性能与推理速度的提升,一方面因为零一万物重视AI Infra能力的提升,2024年以来,中国大模型行业从狂奔进入到了“长跑阶段”,而大模型公司的核心竞争力模型+AI 基础设施+应用,缺一不可。
另外一方面,Yi-Lightning更新了模型架构,不再应用稠密模型架构,而是采用了 Mixture of Experts(MoE)混合专家模型架构,并在模型训练过程中做了新的尝试。
零一万物同时也发布了面向ToB市场的首款产品——AI 2.0数字人,为零售和电商场景设计,利用最新的Yi Lightning旗舰模型提供行业解决方案。
在本次的发布会上,作为CEO的李开复回应了国内近期盛传的「两家公司放弃大模型预训练」的传闻,他提到:“据我了解的情况,目前国内的“AI六小虎”在融资方面都有足够的资金支持,可以承担起预训练模型的运行成本。因此,只要这些公司能够吸引到足够的优秀人才,并有决心进行预训练模型的开发,资金和芯片的资源都不会成为发展的障碍。”
上周,国内的大模型行业传出风声:国内部分模型公司打算放弃成本高昂的预训练,不再和国外大厂硬拼——零一万物是被点名的企业之一。
李开复在 10 月 16 日的新版本模型 Yi-Lightning 发布会上说,OpenAI的 o1 发布之后,的确给市场带来了新灵感,「一年半以前大家觉得大模型最厉害的地方就是预训练,一年以后发现 Post train(后训练)也是同样重要,这感谢 OpenAI 点醒我们这一点。」
不过,后训练的重要性变高,不代表要大模型的创业公司就要彻底放弃预训练。
李开复如此说:
很多人问中国的大模型预训练是否落后美国?我们也坦诚中国现阶段是落后美国的,但如果有人说“落后十年、二十年”,今天我们可以用非常精确的数字来算——GPT4o 是今年 5 月份做出来的大模型,我们在 10 月已经把它打败了。如果真的计算中国赶超美国有多远的距离,那么至少,零一万物离 OpenAI 的模型,也就只有五个月的差距。
当地时间10月15日,据外媒报道,知情的人士透露,在特斯拉上周五举办的“We, Robot”发布会上,在展示旗下 Robotaxi 自动驾驶出租人 Cybercab 的环节中,马斯克要求在活动上插入针对擎天柱(Optimus)人形机器人原型的某些特定功能展示,旨在激发各路的投资者对未来机器人产品的兴趣。
在本场“We, Robot”发布会上,据一位要求匿名的知情人士对媒体透露,在活动上,身处各个人形机器人展示点位的员工负责监督“擎天柱”机器人与参与活动的与会者进行诸多的互动环节。
据悉,在实验室内,擎天柱的原型机器人已具备在无需外部操控的情况下,依靠内置的人工智能自主行走的能力。
活动结束后,部分参会者在社交媒体上分享了他们的观察,指出这些机器人得到了人力帮助。
网络上流传的至少一段据称是 10 月 10 日 Cybercab 活动现场的视频中,一名扮演酒吧酒保角色的“擎天柱”机器人也在对话中坦言,它得到了来自“人类的协助”。
需要注意的是,马斯克在他的产品介绍讲话当中,并未强调这一点。
引发了公众对这款机器人实际能力和是否已准备上市销售的广泛质疑,不少网友指出,马斯克存在诱导市场与投资人支撑特斯拉股价的嫌疑。
在日前举行的 AGI Playground 2024 上,百川智能 CEO 王小川 表示,今天的 AI 应用,大多只是大模型能力对外的呈现方式。
在王小川看来,大模型的创业者做 AI 应用需要非常谨慎,用过去的 App 工厂流水线的模式来做大模型应用,可能会给创业者带来很大的代价。
「娱乐应用 Kill time,效率工具 Save time,而医疗应用则能延长生命。」他说。
所有的东西都在变得越来越便宜,越来越容易获得,但公众的医疗和健康的成本却在变得越来越贵。这是个很难的问题,但大模型、AGI 能解决这个问题,这便是他认为未来 AI 最大的发展方向。