7月5日,在商汤举办的“大爱无疆·向新力”论坛上在线全职美工,商汤科技董事长徐立在现场发布了大模型“日日新5o”,交互体验对标OpenAI最新发布的 GPT-4o。
实时交互能力背后的支撑来自于商汤最新的基座模型。在会上商汤同时宣布大模型迭代到“日日新5.5”,其综合性能较上一代“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强。
据介绍,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,“日日新5o”可以带来全新的AI交互模式,即实时的流式多模态交互。
对标OpenAI和谷歌此前的产品发布会在线全职美工,商汤也在论坛上搭台进行了模型交互能力的现场演示。商汤工作人员举起手机与“日日新5o”打招呼后,它能识别出工作人员脖子佩戴的胸卡,判断这是一个大会会场。
美工招聘工作人员进一步测试了“日日新5o”识物能力,将手机对准带有商汤LOGO的安全帽,模型能够识别出这与某个品牌或公司有关,将手机对准一个玩偶,模型回复称,“小兔玩具超可爱的,像穿着警服的卡通警察,白身子粉耳朵,紫眼珠特灵动,嘴边红点点缀,俏皮又逗趣。”
工作人员还将手机对准了书,让模型介绍书名和内容,另外对准某一页书,模型也能概括这页大概的内容。根据记者在现场的感受,在交互反馈上,人类与模型问答间隔的时间大概在2-3秒。
值得一提的是,在7月4日的产业发展主论坛上在线全职美工,徐立在发表演讲时提到,要推动人工智能超级时刻的到来,大模型需要具备更卓越的思维能力、更自然的交互能力以及更可控的生成能力。
“我一直的观点是,虽然我们的行业非常热,包括像ChatGPT带来了聊天式的应用,外包美工Sora带来了视频,但它还没有到超级时刻,是因为它没有真正走进到一个行业的垂直应用中引起广泛的变化。”徐立认为,实时的交互性能够带来流畅的体验,也是带来超级时刻以及推动应用变化的一个核心。
针对“日日新5o”背后的基座大模型,商汤介绍,日日新5.5基于超过10 TB tokens数据训练,包括大量人工合成数据,数据构造从基础知识转向合成思维链,在数学、推理、长文本、编程等多个维度都有大幅提升。此外,模型采用混合端云协同架构,可最大限度发挥云边端协同。
在演讲最后,徐立在现场特别提到了“大模型0元Go”计划,称凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时,商汤表示将免费赠送5000万Tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者刘晓洁
相关阅读 商汤发布可控人物视频生成大模型Vimi,实现分钟级视频可实现分钟级精准控制。
07-04 10:48 商汤股价涨超17%商汤科技将发布“日日新5.5”版本
07-03 13:48 原创 “AI小龙”们 活得可好?丨价值三人行商汤自从发布大模型日日新5.0以来,市场反响热烈,股价大幅反弹。以商汤为代表的上一代“AI小龙”们,现在经营状况如何?新一代的“AI小龙”们,面临什么样的机会和挑战?
06-27 12:26 商汤科技将在WAIC 2024上发布“日日新5.5”据悉,本次商汤推出的“日日新5.5”大模型体系的多模态能力大幅升级。
06-26 16:34 GPT-4o的高昂代价GPT-4o会像一个黑洞那样吸入一切离它太近的材料在线全职美工,从而增加自身质量,积累用户输入的每一条信息,无论是文本、音频文件还是图像。
06-25 21:47 一财最热 点击关闭特别声明:以上内容(如有图片或视频亦包括在内)来源于网络,不代表本网站立场。本网站仅提供信息存储服务。如因作品内容、版权和其他问题需要同我们联系的,请联系我们及时处理。联系方式:451255985@qq.com,进行删除。