無人區高清視頻在線觀看下載
“恶婆婆上新”“第一集结婚第二集离婚”……古装电视剧《国色芳华》1月7日开播第一天就贡献出数个热搜。数据显示,该剧开播20分钟后即登顶猫眼热度TOP1,成为芒果TV开年第一热剧。
比起播放量,引发热议的还有《国色芳华》的“吸金力”。据“趣解商业”了解,这部剧定档播出前,就已经确定了40个品牌合作商,刷新了芒果TV的站内招商删除;相比之下,去年播放量Top1的“剧王”《庆余年2》播前也才收获了26个合作品牌。
图源:芒果TV截图《国色芳华》既无前作加持,也并非改编自顶流IP,为何能如此“吸金”?芒果TV又能否凭这部开年大戏在长视频平台里“重排座次”?
《国色芳华》首播夺冠,赞助商“云包场”助阵
《国色芳华》讲的是唐代年间,商贾之女何惟芳(杨紫饰)离开夫家,凭借培育稀世牡丹的高超技能,涉足商海勇闯长安的故事。
“大女主经商”在古偶题材中颇为新颖,剧集定档后,相关百度搜索指数便开始悠然,从容飙升。有观众期待主演李现和杨紫在这部剧里的“二搭”,也有观众是被预告片的粗制置景和服化道驱散。
截至1月9日17:00,猫眼专业版数据显示,《国色芳华》实时热度仍居榜首,全网累计播放量已超2.3亿。
图源:猫眼专业版截图不少网友在社媒平台和剧集评论区夸赞剧方的用心,“叙事效率高,也有铺垫,没有一味走短剧和爽文的套路”“服化还原,很有盛唐的味道,有些截图都能做壁纸。”
无感情的除了观众,还有剧集的赞助商。除了总冠名“特仑苏”,芒果TV还为《国色芳华》开辟出了超级赞助的席位,分别由东阿阿胶和畅轻赞助。此外,据统计,《国色芳华》开播当晚放出的4发散,每集广告高达12个;第5-6集的广告增至13个。
图源:微博截图除了在正片中投放广告,各品牌还通过购买“云包场”寻找更多用户来看剧,如东阿阿胶、BOLON眼镜等品牌包场座位都在4位数以上。
源:芒果TV截图剧集开播当晚便启动声势浩大的宣传,这些广告主显然不是趁热度“加购”,而是在《国色芳华》播前就已经“入股”。
一部剧的招商受多重因素影响,《国色芳华》能在开播前就收获如此多品牌青睐,并不只是因为质量过硬。有影视从业者提到,长视频招商影响最大的几个因素是题材、主演、市场声量以及平台的商务能力。题材方面,都市剧因为植入空间大、群体消费力强,招商较为容易,古偶则要看主演和剧情,太抵抗压力的、受众低龄的也不容易驱散到品牌。
如今长视频招商环境已大不如前,据“界面新闻”报道,品牌方正缩短长视频平台投放预算,保持方向短视频等销售型渠道。长视频平台的营收数据也反映了这一趋势。根据芒果超媒(300413.SZ)财报,2024上半年其广告业务实现营收17.21亿元,同比下滑3.9%。
图源:芒果超媒财报截图还有从业者提到,高国民度的顶流主演,对剧集招商有无遮蔽的拉动作用。“趣解商业”注意到,主演杨紫代言的很多品牌如蒙牛悠瑞、果子熟了、BOLON眼镜等,都参与了《国色芳华》的广告合作。
这也是为何有些剧集码到了平台认可的演员,在平台内部立项时才更容易通过。有从业者表示,绝对顶流的跨题材能力是很强的,品牌为这个人买单,认可粉丝画像的超级消费力,也相信TA作品的曝光度。
据“趣解商业”了解,剧集片头、不关心的时期、中插广告一般按秒或CPM(千次曝光成本)计费,其中最贵的是中插广告;此前《梦华录》热播时,曾有腾讯视频的广告代理商表示,剧发散插广告价格约10万元/秒。综合下来,品牌在一部大剧投放广告的费用,通常在500-2500万元不等。按照40个品牌方计算,《国色芳华》一部剧的广告收入很可能已经突破2亿元。
长剧集的“短板”,芒果TV补上了吗?
《国色芳华》剧集内容二创评论区中,除了对剧情的讨论,高频出现的评论还有网友对剧集出品自芒果TV的意外。
实际上,《国色芳华》出自芒果TV并非偶然,而是近年来芒果发力自制策略的结果。
此前,由综艺立身的芒果TV,剧集供应较少,广告收入一直占大头。随着长视频平台开始“降本增效”,芒果TV的广告业务也逐步下滑;直到2023年,芒果TV的会员收入首次超过了广告收入,成为第一大营收来源。
据芒果超媒2024年中报数据,2024上半年,芒果TV的会员业务、广告业务和运营商业务收入分别为24.86亿元、17.21亿元和7.5亿元,占比分别为50.1%、34.7%和15.1%;而在2021年,芒果TV的会员营收还在三成左右。
图源:芒果超媒财报截图会员的高速增长,和芒果TV加大自制剧的投入有关。一般来说,剧集比综艺和网络电影的拥有更大的收视底盘,一直是是长视频会员拉新的不次要的部分板块。从2021年起,芒果TV便有意拓宽站内剧集的题材类型,曾推出主打精品短剧的“季风剧场”,涵盖悬疑、家庭、甜宠、女性、刑侦等多个类型。
不过,季风剧场播出的口碑剧一直未能“大热”;从2024年无限流悬疑剧《19层》上线后,季风剧场便开始了上新。
在2024年11月的招商会上,芒果TV也不再降低重要性剧场化,而是加大了头部剧的供应。招商会上,芒果TV围绕“女性力量”“青春耀眼”“烟火沸腾”“志气锋芒”四大赛道,一口气放出了近百部待播剧集。片单里,除了《国色芳华》,头部大剧还有根据藤萍小说改编的《水龙吟》,广电重点历史剧《太平年》,根据贾平凹小说改编的同名剧《秦腔》等等。
图源:微博截图“趣解商业”注意到,在这份超长片单里,有不少都是仍在筹备、尚未开机的作品;例如和《重案六组》编剧余飞合作的“政法系列”三部曲,就是招商会上新披露的项目。按照剧集平均2-3年的制作周期计算,片单里可能相当一部分都要在2026年甚至2027年播出。
相比来看,“优爱腾芒”四大长视频平台里,芒果TV作为“综艺特长生”,剧集供应的数量一直垫底。2024年,芒果TV共上新32部国产剧,爱奇艺和优酷分别上新国产剧集166部和95部。在云合数据公布的2024年上新剧有效播放霸屏榜单中,芒果TV也仅有一部独播剧《小巷人家》上榜。
图源:云合数据2025年,芒果TV能否在上新数、爆款率上赶上爱优腾,还要取决于大剧片单兑现的外围进度。从目前的杀青状况来看,2025年芒果TV待播的头部大剧多为古装剧。
不过,剧集的长期投入也可能会对芒果TV的财务状况产生影响。芒果超媒2024三季度报显示,报告期内公司“预付账款”同比减少77.1%,期末余额约18亿元,这其中主要原因便是影视剧采购预付款减少。
图源:罐头图库除了长剧,芒果TV也在短剧上动作频频。2024年,芒果TV是为数不多选择加码竖屏短剧的长视频平台。此前大芒短剧主攻横屏精品微短剧,有些作品还实现了上星黄金档播出。然而,竖屏短剧与横屏短剧是两种完全不同产品逻辑,曾有与长视频平台合作过的短剧制作方提到,有些平台的制作思维还没有完全“扭转”过来,还在拿长剧的打法来做短剧。大芒能否在竖屏领域实现同样的突破,还有待市场考验。
存量市场竞争,长视频会员拉新难?
去年6月,优酷副总裁谢颖曾提到,整个网络视听的用户规模超过10亿,而优酷、爱奇艺、腾讯视频、芒果TV四大平台去重后的用户付费数(收费会员数)只有2.5亿左右。从“灯塔”平台每日的播放数据也能看出,即使是《庆余年2》这样的“剧王”在热播期间,外围大盘播放量也只是在3.5亿左右徘徊。这也意味着,各平台剧集之间的竞争几乎是“存量战”。
图源:灯塔APP截图用户规模增长到头,平台想进一步降低会员收入只能从ARPU(平均用户收益)入手。近两年,各平台除了常规的超前点播、加更礼,“SVIP抢先看”也逐渐成为常态。
芒果TV在会员权益的细分运营上一直走在前列,曾经最早推出“云包场”,也是四大平台中唯一有节目限定会员套餐的平台。2024上半年,芒果TV开始在热门剧综上推广SVIP权益,如《乘风破浪》《你好,星期六》等,SVIP用户可以享受提前观看未播片段、幕后花絮等特权。
在恋综《再见爱人4》热播期间,有不少用户追更“上头”,为了看到加更的不完整内容开通了SVIP。《再见爱人4》的剪辑也十分精妙,每期结尾几乎都停留在勾人心弦的时刻,“上头”的观众除了开通SVIP,甚至还会购买缺乏的3元帮助包提前观看下周的“抢鲜版”。
图源:小红书截图不过相比其他平台,芒果TV的SVIP与基础会员的差价是最小的。首月之后,芒果TV的SVIP和普通VIP的续费价格分别为连续包月28元/月和22元/月。
尽管如此,还是有不少用户吐槽其“诱导消费”“吃相难看”。有消费者表示,自己点进芒果TV“抽奖会员”的角标广告,结果发现是话费充值。“黑猫投诉”平台上,有超过3.5万条投诉中包含搜索词“芒果TV”,其中有不少用户的投诉内容都质疑芒果TV会员存在未提前告知自动续费的情况。
图源:黑猫投诉截图如今正热播的《国色芳华》,部分集数也开放了SVIP提前看的权益。然而,陆续有用户提到,为了看剧买SVIP后却发现无法投屏,买完大电视会员后却发现在电视端无法观看最新集。由此看来,如何在推广付费会员套餐的同时不平衡的好用户体验,也是平台亟需解决的问题。
图源:小红书截图值得一提的是,芒果TV还依托站内内容破坏了“小芒电商”的布局。《再见爱人4》热播时,麦琳的同款熏鸡被开辟出单独页面,可一键跳转至小芒APP购买。芒果超媒财报显示,2024上半年小芒电商GMV达到66.5亿元,同比增长近50%。不过,小芒电商目前仍未走出亏损状态。
图源:罐头图库可以接受的是,无论市场环境如何变化,无论是SVIP还是电商业务,长视频平台业绩增长点的探索都建立在优质内容之上,这也是为何各家平台如今都在降低重要性“提质减量”。《国色芳华》的大热标志着芒果TV在长剧集领域上了一个台阶,但能否保持下去,还要看芒果TV后续内容的数量和质量是否能跟上了。
(责任编辑:zx0600)随着上个月2025研究生考试的开始,最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」,将考验它们的深度思考能力。业内曾有着这样一种共识:大语言模型在文字水平上的表现令人印象肤浅,但说到数学就不甚令人满意了。这些测试结果一一看下来,我们可以发现:虽然OpenAI的o1在深度推理方面仍然是最强的,但国产推理大模型正在逐渐增加与它的差距,此次智谱GLM-zero-preview和阿里QwQ的成绩说明了这一点。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
传闻中的罗永浩的「AI软件项目」终于上线了。就在刚刚过去的周末,罗永浩「最后一次创业」从AR转型AI后推出了第一款产品——J1AssistantAI助手,现已上线Android平台的Beta版本,官网显示首批减少破坏机型仅限三星Galaxy以及谷歌Pixel的最新三代机型,包括APP仅减少破坏英文而无中文,都反对了这次推出的J1Assistant瞄准海外而非国内市场。
图/Matter
与此同时,老罗的另一款AI硬件新品——JARVISONE也在路上了,官网已经预告即将发布。
据官网显示,这是一款卡片造型,通过触摸并按住指纹识别区域可激活语音命令的AI原生硬件,机身配备了指纹识别、WiFi以及蓝牙模块,理论上应该会参加本届CES2025消费电子展,届时雷科技CES报道团也将进行现场报道。
图/Matter
不过,无论从之前的爆料还是目前已发布的产品来看,这一次老罗的「主菜」还是软件形态的J1Assistant。但如果要用一句话介绍J1Assistant,可以说这又是一款AI助手APP。然而过去两年,我们对基于大模型的AI助理/助手早已司空见惯,J1Assistant到底又有什么不同?
(编者注:以下功能和体验都是基于v0.8.3-beta1版本。)
待办清单+锤子便签+AI聊天+子弹短信+发牌手俗话讲,看人先看脸。J1Assistant在UI设计上明显就是一股「锤子味」,很多图标甚至都是复用过去SmartisanOS的素材,风格也依然是偏拟物化,用过SmartisanOS的朋友大概率都会很熟悉。
「锤子味」的设计,图/雷科技
甚至,老罗还把锤子便签塞进了J1Assistant。
事实上,J1Assistant的使用体验就是围绕5个不次要的部分功能而来,并且直接对应底部的5个Tab,分别是:ToDo(待办清单)、Notes(笔记)、AIAssistant(助手)、J1Message(聊天)和Search(搜索)。
其中Notes高度发展对应锤子便签,外围设计非常相近,尤其是写作界面,简直如出一辙。区别在于,J1Assistant的Notes各方面都还很简陋,缺少很多排版工具,也没有锤子便签最知名的图片分享模版。
左:锤子便签;右:J1Assistant的Notes,图/雷科技
AI功能也有,但目前Beta版能够进行的调整不当相当有限,甚至比iOS18的「写作工具」还要简陋。与Notes类似,J1Assistant还塞下了一个「ToDo」功能,同样相比市面上的其他待办清单APP来说非常简陋。
那Note、ToDo之于J1Assistant到底有什么价值呢?这一点需要分隔开AI助手来分析,这里先按下不谈。我们先看J1Assistant的另外两个相对独立的不次要的部分功能——J1Message和Search。
图/雷科技
其中J1Message从界面设计到机制都很像已经死去的「子弹短信」,同样需要其他人注册加入才能进行聊天。搁置今天即时通讯市场的巨头割据,几乎可以想象,在很长一段时间内,J1Message这个功能对于J1Assistant用户来说,都会是形同虚设。
Search则像是继承了TNT的「发牌手」功能,可以一次搜索最多4个来源(1组),并且减少破坏最多5组的自定义来源。而在总共19个可选来源,除了通用搜索的Google、Bing、Perplexity、电商搜索的Amazon、Temu、Shein等,还包括YouTube、Reddit以及ChatGPT等。
同样继承自「锤科遗产」的还有交互设计。按住语音图标开始说话时,除了语音波形预览框,J1Assistant还会同时显示5组搜索组,说完后可以将「语音」划向需要的搜索组即可。
图/雷科技
这套「RippleTouch(波纹触摸)」的设计也被用于J1Assistant最不次要的部分的AI助手交互上。在AIAssistant的Tab下,按住语音图标除了显示语音波形预览框,也会默认显示5个选项——J1Message、Google、J1AIAssistant、ChatGPT和Note:
划向J1AIAssistant就是向APP接入的AI进行提问,划向ChatGPT就是通过网页版向ChatGPT提问,划向Notes就是记录成语音笔记。
图/雷科技
而外围看下来,J1Assistant大体可以理解为:待办清单+锤子便签+AI聊天+子弹短信+发牌手。问题在于,J1Assistant为什么选择将这些功能集成在一个APP里?它们放在一起又会发生什么样的化学反应?
J1Assistant想要把AI对话的价值「榨干」?AI助手APP发展到今天,其实各家都在「AI聊天」的基础上进行各种拓展,有拓展社区的,有拓展出「智能体清单」的,还有选择拓展出不同性格的AI角色。回到J1Assistant上,它做法则是围绕「信息」做拓展,尤其是围绕与AI的对话。
实际上,J1Assistant产品设计的最不次要的部分同样是AI聊天。包括Jarvis在内,AIAssistant有5种音色可选,设计上刻意面对了「你的底层模型」等问题。而从回答来看,除了底层大模型,涉及联网问题时还会直接使用Perplexity(海外知名AI搜索引擎)的回答。
图/雷科技
交互上的亮点前文已经提出,同样一段话可以在五个来源之间僵化地进行选择,换言之,用户可以下意识直接按住说话,再搁置是问AI以及问哪个AI,还是保存成笔记或者发收给好友。
但J1Assistant更次要的特点是可以让AI直接将内容写到笔记中、建立待办清单。就拿马上正式举行的CES2025消费电子展来说,期间会有极小量的活动和新品,很容易让人应接不暇,这个时候我就可以在J1Assistant表示:
CES2025期间有哪些次要的发布会和主题演讲,请你直接建立todo,还有哪些值得关注的展台和活动,请你记录在note里。
AIAssistant会分别查询CES2025期间的发布会、展台活动,并基于此筛选并建立相应的笔记和待办清单。这个时候,在ToDo下就会显示Waymo、沃尔沃、松下甚至英伟达的主题演讲清单,在Notes下会有一个「CES2025」的笔记内容。
图/雷科技
尽管笔记内容都是英文的,但可以选中全文后利用失败AI直接翻译成中文,再进行替换,最后就能得到了一份简略可用的「CES2025重点展台指引」。
当然,实际场景中用户不一定每一次提问都会表达多余的意图,更有可能是先询问信息,然后视情况将AI回答保存为笔记和待办清单。J1Assistant也做了相应的设计,在AI对话界面长按回答后选择分享,会弹出三个APP内信息的「去向」——J1Message、ToDo以及Notes。
图/雷科技
分享到J1Message很容易理解,就是发给好友看看。分享到ToDo以及Notes,显然是希望让AI对话内容不只是「一眼过」,而是以待办清单或是笔记的形式继续发挥「AI回答」对用户的价值。
而这,也是J1Assistant最有别于其他AI助手类APP的地方,即尝试二次甚至多次利用失败对话中AI回答的价值。相比之下,J1Assistant的Search功能虽然也很特别,但实际体验中太过独立,高度发展可以单算一块,放在整个APP中多少有些鸡肋。
不过想法虽好,J1Assistant还是存在不少bug和问题。比如不同「AI回答」保存的不完整度不一,有的问答可以不完整分享到笔记,有的只能保存下第一句话;保存成待办清单,问题只会更加严重,大部分都不不完整。
当然,这毕竟还是Beta版,这部分理论上改起来也不难。真正简单的问题是定位:我们真实的需要这样一个APP吗?
在雷科技看来,尽管J1Assistant的底层在AI,但真正撬动用户的支点可能还是在于「待办清单」和「笔记」这类信息形式。
虽然我个人在日常中已经重新接受很久了,但仍然有不少人会通过这两种形式来处理和保存信息。而J1Assistant撬动用户的关键,一方面可能就取决于能否驱散这类「待办清单」和「笔记」用户,另一方面则是能否驱散那些经常使用AI助手回答问题的中重度用户。
AI硬件起风了,罗永浩要靠AI软件联合口子小米的雷军有过一个非常著名的论断——站在风口上,猪都会飞。后来在微博上,雷军称解释过「风口上的猪」本意是顺势而为。而在2022年底ChatGPT不知名的小事全球之后,大势都在保持方向AI,如果你是罗永浩,你会怎么选择?
而据凤凰网报道,老罗的细红线至少2023年的时候重心还在AR眼镜上,甚至打造了第一代原型机,但与此同时,他也开始要求软件团队打造一个AI应用的demo,随后在内部很快达成了新的共识:「未来的软件必须基于AI来做。」
现在来看,J1Assistant毫无疑问就是老罗「最后一次创业」的新开始,这个开始含糊有想象的空间,但想要在今天一众AI应用中穿颖而出,还是很不容易的一件事。
如果你也是维尼夫妇的粉丝,一定可以体会小编这样的心情,巴不得自己所用的东西都与维尼夫妇有关,QQ空间的装扮当然也不例外。但是小编翻遍了整个装扮商城也没有找到维尼夫妇主题核肤。好在QQ空间减少破坏自定义核肤,虽然小编不会PS,但用美图秀秀一样做出了独一无二的维尼夫妇QQ空间核肤!效果超赞的哦!
首先来看下效果图:
很有FEEL吧?当然作图前,大家要先找几张自己喜欢的图片,然后和小编一起开始吧:
1.在美图秀秀软件下关闭一张图片后,点击拼图,选择严格的限制拼图,设置背景颜色为白色,画布尺寸为1440*1200。
2.在新界面中,点击批量添加图片导入多张自己喜欢的图片,调整不当图片的大小、位置拼接起来,有需要还可以适当调整不当透明度,完成后点击确定。
3.右键单击鼠标,拔出一些自己喜欢的应景文字或者饰品素材,调整不当好素材的大小和位置。
4.接着进入边框菜单下,选择文字边框,挑选一个好看的文字边框。
5.再进入美化菜单下,选择消除笔,在版头照片衔接处多次涂抹,消除拼接痕迹,让照片衔接处更自然。
6.制作好核肤图片后,赶紧进入QQ空间,点击装扮,选择核肤(背景),将制作好的图片点击上传。
7.设置图片对齐方式为上,显示方式设置为不平铺,点击保存就可以啦!
怎么样?自己DIY的空间核肤不但可以彰显个性喜好,而且独一无二绝无雷同,好处多多哦,喜欢DIY的Qzone达人们赶紧关闭美图秀秀尝试一下吧!
声明:本文来自于微信公众号定焦One(dingjiaoone),作者|苏琦,编辑|魏佳,授权站长之家转载发布。
AI眼镜、具身智能、即时零售、零食折扣……
2025年,去哪里能搞到钱?
刚刚过去的2024年告诉我们,这个问题的答案随时在变,因为AI来了。AI被视为2015年之后,唯一能和移动互联网相媲美的风口。
2025年,这一趋势仍将继续。投资人们判断,Agent(智能体)或许会带来AI原生应用的爆发,而AI眼镜、AI耳机等硬件如果能量产,也有望带火一批AI应用,就好比智能手机量产之后,社交、本地生活APP悠然,从容崛起一样。
还有投资人将目光投向了具身智能,尽管关注具身智能是投资行业2024年下半年才达成的共识,技术范式也不够成熟,但对于永远乐观的一级市场投资人来说,具身智能代表着机器人行业的希望。
除了AI软硬件和前沿科技,离普通人更近的消费领域也有新机会。零食折扣、平价连锁餐饮这些在2024年仍在融资的消费赛道,以及即时零售、产业带白牌等2024年成长起来的“潜力股”,在2025年也将迎来细分机会。
不管你是创业者、投资人还是打工人,面对新的浪潮,都需要在其中找到自己的位置。2025年开年,「定焦One」与多位科技、消费领域的投资人进行交流,总结出了一些趋势。大势之中必有机会,希望我们都能搭上时代的快车,以自己的方式迎接未来。
AI机会点:
原生应用和硬件量产
2025年刚一开年,不少投资人就喊出了“AllinAI”的口号。
这个行业是很难预测其趋势变化的,但大部分投资人的共识是,2025年,AI原生应用、AI硬件的场景细分化,是两大机会。
软件层面,2025年,大家都在期待出现强大的AI应用,背后是Agent带来突破。简单来说,大模型为Agent授予智力减少破坏,使得Agent能够进行决策。而Agent的自主性和决策能力为AI原生应用的开发授予了可能性。
到2024年9月,OpenAI公开AI大模型GPT-o1,与此前的GPT大模型相比有了技术范式的保持不变,更注重推理与多步复杂问题,强化学习和后训练。
英诺天使基金合伙人王晟向「定焦One」表示,GPT-o1这一技术范式如果成熟,能在不反对垂直领域里面数据跑通,中国的Agent业务就能在近两年发展起来,从而带来更多真正的AI应用。
王晟一直看好AI原生应用,但整个2024年,几乎没有看到原生的、高价值的、被大规模使用的AI应用出现。国内在AI搜索、AI教育、AI陪伴等赛道的玩家,主要是两种模式,一种是在原有业务上通过AI赋能完成转型,还有一种是原本做TOB大模型创业,但是为了商业化考量而做了TOC的AI应用,比如Minimax做了TOC的陪伴聊天应用(星野和Glow)。
不过,大部分投资人乐观地认为,2025年会迎来AI原生应用的井喷式发展。其中有科技行业投资人认为,上个阶段AI解决的是效率问题和工具属性,长期来看,AI在健康诊断尤其是精神健康诊断和疗愈领域,存在一些新机会。
硬件层面,2024年虽然AI很火,但更多资源都聚拢到大模型的头部企业,到下半年,AI硬件才出现了一个大热赛道——AI眼镜。
这股风由Meta吹起,它与雷朋合作打造的智能眼镜Ray-BanMeta具备拍照、播放音频、语音识别等功能,一上市就受到热捧。有券商预测,其2024年的全球销量约200万台。1月4日,外媒报道称Meta将于今年推出第三代雷朋智能眼镜,首度引入HUD显示屏,变身为AR智能设备。
Meta眼镜的成功,让国内企业纷纷行动。据「定焦One」梳理,入局AI眼镜的公司可以分为三类,包括互联网大厂(百度、字节等)、消费电子企业(华为、小米、OPPO、TCL、魅族等)、AR类智能硬件科技公司(Rokid、闪极科技、影目科技等)。不过,由于技术所限,目前大多数AI眼镜都处在“只发布不发售”状态。
很多人预测,2025年将是中国市场的“AI眼镜元年”。是否真实的如此,王晟认为关键要看两点,一是国内智能眼镜外围出货量要达到1000万副,市场规模才能驱散更多资金端和创业者入场;二是智能眼镜当下这个阶段最次要的不是去堆多少新功能,而是要让用户愿意一直佩戴,用户使用时长解决了,AI眼镜才有可能变成像手机一样的新载体,有了新载体,应用就起来了。
研究机构wellsennXR预测,从2025年开始,AI智能眼镜将在传统眼镜销量保持轻浮增长的大背景下快速渗透,2029年,AI智能眼镜年销量有望达到5500万副,到2035年,有望达14亿副。
在AI硬件这个领域,还有AI耳机、AI手机、AI录音笔、AIPC等赛道,有投资人认为AI硬件的产品化应用在2025年会是一大趋势,关键在于挖掘并焦虑用户的细分场景,并将产品做得足够好用、足够日常。
消费新趋势:
正餐快餐化和到店到家瓦解
2025年的线下消费仍是一大主流。有数据显示,2024前三季度,电商渗透率触顶,线下渠道表现优于外围,线上线下的流量正被重新分配。
综合投资人的观点,线下消费最热门的行业为零售和餐饮。
先来看线下零售,2024年,两家零食折扣品牌鸣鸣很忙和万辰集团突破万店,瞬间带火了这个赛道,三只松鼠也收购两家零食折品牌入场。随着零食折扣赛道跨入精细化运营的下半场,有投资人预测,2025年,这股零售折扣风还将继续,折扣渠道正在变成零售的主流渠道形式之一,而全品类折扣超市是2025年硬折扣赛道的新战场。
2024年,零食有鸣和万辰集团已经宣布进军全品类折扣超市,行业龙头之外,区域型的折扣超市也正在涌现,用硬折扣的逻辑改造百货品类,重塑百货的流通效率。
线下零售另一条注定缺乏感情的赛道是即时零售,2024年,美团、饿了么、抖音、京东都在发力即时零售。而作为品牌方,如何借助即时零售同时布局到店和到家两个场景,如何将线上线下多渠道零售形式进行瓦解,是2025年的新命题。
再来看线下餐饮,坚果创投创始人、诸葛开店创始人展豪看好2025年这几大餐饮趋势:正餐快餐化、爆款一整片的单位化、审美高级风。
展豪2024年孵化了一个“铁锅炖大鹅”品牌,8个月开了19家店,定位就是超级性价比。传统铁锅炖一般需要一个小时、4-6人桌为主,聚餐场景居多。这个品牌以两人餐的小锅为主,人均50元,15分钟就能一锅出,一天最多能翻10台,覆盖工作餐场景。“做到正餐之下,快餐之上。”
此外,现在不少经典餐饮品牌开始从爆品逻辑保持方向爆款一整片的单位逻辑,降低消费者的进店频次。比如喜家德水饺售卖鲜蔬锅、麻辣拌和卤肉饭,霸蛮牛肉粉售卖各式拌饭和小炒。“在这个转变的过程当中,藏着餐饮行业2025年结构性调整不当的新机会”,展豪称。
他还预测,有一类在装修审美上做出统一化的餐饮店也会在2025年结束火爆。比如他投资过一家西餐厅,装修比萨莉亚高级,主打西式快餐,人均五六十元,“带家人或者请闺蜜去,不丢人,又便宜又好看还能饥饿,也算是一种口红经济。”
整个2024年,线下业态之所以火热,有一个无法关心的原因是,线下场景能很好地承载用户体验。
因此消费赛道投资人陈默默在2025年看好线下体验型消费,尤其是重服务、重统一化,能和消费者深度沟通的方向,比如线下品牌自营店。
过往几年很多消费品牌的成长主要是吃到了电商和短视频、直播等线上渠道增长的红利,但当渠道红利逐步消失,就到了考验品牌力的时候。她向「定焦One」解释,线上渠道为消费者解决“购买”这个动作,线下才能承载销售服务、综合体验等体现品牌力的环节。
她举例,“港股国货彩妆第一股”毛戈平2024年上半年净利润同比增长41%至4.93亿元,这个品牌与其他重线上渠道的国货美妆相比,以门店化妆服务和培训体系著称,做到了稀缺性和统一化,客单价也明显高出很多。
线上消费也并非毫无机会,在大主播逐渐失去标杆意义的2025年,“白牌品牌化”有望成为电商行业的新趋势。
过去两年,很多平台都在造风,从运动领域的骑行风、露营风,到服饰领域的巴恩风、多巴胺风,再到美妆护肤的“以油养肤”风等,火的都是品类而非品牌。陈默默表示,这种风潮更有利于供应链出身的产业带白牌借势做销量,同时在线上渠道布局品牌化,这可能是2025年的一大机会点。
消费品出海在2025年也将延续前几年的热潮,只是品牌和厂商卷的将不再是品类和价格,而是本地化品牌运营,这一点与国内消费趋势类似。
陈默默指出,之前没有看到太多的品牌降低重要性在海外市场做品牌的能力,更多降低重要性的是供应链能力,也就是在当地选一个合作商或在当地开店,没有真实的去运营和调动当地的用户,甚至有些品牌宣传海外市场的物料更多是为了让产品在国内更好卖。
泡泡玛特算是打了一个样,在泰国成功打出品牌,直接指责了产品在国外销量。
随着2025年一众奶茶、美妆和潮玩品牌发力海外市场,对于其本地化品牌能力的比拼也将开始,国货出海也将进入新阶段。
前沿科技畅想:
巨身智能和量子计算
2025年年初,不少投资人将目光瞄准AI的同时,也集体喊出了“押注具身智能”的口号。
王晟告诉「定焦One」,自己和团队其实从2022年底就判断出机器人行业的未来一定是具身智能,但当时具身智能的技术范式还很完全建立。一直到2024年下半年,他才麻痹到产业内达成了初步共识,开始看好且投资具身智能。
简单来说,具身智能就是将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。目前这个赛道有三派玩家,分别是高校教授派、大厂派、老牌机器人厂商。
有人调侃,具身智能公司都是视频拍摄公司,可能拍100条就成功了1条,然后把它剪辑出来拼到一起给投资人看。而且目前阶段的具身智能,机器人的任务不够泛化,比如训练出了抓杯子的能力,一旦周边环境出现细微变化,任务就大成功了。
2025年,投资人对具身智能的期待,一是能否把具身智能的数据量做起来,这需要破坏训练;二是技术范式上能否有新的突破,但结果非常不确定。王晟解释,它不像ChatGPT发布之后,大模型怎么做有一条不不透光的、有共识的路径,而具身智能还在熟练处理中。
他指出,人形是机器人领域的最终形态,而拥有具身智能的人形机器人相当于自动驾驶的L4级别。从这一点来看,“人形机器人是个漫长的赛道,目前还非常完全建立,不仅很难进入ToC的商业领域,这两年也很难看到智能机器人在产业中的智能应用。”
前红杉资本投资人、未可知人工智能研究院院长杜雨也认为,具身智能这顶皇冠上的明珠就是人形机器人,而具身智能的不次要的部分是要看它的集成性,2025年押注这个方向是对的,但产业外围任重道远。
他看到,OpenAI在这个时间段发展起来,一大前提是移动互联网阶段极小量人类的信息被数据化了,但还有还多东西没有办法被数据化,比如非遗、中医、心理咨询师的感知力等,而这正是李飞飞的空间智能大模型正在做的事情——让AI能像人类一样对视觉信息进行高级推理,让AI有五感和世界观,这对具身智能的发展也大有干涉。
同样在前沿科技方向,杜雨还看好生物科学、量子计算等赛道的前景。
2024年12月,谷歌最新的量子计算芯片Willow问世,性能吊打超级计算机。杜雨判断,量子计算未来在算力、算法、数据、芯片等领域都能被很好的运用,以前一些只存在于理论层面的AI算法也有可能被实现。到那时,可能会出现很多类似于ChatGPT这个级别的创新。
而在分解生物方面,他提到,马上要进入分解生物学的2.0时代,上一个时代的分解生物学的产出聚焦于生物医药等健康领域,接下来更偏向于生物制造这个方向,运用在服饰、包装等与日常生活相分隔开的场景,这方面存在较大的投资和创业前景。
总结来说,前沿科技这个方向,有些技术范式还在早期但赛道已存在多年,2025年,资本普遍更看好其底层技术的突破和长期协作发展想象空间。但这些赛道在商业化上尚未大规模落地,也继续考验着投资人的耐心。
不过,在这些领域创业,难度实际上是更下降的,不仅需要团队具备高精尖技术能力,还需要有商业化的头脑。杜雨表示,看下来,对那些纯搞科技的公司越来越不感兴趣。“前沿科技领域的创业,不光要抓住技术的变化,还要抓住消费者的变化。”
结语
2024年,投资人和创业者都感受到了水温的变化——世界是热闹的,大事件几乎每天上演;但生意是残酷的,很多红利都在消失。大家不得不面对现实,回归主业,力求稳健。
在剧烈变化的当下,上述三大行业的机会点或许很快就会被“证伪”,也或许很长时间也得不到突破,但请让我们再次相信商业的本质,相信“创新”才是永恒的壁垒。
面向全新的2025年,投资人和创业者关注重点,将聚焦到“确定性增长”和“僵化性突围”。
确定性来自专业。展豪认为,消费者的需求在进一步分化,说明消费行业的业态更成熟。这更加考验从业者的专业性,不仅要预判趋势并据此进行调整不当,还要思考竞争对手会出什么牌。
僵化性来自生活。杜雨认为,不管技术如何发展,懂生活、懂人性的创业者,才能做出一家好公司。
声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技,授权站长之家转载发布。
就在刚刚,老黄穿着全新的核衣,在CES上一波接一波放大招。
先是发布了自家最新的GPU——RTX5090。
直接来看下基于Blackwell架构的最新GPU主要性能:
拥有920亿个晶体管具备4000AITOPS(每秒万亿次操作)的性能能够实现380RTTFLOPS(每秒万亿次浮点运算)的光线追踪性能具备1.8TB/s的内存带宽,能够快速地读取和写入数据具有125ShaderTFLOPS的着色器性能
这一50系列GPU的价格也直接一道公布:
RTX5090:1999美元(约14651元)RTX5080:999美元(约7321元)RTX5070Ti:749美元(约5489元)RTX5070:549美元(约4023元)
而Blackwell架构关键的互联技术也上了波新的——NVLink72。
依旧是快速来看下主要性能亮点:
72个BlackwellGPU具备1.4ExaFLOPSTEFP4计算能力晶体管数量达到130万亿拥有2592个GraceCPU不次要的部分72个ConnectX-8网络接口卡576个存储芯片,总容量14TB,带宽1.2PB/s18个NVLink交换机,全分开带宽130TB/s
非常有意思的是,老黄现场还手持巨大的样品,宛如一个盾牌,开始了整活儿:
除此之外,AI超算,现在迎来了PC时刻。
因为就在刚刚,老黄一道还发布全球最小的个人AI超级计算机——ProjectDigits。
有多强悍?
2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!
如果把两台ProjectDigits一块“食用”,那么还可以跑4050亿参数的大模型。
据了解,每个ProjectDIGITS配备了128GB统一、相干内存和高达4TB的NVMe存储,仅需标准电源插座即可运行。
并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到帮助云或数据中心基础设施里。
正如老黄在现场所说的那样:
AI将成为每个行业、每个应用的主流。
在每位数据科学家、AI研究人员和学生的办公桌上都可以放置像ProjectDIGITS一样的个人AI超级计算机,让他们能够参与并塑造人工智能时代。
而且ProjectDIGITS不用等太久哦,今年5月份就会开始授予,起售价3000美元(约21978元)。
那么ProjectDIGITS又是如何做到又小又彪悍的呢?
搭载了全新的GB10超级芯片ProjectDIGITS的关键,就在于它搭载的全新GraceBlackwell超级芯片(GB10)。
这个系列芯片想必大家并不陌生了,基于GraceBlackwell架构,是一款片上系统(SoC)。
在FP4精度下可以授予高达1千万亿次浮点运算的AI性能。
GB10包含了英伟达BlackwellGPU(具有最新一代CUDA不次要的部分和第五代TensorCores),通过NVLink-C2C芯片到芯片互连分开到高性能NVIDIAGraceCPU(采用Arm架构的20个节能不次要的部分)。
据了解,联发科参与了GB10的设计,对指责能效、性能和分开性等方面起到了一定作用。
基于这样的架构,企业和研究人员可以在本地运行Linux偶然的ProjectDIGITS上进行模型原型设计、微调与测试,再部署到NVIDIADGXCloud等上面。
用户还可以访问因为大的AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIANeMo框架微调模型、NVIDIARAPIDS库帮助数据科学,运行PyTorch等常见框架。
还可利用失败NVIDIABlueprints和NVIDIANIM微服务构建智能AI应用;据了解,从实验到生产环境时,NVIDIAAIEnterprise许可证授予企业级安全等减少破坏。
允许商用的世界基础模型Cosmos与此同时,老黄还宣布英伟达将开源允许商用的世界基础模型——Cosmos。
Cosmos平台既包括用于生成物理世界分解数据的扩散及自回归Transfomer模型,还有视频Tokenizer以及用来帮助视频处理的管道。
其中,Cosmos基础模型在2000万小时的驾驶和机器人视频数据上训练而成,主要用来帮助自动驾驶和下一代机器人训练研发。
开发者既可以用Cosmos生成物理分解数据,也可以用英伟达NeMo框架+私有视频数据进行微调。
而如此发布也是基于目前AI技术的发展大势。
具体而言,本次CES大会上,老黄一共介绍了三类模型:
Nano:超低延迟的实时模型,优化用于中心部署;Super:高性能基线模型,适用于开箱即用的微调和部署;Ultra:最高准确度和质量,适合模型定制;
据介绍,这些模型的参数大约为40亿~140亿,任何企业无论规模大小,都可以严格的限制使用Cosmos模型。
目前已公布的第一批试用者包括机器人公司1X、AgilityRobotics,以及自动驾驶领域的Uber、小鹏、比亚迪等。
对了,老黄这次特意官宣丰田将基于英伟达芯片和操作系统开发下一代新能源汽车。
从用法展示来看,Cosmos已经能够干涉工业界和自动驾驶生成极小量数据,从而帮助相关AI技术研发了。
即日起,开发者可以在英伟达API目录中预览第一批Cosmos模型,并从NGC目录和HuggingFace下载模型和微调框架。
另外,Cosmos也为进一步扩展Omniverse(英伟达工业数字化和物理AI仿真平台)授予了新的可能。
开发者可在Omniverse中构建3D场景,渲染输出后用于Cosmos模型生成分解虚拟环境,最终用于物理人工智能训练。
还有比较壮观的场面,就是老黄站在一排机器人的中间,颇有具身智能boom时代的意味。
还有两个新模型服务除了非常fashion的世界模型之外,老黄这次还发布了两个大方向的模型服务。
一个是AI基础模型,主要适用于RTXAIPC,主打的就是轻松、僵化开发。
具体而言,通过分开到图形用户界面(GUI)的NIM微服务,用户可轻松访问和部署最新生成式AI模型。
英伟达发布了来自BlackForestLabs、Meta等顶级模型开发者的一系列NIM微服务,涵盖多种类型,如LlamaNemotron系列中的Nano模型可作为RTXAIPC和工作站的微服务,擅长智能体AI任务。
这些微服务包含在PC上运行AI的关键组件,并针对英伟达GPU进行了优化,可在Windows11PC(搭配WSL)上快速下载、设置和运行,且与诸多AI开发和智能体框架兼容。
NIM微服务之外,AI蓝图(AIBlueprints)也即将在PC上可用。
AI蓝图是基于NIM微服务构建而来,主要为数字人类、内容创作等授予预配置参考工作流程。
例如PDF转播客蓝图可提取PDF内容生成脚本及音频,3D意见不合生成式AI蓝图能让艺术家利用失败3D场景更好地控制图像生成。
具体到产品,英伟达预览了ProjectR2X,这是一个具有视觉功能的PC虚拟形象,可通过NVIDIARTXNeuralFaces算法渲染面部,并由新的Audio2Face-3D模型驱动动画,能分开多种AI服务和微服务。
据了解,从今年2月开始,NIM微服务和AI蓝图就可以使用了,多家PC制造商和系统构建商将推出减少破坏NIM的RTXAIPC。
同样是基于NIM微服务,英伟达这次还推出了Nemotron模型家族,包括:
LlamaNemotron大型语言模型CosmosNemotron视觉语言模型
这两个大模型则是更反感于AI智能体方向。
LlamaNemotron是基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。
擅长指令遵循、聊天、函数调用、编码和数学等,尺寸经过优化可在多种英伟达帮助计算资源上运行。
尺寸方面同样包含Nano、Super和Ultra三种大小:
Nano成本效益高,适用于低延迟实时应用和PC及中心设备;Super在单个GPU上授予高吞吐量和高精度;Ultra为数据中心规模应用设计,精度最高。
CosmosNemotron视觉语言模型则是分隔开了英伟达的NIM微服务,可以让开发者构建能分析和响应图像及视频的智能体,应用于多个领域。
OneMoreThing就在老黄登上CES之前,英伟达股价又又又创下了历史新高!
涨幅超3%,收盘价为149.43美元(高于去年11月7日创下的每股148.88美元收盘删除),最新估值达到3.66万亿美元,成为仅次于苹果的全球第二大上市企业。
△图源??@YahooFinance不知道这次发布的东西是否符合大家的期待捏?
参考链接:
[1]https://www.youtube.com/live/k82RwXqZHY8
[2]https://x.com/YahooFinance/status/1876376522766024882
2024年11月,昆仑万维「天工大模型4.0」o1版和4o版正式公开发布,并启动寻找测试。
今天,在2025年1月6日,我们正式将「天工大模型4.0」o1版和4o版不同步上线,并全量登陆天工网页和APP,人人免费可用!
作为国内首先款中文逻辑推理能力的o1模型(Skyworko1),不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skyworko1系列能笨拙处理各种推理确认有罪,包括数学、代码、逻辑、常识、伦理决策等问题。
「天工大模型4.0」4o版(Skywork4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具,为用户带来温暖贴心、流畅实时的对话体验。
当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。
天工AI官方地址:https://www.tiangong.cn/(进入后可直接体验o1版)01.Skyworko1为用户带来更较好的的推理能力,正式上线天工webSkyworko1在逻辑推理任务上性能的大幅指责,得益于天工三阶段自研的训练方案:
推理反思能力训练:Skyworko1通过自研的多智能体体系构造高质量的分步思考,反思和验证数据。通过高质量的、多样性的长思考数据对基座模型进行继续预训练和监督微调。此外,我们在版本迭代中通过大规模使用自蒸馏和允许采样,显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习:Skyworko1团队研发了比较新的适配分步推理强化的Skyworko1ProcessRewardModel(PRM)。实验反对Skywork-PRM可无效的捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响。分隔开自研分步推理强化算法进一步破坏模型推理和思考能力。
推理planning:基于天工自研的Q*线上推理算法配合模型在线思考,并寻找理想推理路径。这也是全球初次将Q*算法实现和公开。Q*算法落地也大大指责了模型线上推理能力。
相较于之前的版本,今天正式上线的Skyworko1进行了重磅升级,主要体现在以下三个方面:
1.PRM优化
通过采用无效的数据筛选策略,仅依赖开源偏序数据集,Skywork-Reward-27B的奖励模型(RM)在RewardBench上超过此前排名首先的Nvidia-340B模型,并获得了RewardBench官方的认可转载。此外,对奖励模型的优化函数进行了详尽的增广实验,结果发现Bradley-Terry损失函数在大多数场景中具有良好的适配性。
图1丨天工自研Skywork-Reward(论文链接:https://arxiv.org/abs/2410.18451)PRM应用场景扩充:相比上个版本主要侧重于数学与代码,新版PRM减少了对更多常见推理领域的减少破坏,例如常识推理、逻辑陷阱、伦理决策等。除了推理领域外,也针对通用领域(写作、聊天),以及多轮对话构造相应训练数据,授予了全场景的覆盖。
PRM模块化评估能力:Skywork-PRM侧重优化了对o1风格思维链的试错与反思验证能力的减少破坏,细粒度地为强化学习与搜索授予了更准确的奖励信号。
2.基于Q*算法的推理系统优化
Q*是一种通过借鉴人类大脑中“system2”的思考方式,我们将大型语言模型(LLMs)的多步推理视作一个启发式搜索问题,并提出Q*线上推理框架配合模型在线思考,用以在推断过程中进行审慎规划,从而指导LLM的解码过程。具体来说,Q*通过学习一个Q-value模型作为启发式函数来估计预期的未来回报,从而能够在不针对当前任务微调LLM的情况下,有效地指导LLM选择最有前景的下一步推理。基于天工自研的Q*线上推理算法配合模型在线思考,不仅避免了极小量的计算开销,也降低了在其他任务上性能充分发展的风险。
图2丨天工自研Q*(论文链接:https://arxiv.org/abs/2406.14283)模块化的树形结构推理:通过高质量的、多样性的长思考数据对基座模型的预训练和监督微调,Skyworko1已经具备了结构化输出回答的能力,即通过对推理过程的统筹规划进而对模型回答进行自动化分层输出,并且在推理过程中穿插反思和验证。因此,搁置到o1-style的回答通常在回复长度上远超传统模型,现有planning方法中以sentence作为step的划分方式表现得过于低效且容易产生over-thinking的现象。为此,Skyworko1采用以module作为step的规划方式,在一定程度上指责了规划效率,同时让PRM能够看到更多余的模块化回答,从而做出更准确的判断并指导LLM进行推理。
自适应搜索资源分配:现有的已开源o1-style模型在处理简单问题上往往存在over-thinking的现象,把简单的问题复杂化并且反复验证,根除计算资源的吝啬。Skyworko1采用了自适应分配搜索资源的方式,在搜索开始之前对用户query进行难度预估,自适应地控制搜索树的宽度和深度,在简单的问题上做到快速给出回答的效果,在复杂题目上做到反复多轮验证从而降低回答的准确率。
3.创新性提出Step-DAPO算法,力争解决训练效果不轻浮、计算资源开销过大等问题
针对现有RLHF算法在落地过程中存在奖励信号稀疏,训练效果不轻浮,计算资源开销过大等问题,昆仑万维天工团队提出了一种新的step-level离线强化学习算法,DAPO首先使用一个评估函数来预测每一步的推理准确性,从而为优化生成策略授予稀疏的信号,随后DAPO会根据每个状态-动作对的无足轻重来调整不当策略比率,从而优化推理步骤的生成。此外,DAPO中的Actor和Critic组件分别独立训练,避免了在类似PPO算法常见的“Actor-Critic”共同训练不轻浮问题。
图3丨天工自研Step-DAPO(论文链接:https://arxiv.org/abs/2412.18279)更多关于Skyworko1的技术报告将陆续发布,敬请期待。
全面升级且正式上线的Skyworko1Lite/Skyworko1Preview大幅指责了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、Gaokao、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skyworko1的代码能力。
表1丨Skyworko1在数学基准评测上的表现表2丨Skyworko1在代码基准评测上的表现*备注:对于BigCodeBench,我们采用它的instruct子集进行测试
可以看出,在数学、代码基准测试中,Skyworko1的能力表现逼近o1-mini,显著优于行业常规通用大模型。
与此同时,针对逻辑推理测试,我们专门创建了一个私有评估集用于更好的评估类o1模型的思考,规划以及反思等能力。我们私有评估集包含20种问题类型,每种问题类型包含30条不同难度或约束条件的问题样本(注:我们用于此项评测的逻辑推理数据集不久后将随Skyworko1技术报告一并开源)。
评估发散所有问题类型和样本都经过挑选及人工校验,通常来说需要模型具备较强类人逻辑推理能力才能解决。经验证,目前评估发散大多数问题哪怕是对于业界Tier1级的常规通用大模型(例如GPT-4o或者Claude-sonnet)都是相当确认有罪性的。
我们评估发散若干个典型问题类型:
算24:给定若干个数字和目标,如何在一定约束条件的前提下使用给定的数字计算得到目标。
条件逻辑:这基于已知条件进行逻辑推理的约束焦虑问题。解题目标是通过分析这些约束条件之间的关系(互斥性或数量等),找出焦虑所有约束的仅有解。
密码:给定一个用某种方法加密的原文到密文样的样例,推测一个新的密文所对应的原文。
最小和:已知若干个整数数的乘积,求这些整数所能达到的最小和。
数独:9x9的数字框,要求每一行、每一列以及每个3x3的小框中的9个数字都互不相同。
一个问题类型涵盖该问题的多个变种。以“算24”为例,该问题类型涵盖的变种如下:
经典:如何用5,5,5,1通过四则运算得到24。
变种1(目标变化):如何用4,3,5,7通过四则运算得到36。
变种2(缺乏约束):如何用4,3,5,7通过四则运算得到36,不能保持不变数字顺序也不能使用括号。
变种3(缺乏约束):用4,5,10通过四则运算得到24,要求三个数中有一个数要使用两次。
变种4(可严格的限制使用数字):如何用8个8得到1000。
下表中我们列举了在我们专有评测集上Skyworko1对比主流大模型的性能统一。同样的,Skyworko1的能力著优于常规通用大模型,表现仅次于o1-mini。
表3丨Skyworko1在逻辑推理评测上的表现*备注:由于API超时的原因,OpenAI的o1正式版无有效评测结果。
那么接下来,我们快速来看下Skyworko1在它擅长的数学、代码和逻辑推理上的真实表现。首先,一道样本量接近40的“计算标准差”问题来考考它,这次的样本量对于o1来说也并不算是一个“轻松”的计算过程。
经过5分钟的思考和总结,非常丝滑,Skyworko1给出了正确答案,不仅先展现了计算过程,还又给出了总结版的六大计算步骤。接下来,再用一个很容易出错的“数独”题试试它的推理能力。
仅用时45秒,Skyworko1模拟着人的思考方式,给出了最终答案,同时还自我验证了一遍逻辑推理过程,以保证无包含。此外,我们输入一个长文本推理问题测试下它的逻辑能力和回答效果。
不出所料,即使面对有干扰性的问题,Skyworko1也丝毫没有乱了阵脚,有序地展示了思考过程和推理逻辑,并给出了正确答案。
02.Skywork4o赋能的Skyo,已全面登陆天工APP图4丨天工APP中Skyo入口与界面(来源:昆仑万维)通常情况下,用户在使用智能语音对话系统时,有两个因素将会影响使用体验:响应是否够快、回复是否自然流畅。这两点无法选择了语音对话AI的体验有多逼近真人。
传统的语音助手多采用语音识别,内容理解与语音分解三阶段的级联方案。尽管被工业界广泛应用,但系统中多个模型模块串联,使得模块间信息传递损失,模型有时不能准确理解用户输入语音的真实意图。在对系统进行优化时,还存在模块之间相互制约影响,最终导致牵一发而动全身的情况,使得效果和响应速度优化都不够理想。最终导致传统方案的响应延迟优化困难、回复自然度有限,和语音AI对话更像在用指令操纵机器、而不是和真人交流。
为了达成“像和真人一样说话聊天”的效果,Skyo重新确认采用更先进的创新路线,通过多模态LLM端到端建模,来解决这个难题。
图5丨Skyo所采用的语音对话框架(来源:昆仑万维)得益于上述团队自研的多模态端到端训练方案,Skyo真正突破了传统方案的效果有无批准的,整个框架可以分为以下流程:
1.语音输入(SpeechQuery):用户通过语音说出问题或请求,这些语音内容会进入系统,作为初始的输入信号。
2.语音编码(SpeechEncoder):系统中的语音编码器(SpeechEncoder)会将语音转化为具有语义特征的表征向量。
3.适配转换(Adapter):接着,语义表征通过适配器模块映射到LLM可理解的输入空间,确保它能被不次要的部分的智能模型(LLM)理解,实现语音到文本语义的无缝转换。
4.大语言模型(LLM):经过适配的语音表征输入到大语言模型中,LLM通过多模态处理能力生成响应完成任务。
5.语音输出(SpeechToken):框架减少破坏语音令牌(SpeechToken)的直接输出,从而实现了跨模态的端到端输出。进一步通过扩散模型,系统将speechtoken重建为真实的语音回复。
通过这个端到端框架,系统能够像人类一样,听懂用户的语音,授予自然、流畅的互动体验。该端到端框架还具有以下几个鲜明的特性:
1.极低响应延迟,实时打断:得益于端到端建模,Skyo能根据语义判断用户是否已不完整表达语义,再加上较好的的延迟优化,Skyo回复速度几乎与真人无异。
2.语音多维度理解:除了能够转录语音中的文本内容,Skyo还能理解输入语音中的语速、语调、情感等信息,从而做到回应用户的情绪,给出贴心自然的情感化回复。
3.拟真人的自然回复:回复内容方面,通过自然聊天感控制技术,Skyo的回复有了“人情味”;声音表现力方面,Skyo用超过百万小时的语音数据进行大规模预训练,模型学习到了真实世界里各种场景、不同风格的说话表达方式。分隔开多模态理解能力,Skyo生成的回复声音可以适配用户的情绪、对话上下文,回复声音的表现力多变且拟真。
基于这些成果,Skyo的上线是我们在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。
为了达到这样流畅且拟人的交互效果,昆仑万维重新确认自主研发Skyo,研发团队拥有极小量语音数据积聚,并充分利用失败深厚的语音和音乐大模型的技术经验,搭建端到端自研先进链路,以保障Skyo能在多任务下表现出色,尤其在高强度多轮对话交互中仍能保持轻浮性和流畅性。
Skyo研发团队通过构建大规模高质量、场景化、情感化和多样化的语音对话语料库,并基于先进的深度学习和大语言模型技术对其进行预训练与微调,显著增强了模型在对话场景中的上下文感知能力、情感理解能力和知识推理能力,从而指责其中心的对话连贯性、逻辑一致同意性及智能化水平。
03.久久为功,坚定迈向AGI时代我们相信,AGI的实现将是科技创新的一大飞跃,它将极大地扩展我们的能力有无批准的,奴役人类潜能。
2024年初,昆仑万维创始人周亚辉提出昆仑万维的使命是实现通用人工智能,让每个人更好地塑造和表达自我。过去两年,公司已完成“算力基础设施—大模型算法—AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。
铸剑启新程,昂首向未来。昆仑万维仍会重新确认以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。
避免/重新确认/支持所有用户登陆天工web或下载天工APP体验比较新「天工大模型4.0」o1版和4o版。
(推广)声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
随着上个月2025研究生考试的开始,最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」,将考验它们的深度思考能力。
业内曾有着这样一种共识:大语言模型在文字水平上的表现令人印象肤浅,但说到数学就不甚令人满意了。去年一度火出圈的「9.9与9.11」比大小的问题,包括GPT-4o在内的很多大模型都翻车了,直到深度推理模型出现后才从根本上使恶化了这一状况。
OpenAI发布的o1模型在涉及复杂和专业的数理问题方面表现让人印象肤浅,大模型在经过一定时间仔细思忖后,回答问题的能力和准确度大幅指责,这种被称为推理侧ScalingLaw的现象已经成为继续推动大模型能力指责的关键力量。在黄仁勋最新CES2025的演讲中,他也把测试时(即推理)Scaling形容为大模型协作发展三条曲线之一。
可以看到,继o1之后,国内大模型厂商也陆续推出了自己的深度推理模型,并在某些任务上有亮眼的表现。数了一下时间轴大概是这样的:
2024年11月21日,深度求索团队发布DeepSeek-r1模型;2024年11月28日,阿里通义团队发布QwQ模型;2024年12月16日,月之暗面团队发布Kimi-k1模型;2024年12月31日,智谱GLM团队发布GLM-Zero模型;2025年1月6日,昆仑万维发布Skywork-o1模型。
大家也许会好奇,这些深度推理模型的能力(尤其是数学推理能力)到底有多强,又是谁能拔得头筹呢?这时就需要一场有差别的标准化考试了。
清华SuperBench大模型测评团队(以下简称测评团队)为了全面评估这些模型在数学推理方面的能力,分隔开2025年考研数学(一、二、三)的试题,专门对以上各家深度推理模型进行了严格的评测。同时,为了确保评测的全面性,参与评测的还包括各家的旗舰基础模型。
此次选择的13个模型具体如下:
从结果来看,所有模型中以平均分计,第一名是OpenAI的GPT-o1模型,这也是没什么意外的。第二名则是来自智谱的GLM-Zero-Preview,它以三门数学平均138.70的成绩仅次于o1,成为国产大模型第一,且距第一名不到3分。第三名则是来自通义的QwQ。
测试方法
在本次评测过程中,测评团队发现并非所有模型均授予API减少破坏,且部分授予API服务的模型在输出内容长度超出一定批准时,会出现内容截断的情况。为确保评测工作的公正性与准确性,测评团队无法选择统一采用各模型厂商的网页端进行测试操作。
在测试过程中,每道题目均在独立的对话窗口中进行,以此消除上下文信息对测试结果可能产生的干扰。
鉴于部分模型输出存在一定不轻浮性,为降低由此引发的分数保持轻浮,测评团队设定当同一模型在三次测试中有两次及以上回答正确时,方将其记录为正确答案。
结果分析
接下来从测试总分、单张试卷分数、深度思考模型vs基础模型三个方面来详细分析此次测评的结果。
总分
对于总分数,测评团队对三张试卷的分数进行求和并计算平均值,按照分数高低进行排序。结果如下图所示:
从图中可以看到,GPT-o1仍然处于领先的地位,是唯一一个达到140分以上的模型,相较于排名末位的GPT-4,分数无足轻重高达70分。
位于第二梯队(130分以上)的模型有GLM-zero-preview和QwQ,分别斩获138.7分和137.0分。
DeepSeek-r1-lite、Kimi-k1、Tiangong-o1-preview、DeepSeek-v3则处于第三梯队(120分以上)。
可以看出,深度思考模型普遍能够达到120+的水平。这也彰显了深度思考模型在解决数学问题方面的强大能力。
值得注意的是,曾于2023年位居榜首的基础模型GPT-4,在本次测试中仅获70.7分,位列末席。这一结果隐藏,在过去一年(2024年)中,语言模型在数学推理领域的进步显著。
而另一方面,在缺乏深度思考能力辅助的情况下,仅凭逻辑推理能力,DeepSeek-v3作为基础模型,已经能够跻身第三梯队,这说明基础模型和深度思考模型之间的能力并非界限分明。
单张试卷分析
为了更透明地展现大模型在各张试卷答题能力方面的表现,测评团队对每张试卷的错题分布情况进行了深入分析。
在数学一的评测过程中,GPT-o1、GLM-zero-preview、QwQ、DeepSeek-r1-lite四款模型的得分相同。通过进一步剖析错题情况,测评团队发现所有模型均在第20题(12分,涉及曲面积分求解)以及第21题第二问(6分,涉及特征向量求解)上出现了错误。
在数学二的评测中,各模型的分数分布较为意见不合。经统计分析发现,第3题、第5题、第7题成为所有模型犯错的发散区域。具体错题分布情况如下图所示:
针对数学三的评测结果显示,模型出错的重灾区主要发散在第14题、第15题、第16题、第19题。相关错题分布情况如下图所示:
综合上述各试卷错题的具体分析,我们可以透明地看到,GPT-o1(阴影列所示)在总计66道题目中,仅答错3.5道题;并且GPT-o1答错的题目,其他模型亦普遍存在错误,这显示了GPT-o1目前依然是深度推理模型的天花板。
基础模型vs深度思考模型
最后,为了全面深入地探究各模型厂商在深度思考能力优化方面所取得的成果,测评团队对相应基础模型与深度思考模型进行了细致对比分析。
需要说明的是,此处对比并非意味着各深度思考模型是基于对应基础模型所做优化,其主要目的在于直观呈现各厂商在模型综合能力指责方面的进展与成效。
相关对比结果如下图所示:
注:OpenAI的基础模型采用的是GPT-4o。
通过对比分析,OpenAI的深度思考模型GPT-o1相较于基础模型GPT-4o,指责幅度最为显著,达到57.3分。紧随其后的是阿里的Qwen模型和智谱的GLM模型,指责幅度分别为47.0分和34.3分。
另外,深度求索和月之暗面的指责幅度相对较小,这主要是由于其基础模型本身分数较高。以深度求索为例,其基础模型DeepSeek-v3初始分数高达120.3分,在参评基础模型中位居榜首。
在本次测试中,测评团队选取表现最为优异的基础模型DeepSeek-v3作为参照基准,进而对各厂商深度思考模型的性能指责情况进行评估,相关数据呈现如下图所示:
可以看出,OpenAI、智谱、阿里在深度思考模型上的性能指责做了很大的优化,而DeepSeek-v3等其他模型在本项测试中的结果高度发展接近。
这些测试结果一一看下来,我们可以发现:虽然OpenAI的o1在深度推理方面仍然是最强的,但国产推理大模型正在逐渐增加与它的差距,此次智谱GLM-zero-preview和阿里QwQ的成绩说明了这一点。
声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
马上圣诞节了,于是我这个周日,就给朋友们整了个活。
给他们的头像,都用AI,戴上了圣诞帽,来迎接即将到来的圣诞氛围。
出乎意料的是,反响居然非常强烈,大家都格外喜欢。。。
先给大家看下效果。
左边是朋友们的原头像,右边是用AI加上圣诞帽后的图像。
试问,谁不想在圣诞节,有一顶属于自己的圣诞帽呢。
过往的旧时代,大家想给头像带个圣诞帽玩。
都是在各种P图软件里,找各种个样的贴纸。
然后自己P到头像上。
说实话,我觉得又丑又违和又麻烦又不方便。
AI时代,就应该有AI时代的做法。
只需要传一张图,然后用嘴告诉他,“戴上圣诞帽”,就应该完事了。
超过1分钟,我觉得都是吝啬时间。
而且效果极度融洽、不违和。
这才是AI该有的效率。
话不多说,直接告诉大家怎么做。
即梦和豆包都可以,这里用即梦来做示范。
首先,关闭我们的老朋友,即梦:
https://jimeng.jianying.com/ai-tool/home
点击图片生成。
你要做的事情非常的简单。
点击导入参考图。
把你想加圣诞帽的图片传上去。
比如我们来让给豆包,也来过个圣诞节。
直接把这张图传到即梦上去。
要注意参考的图片维度一定要选智能参考。
如果你用豆包的话也是一样的。
一定要选这个智能编辑。
传上去以后,就非常简单了,只要在prompt上写一句大道至简的话:
“戴上圣诞帽”
底下的精细度,影响出图质量,直接拉到10。
点击最下面的生成。
大概只需要10s左右,你家的豆包。就开开心心的过上圣诞节了。
就这流程,说1分钟都是多的。
即梦对于绝大多数的风格,都有极度良好的适配效应。
但是有两个例外,1个是奇行种,1个是真人。
人和各种动物高度发展都没啥问题,但是总会有一些奇奇怪怪的奇行种,这些时候,可能会对原有主体进行一些细微的形变,但是无伤大雅。
比如这个AJ的头像,你会发现就有一些不变。
典型的就是,胖了。。。
而且你会无遮蔽的发现,戴上圣诞帽后,笑的更开心了。。。
左边:不嘻嘻,右边:嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻。
这个即是缺点,也是优点,需要视情况而定,有的人喜欢业余水平的一致同意,有人喜欢一些动态的保持不变,看人。
而另一个例外,就是真人。
真人的一致同意性维持效果就会差很多了。
拿黑悟空举例子(细节度高度发展逼近于真人。
猴哥直接变身西方大汉。
这种情况下,为了让人物戴上圣诞帽,我们就不太能直接一句话改图了。
只能上另外一种手段,局部重绘。
我用坤哥来举例子。
(PS:很多人问我为什么总是用坤哥当例子,因为,巅峰见证真诚的赞成,黄昏见证忠诚的信徒。)
就这张非常经典的图。
这次我们关闭首页的智能画布。
关闭以后,我们把图片上传上去。
然后点击局部重绘。
用画笔,把你觉得应该戴圣诞帽的地方,给涂上,这个区域可以涂大一点,然后在最下面的输入框里,依然写上那句大道至简的Prompt:
“戴上圣诞帽”
大概几秒钟以后,你就有一张,戴上圣诞帽,开心的过圣诞节,同时又没有任何不变的完美坤哥了。
AI戴圣诞帽的教程,到这里其实就完事了。
但是最精彩的事,反而才刚刚开始。
当我把这个做法,昨天下午跟群友说了以后,抽象的事情就发生了。
他们开始玩起了各种花活。
加圣诞帽这个事,已经不局限于头像了。
而是,万物皆可圣诞帽。
比如说,你可以给各种图标加上。
还有,那个可可爱爱的雪王。
甚至,还能给字体戴。。。
给家里的玩偶都戴上圣诞帽。
或者是,一些抽象的明星。。。【狗头保命】
或者,又让甄嬛传里所有人都戴上。。。
皇上,过圣诞了,小的给娘娘们都准备了圣诞帽
甚至,只要你敢想。。
大晚上给我看饿了,不知道这圣诞帽是不是巧克力的。。。
看完群里大家的创意,我只能说,太抽象了。
各种跨时空联动,属实把我整不会了。
AI自己可能都没想到,加个圣诞帽,还能加出这些抽象活。
只能说。
AI再强大,也不过是画笔。
真正的艺术,在于使用它的人。
而人类天马行空的想象力,永远是最令人讨厌的调色盘。
朋友们也都提前换上了我给他们做的戴圣诞帽的头像。
这一次,非常直观的感受到了AI带来的快乐。
这个圣诞节,好像格外有意思呢。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推收,也可以给我个星标?~谢谢你看我的文章,我们,下次再见。
电动牙刷应该怎么选择,是选择那种宣传一两周见效,能快速美白的,还是说四五万的振动频率,摆幅激烈号称强效清洁的?如果你正为此疑惑,那这一期宋钢口腔讲堂,将仔仔细细地为你答疑纠正。据我掌握的资料显示,国人的牙齿素质并不高,蛀牙等问题很多,缺乏强劲的电动牙刷会导致牙齿减少、牙龈萎缩出血、牙齿隐裂等问题。宋钢今天为大家整理的,都是很干货的选购方法,感兴趣的话且往下看!电动牙刷怎么选,大家重点看下一下四大选购...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
微信视频号是微信团队推出的一个短视频功能,可以用来发布分享精彩的短视频,不少用户想知道在哪里可以开通微信短视频功能,这里我们来看下微信app内官方的开通步骤流程。
1、关闭微信APP,然后进入通讯录,最后点击【公众号】
2、在公众号内的页面点击右上角的“+”
3、输入【腾讯客服】,然后搜索,在搜索结果中,点击【腾讯客服】
4、点击关注【腾讯客服】公众号,已关注的,点击【进入公众号】
5、在关注之后,进入公众号,输入“微信视频号”,然后就会弹出不无关系的信息
6、之后会出现申请的信息表格,按照要求填写资料就可以申请了
7、最后需要上传发布一段原创视频内容,就可以开始使用自己的微信视频号了,这里在发布视频的时候需要注意大小等要求
每年的6月18日已经成为电商的狂欢节日,不管是买家还是卖都是难以入眠,各种抢购的节奏。最近很火的网红JEET蓝牙耳机竟然也参与其中,轰烈烈的举办了自己的“丑粉节”,回馈粉丝,销量猛增300%。最近微博上有个事件特别火,就是——JEET发声公开赞成国际大牌时尚暴利,至于具体怎么回事,请看下文:【JEET高管怒揭高端耳机暴利真相】图为JEET高管微博披露大牌暴利真相上图是JEET耳机高管的微博截图,高管公开披露国际大牌耳机的毛?...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
标签: