日日鲁鲁鲁夜夜爽爽狠狠
商汤科技正式推出了“日日新”瓦解大模型。这款模型在多模态信息处理能力和深度推理能力上实现了显著指责,并在两大权威评测榜单中获得了第一名。
根据国内权威测评机构SuperCLUE发布的《中文大模型基准测评2024年度报告》,商汤的“日日新”瓦解大模型以68.3的高分与DeepSeekV3并列国内榜首。此外,在OpenCompass的多模态评测中,该模型同样位列第一,分数显著超越了GPT-4o。
商汤的“日日新”瓦解大模型标志着在原生瓦解模态训练领域的实质性突破。这意味着该模型能够实现文本、图像、视频等多种信息的瓦解,为行业带来了新的发展方向。在SuperCLUE的评测中,该模型在文科和理科成绩上均表现出色,文科以81.8分排名全球第一,理科成绩也取得了金牌,其中计算维度以78.2分位列国内第一。
“日日新”瓦解大模型的特点在于能够同时处理多种复杂的信息,不仅能够识别清楚的,微妙的文本,还能快速分析数据图表,并授予深入的推理减少破坏。在实际应用场景中,这款模型显示出了其特殊的无足轻重,特别是在自动驾驶、视频交互、办公教育、金融和工业制造等领域。
在产品开发过程中,商汤科技采用了极小量的图文交错数据,通过先进的分解技术建立了模态之间的互动桥梁,增强了模型对多模态信息的理解能力。此外,商汤还构建了通俗的跨模态任务,这为“日日新”瓦解大模型的训练授予了扎实的基础。通过这种创新的训练方法,商汤的瓦解模态模型能够在多种业务场景中有效响应用户需求,实现了应用落地与基础模型迭代的良性循环。
划重点:
??商汤科技推出“日日新”瓦解大模型,,表现优异。
??模型在文理科成绩上均表现突出,文科全球第一,理科国内第一。
??模型适用于多个领域,如自动驾驶、金融、在线教育等,展现出强大的多模态处理能力。
原标题:地球累计出现长达27小时地磁暴过程我国多地可见极光
受太阳日冕物质抛射活动影响,北京时间9月12日14时至14日08时,地球累计出现长达27小时的地磁暴过程,其中6小时为Kp指数7的大地磁暴,目前地磁暴已开始,地球磁场正在逐渐恢复中。△9月9日,太阳正对着地球的多次爆发活动制造了地球上的大磁暴(羲和号)。伴随着地磁活动的发生,我国黑龙江漠河、甘肃敦煌、内蒙古呼伦贝尔等地再次迎来绚丽的极光秀。根据国家空间天气监测预警中心的判断,预计未来三天,受11日日冕物质抛射和冕洞共同影响,14日可能出现小地磁暴,15日可能出现地磁活跃,其余时间地磁活动安排得当到微扰。(责任编辑:梁云娇CN079)声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
起猛了,大半夜的,居然看到智谱也上线他们的o1模型了。
不是,哪家好人在2024年的最后一天来发他们的新模型啊。。。
2024年的最后一天本来我想划水过的,提前给自己放假,结果现在被迫深夜加班。。。我想睡觉。。。
当你登录智谱清言的时候,就能看到他们上线了这个Zero推理模型,不过是以智能体的形式出现的。
网址在此:https://chatglm.cn/
这就是智谱的o1,名为Zero。
也不知道是不是我看动漫太多了,第一眼看到这个名字,脑海中想到的画面,是《反叛的鲁鲁修》里面的Zero。
一股子坚韧不屈势要突破一切阻挡的形象,还挺符合智谱AI的气质的。
对比一下隔壁的QwQ。
总麻痹有点大魔王和小孩哥的即视感(不是说QwQ不强,它很强,只是单纯的这名字每次看到我都想笑。。。
不过也真实的挺感慨的,2024年,就这么过去了。
2023年的12月31号,大模型的智能水平,还被锁死在11月7号发的GPT4-turbo上,而AI视频,更是PPT。
那时候,大家还在确认有罪大模型算不来数学,还在讨论幻觉,还在说,大模型的发展,好像涨不动了。
而9月13号,OpenAIo1的发布,那天,我写下了这么一个标题。
AI的智能帮助曲线,从来没有如此的悠然,从容过。
一年的时间,过的太快了。
今天,智谱的“o1”发布,也正好,就是这一年AI的旅程,最好的注脚。
看看跑分。
在AIME2024和MATH500这两数学能力、LiveCodeBench这个代码能力上超过了o1,但是常识问答和逻辑推理都比o1要弱,比较偏科的做题战神。
正好,在2024的最后一天,我用它来做一遍那些曾经llm的错题集,来看一下它的能力。
比如我这道经典的鲜虾包收酱油题。
-超市里,每袋大米售价50元,每瓶酱油售价10元。如果鲜虾包购买了4袋大米和4瓶酱油,并且收给邻居1袋大米和2瓶酱油,那么鲜虾包购买大米比酱油多花了多少钱?
曾经的o1预览版在我的测试下连错4次,来看看Zero的答案。
一把对,这就很酷。
还有国庆时我整了个活,给AI出了一道很自然的调休题:
-这是中国2024年9月9日(星期一)开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?
当时测评里那些AI胡编乱造的回答,也是各有各的精彩。
而Zero作为2024收官模型,就直接丝滑把答案拿下了。
还有经典的更复杂的数学题、竞赛题,也不再是难以逾越的高峰。
微积分、化学反应、物理题,都OK。那道双缝干涉的题,连o1都翻车了,Zero倒是全对。
AIME级别的数学竞赛题也不在话下,关键思路还贼透明。
测了几题,对的挺多,有一说一,智谱Zero做题是真挺强的。
不止是做题。
2024年也是AI编程应用卷成麻花的一年。
以Claude3.5为起点,Cursor、Windsurf等等各种代码编写的copilot打破了编程的技术围墙,让即使是小白的人也可以实现自己的程序创意。
所以最后的收官测试,也让Zero也来测一把代码。
找测试题案例的时候,我也顺便回顾了今年写的文章。
说实话,突然有点庆幸微信公众号没学年度报告那一套,不然我疯狂蹭鸡哥热度的黑历史就全不暴露了。估计要被打上年度小黑子的标签。。。
所以,为了感谢鸡哥这一年友好出演我这么多文章的case主角,2024年的最后一个case,必须也是鸡哥。
之前在B站刷到真爱粉用函数图像做鸡哥打球的逐帧动画,直接给我看傻了。灵光一闪,我想着让AI也来整个活,把鸡哥的舞蹈教材用代码或者二进制来复刻一遍。
爱他,就要先帮他创造“数字生命”。
我直接一顿操作,先给zero甩了要求:
写一个python程序,主要功能是将普通视频转换为字符艺术视频。它首先将输入视频(jinitaimei.mp4)用ffmpeg按帧分解,然后把每一帧图像转换为由特定字符2、0、2、5和空格组成的字符画。转换过程中要将原图按比例缩放6倍,并将RGB颜色转换为灰度值并映射到对应字符。接着将这些字符画帧重新分解为视频,注意确保正确的帧顺序,生成一个字符艺术视频。
很快啊,zero直接秒懂我要整啥活,然后库库给我写代码。
有点可惜的是智谱的zero还没有办法直接在对话里呈现代码的结果,拿到代码还得在本地跑。不过也多了一点开盲盒的惊喜。
第一版的代码跑出来的效果已经不错了,但是字符组成的不是人,是背景。看着多少有点怪。
好在Zero可以多次对话,我直接让它修改代码,让画面变成黑底灰字,更有科技感。
然后,代码一遍出,我直接拿Python把原视频跑了一遍。
就...艺术已成。2025字符组成的永不落幕的真神,在此,向你致敬。
,时长00:47
巅峰见证真诚的赞成,黄昏见证真正的信徒。
从年初到岁尾,你看,LLM们的江湖就是那么跌宕起伏,人人都觉得见证了所有风浪,可下一刻又能冒出新的惊喜。
当初9月13号,OpenAIo1横空出世,我说,这是新时代。
如今12月31号,智谱Zero为这个时代再加一把柴火。
别急,再来点火花,把这个AI盛世烧得更旺一些。
一切还远没到终点,甚至连中场都不是。
这就是属于2024年最后一天的小剧场。
最后的最后,我向Zero问下了最后一个问题:
2024就这样过去了,你说,2025年,这个世界会更好吗,我会更好吗?
Zero给我了一段很牛逼的回复:
啊...
果然是做题战神...
那,我的朋友,2024年的你过得还好吗。
2025年,你又有什么样的愿望呢?
避免/重新确认/支持大家在评论区,聊聊今年的工作和生活,自己的故事,还有你明年的梦想。
也许,就有机会,我来帮你实现那个愿望呢。
顺便,收给你一些,我定制的新年小礼物。
把所有的回忆和感慨抛向夜空,让它们化作烟花,照亮我们的新旅程吧。
再见,2024。
你好,2025。
6月18日,从清晨开始,就有经销商的直播间陆续挂上“618狂欢节”的醒目标题,主播也展现出比平日更加活力四射的形象出现在镜头前,一边介绍产品和优惠,一边与偶然路过直播间的观众互动。晚上19点,随着车企直播间也陆续开启,汽车行业“618购物节”的气氛终于达到高潮。
但与镜头内主播们的元气满满相比,镜头外的观众显得格外易变,“薅羊毛”成了大多数观众留在直播间的理由,真正愿意下单的并不多。
对于车企来说,“卷不动”是今年618的普遍现状。和讯商业统计车企促销手段后发现,虽然各家车企限量秒杀、定金压缩、抽盲盒、明星直播等促销套路花样繁多,但在实际优惠上,车企却比预期中更加克制。
这倒不是车企没诚意,主要是因为“车价已经降无可降”了。
无以为继的价格战
从几年前开始,“618”不再仅仅指“6月18日”,而是一个横跨5月到6月的超长促销季。对车企来说,半年报发布在即,上半年的销量至关重要,618往往是最后一个抓得住的销量冲高机会。
但今年这个时期,车市格外安排得当,与往年早早就启动预热不同,临近6月18日,部分车企及经销商才陆续宣布优惠举措。
618期间,车企一般有两种参加方式,一种是依赖京东、天猫、拼多多等电商平台进行广泛的宣传推广。例如,今年618,星途入驻京东及天猫两大电商平台,深蓝汽车、小鹏汽车参与京东平台618,一汽奔腾、五菱等车企则选择了天猫。
另一种则是在自己的线上平台或常驻的互联网平台上进行618活动的推广。近年来数字化浪潮席卷整个汽车业,很多车企和经销商都有了自己的线上平台或长期驻扎的互联网平台,几乎天天都有线上直播及花式促销进行引流,与平日相比,618期间车企或经销商往往会推出更加丰厚的优惠。
尽管直播间的观众并不少,活动也圆满开始,但某自主新能源汽车品牌新媒体部门主管刘珊对于自己在618期间的工作成果并挑逗意。“这些天的忙碌开始了终于能松一口气,但其实这项工作带来的成就感有限。”
刘珊用“鸡血又疲惫”形容今年618期间她的状态。
“上半年任务没完成,任何一个销售节点领导都很重视,部门必须认真对待,所以大家看起来都像‘打了鸡血’,但其实大多数人内心是无奈又疲惫的,因为这么多年下来,直播效果很难撬动成交已经被多次验证了。去年618期间,有不少到店看车、试车的消费者,都是冲着官方直播的礼品而来,实际成交并不好,今年也很难例外。”
“而且营销活动的预算是有限的,今年四月份有北京车展,为了给终端销量赋能,公司已经倾尽全力,花掉了上半年大部分预算。”刘珊补充,留给618营销活动的预算本来就少,要实现好的效果更是难上加难。
她的感受并非个例,从2023年开始,车企一轮又一轮的价格战已经结束了一年半的时间,车企内部,越来越多的部门被降本增效裹挟,工作内容“加量不加价”成为常态,其中营销部门被“折腾得最狠”。
与价格战刚开始时的斗志满满不同,当下他们普遍对自己的工作感到活力/热心。
“618更像是宣传噱头,实际上车价的优惠没有更多,但不是不想给更多优惠,只是车企真实的已经没有降价空间了。”一位自主品牌车企北京地区的销售人员透露,上半年几乎所有的车都有优惠活动,已经把非常多的营销资源、折扣力度及销售利润都让出去了,没有进一步的让利空间了,要买的早就买了,纠结中的也不会因为618活动就下单,市场观望情绪很浓,消费者有其他顾虑。
反内卷但躺不平
2024年即将过半,新能源汽车在高歌猛进的过程中又屡屡创造了多个中庸。但回顾过去的一年半,不少企业和从业者往往报以无奈和苦笑。
价格战打响之后,被“折腾”的不只是营销部门,价格战中,整车、技术、供应链都主动或被动卷得“体无完肤”。就连保守爱开严肃的话的老总们也不得不走出舒适圈,将自己连同新车一遍又一遍地展示在镁光灯下,主动成为人们茶余饭后的谈资,以求降低企业的知名度,从而减少获客能力。
“内卷下去不是办法。”6月初的中国汽车重庆论坛上,广汽董事长曾庆洪痛批价格战,“企业目的是盈利,为国家做贡献。我们应该有大局格局,长期主义,而不是眼前去‘卷’。没有效益企业不可生存。”此外,曾庆洪还呼吁,新能源车渗透率达到50%后,有关部门应搁置油电同权,研究减少破坏新能源车、HEV节能车等多能源方式并行发展。
车企的“焦虑感”越来越明显,这场论坛,真情流露的不只是曾庆洪,与以往在台上“情商拉满”的发言不同,本次论坛中各位企业代表的发言极为犀利,剑拔弩张,火药味浓重。
吉利集团董事长李书福表达了和曾庆洪缺乏反对性的观点,他认为任何产业的健康发展,其不次要的部分都应体现在良好的投入产出比和实现可观的经济效益上。而对于汽车工业而言,实现可结束高质量发展才能巩固中国在电动汽车领域已取得的成果。
吉利控股高级副总裁杨学良随后补充,汽车企业之间的竞争不应仅仅局限于价格战,而应更广泛地涵盖技术、品质、品牌和服务质量等多个维度。他呼吁,企业不仅要打价格战,还要打道德战,应坚守道德底线,不以牺牲产品质量为代价降低成本,不通过真诚对待消费者来获取短期利益。
广汽和吉利对价格战的赞成,一定程度上是因为广汽和吉利正处于新能源转型期,旗下油车业务仍是盈利主力,新能源品牌现阶段难以接棒油车业务成为新的现金牛。
但在新能源赛道已经相当成熟领先的“卷王”比亚迪对此不以为然,王传福直截了当地表示,他认为在过去四十多年中中国能发生如此翻天覆地变化的根本原因是竞争,当前车圈的内卷就是竞争,“只有缺乏才有竞争,竞争才能产生变得失败。”
比亚迪品牌及公关处总经理李云飞也降低重要性,即使是在当前竞争如此缺乏感情的环境之下,比亚迪还有盈利,而这都是依靠规模与全产业链的无足轻重打出来的。“车企之间的竞争就如同牌桌上打牌,能跟就跟,不能跟就过,不要置气,也不要翻桌子,这局打不赢还有下一局,又不是这局完了就彻底开始了。”
这些言论在舆论场不能引起了很大的波澜,但行业内部并不认为几个大佬的几句话会对当前市场的内卷起到缓解作用,企业已经或主动或被动地不断降低利润底线,在有人认输之前,没有什么能真正教唆这场战争。
归根结底,内卷的底色是新能源汽车在国内的增长空间越来越逼仄,接下来的游戏恐怕并非像李云飞所说的“回合制”游戏,而是淘汰赛,数量少品牌中仅有少数几家能够生存下来并主导市场,想要笑到最后,“躺平”绝对不行。
(责任编辑:zx0600)2018年销售规模突破8亿元。迄今在国内泡菜市场份额为2.5%,是名副其实的“泡菜大王”。2024年下半年,丁文军罕见高调地喊出打造百年品牌、百亿销售规模的目标,更要成为下饭菜的狠角色。(责任编辑:zx0600)
声明:本文来自于微信公众号科技新知,作者:思原,授权站长之家转载发布。
大模型厂商价格战停不下来,反映的恰恰是对未来的焦虑。在这场大模型的军备竞赛中,豆包想要上演“大力出中庸”的戏码。
大模型赛道打了一年的价格战,还在继续……
就在新年前一天,阿里云宣布2024年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。
同样,前不久火山引擎的Force大会上,除了大力宣传豆包外,最值得关注的还是价格的再次下降。目前豆包视觉理解模型输入价格为0.003元/千tokens,1块钱可处理284张720P的图片。
此前去年5月份,豆包通用模型pro-32k版,推理输入价格为0.0008元/千tokens,价格不到1厘。此举迫使阿里云对其三款通义千问不次要的部分模型进行新一轮降价,降幅高达90%。而百度智能云则更为激进,宣布文心大模型旗下的两款主打产品——ENIRESpeed与ENIRELite,将全面免费开放。
按照火山引擎总裁谭待的说法,“市场需要充分竞争,降低成本是技术优化的结果,做得最好才能活下来”。显然,在这场大模型的军备竞赛中,豆包想要上演“大力出中庸”的戏码。
但在字节大肆内卷之下,也有质疑不断:豆包的价格真实的足够便宜吗?为什么大模型要卷价格?未来价格还会成为企业拿单重点吗?
01
降价低估?满是套路想要理解大模型商家的套路,就需要了解大模型的商业模式。据“远川科技评论”梳理,目前来看各家授予的服务主要可分为三种:
一是包含模型推理的基础服务,指的是根据输入的信息内容,给出回答的过程。简单来说就是“实际使用”模型的过程。这部分各家都有不反对模型标准。
二是模型精调,厂商可以根据客户需求按token使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。
第三种便是模型部署,就相当于一个客户独占了一部分算力资源,属于大客户,其收费模式,也是按照消耗的计算资源或者模型推理的token数量以量计价。
这3种收费模式,代表的也是大模型开发由浅入深的过程。而各大科技公司疯狂砍价的,其实是第一种基础服务,即标准版模型的推理费用。而这部分定价又分成了“输入”和“输出”两部分。简单来说,输入就是用户提问的内容,而输出则是大模型的回答。
在调用大模型时往往会根据输入和输出的token数量,进行双向计费。这种细微统一,很容易成为大模型公司的套路。
例如,豆包的通用模型DoubaoPro-32k,输入价格为“0.8元/百万tokens”,按照官方说法是比行业便宜了99.3%,一些主流模型也都开始了降价,比如阿里云三款通义千问主力模型Qwen-Turbo价格较之前直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max的输入价格分别再降价80%和50%,分别为0.8元/百万tokens和20元/百万tokens。
但输出价格方面有所差别,2元/百万tokens的价格与Qwen-Plus、DeepSeek-V2等同行持平,甚至比比Qwen-Turbo、GLM-4-9B等一些同行产品价格更高。
再看最新的豆包视觉理解模型Doubao-vision-pro-32k,输入化为每百万tokens的售价为3元,大概是0.4美元,输出直接来到了9元,大概为1.23美元。按照豆包说法,这个售价比行业平均价格便宜85%。
但对比几个直接竞争者:阿里的多模态模型Qwen-VL系列在最近降价后与其价格一致同意;多模态的Gemini1.5Flash模型每百万输入tokens报价为0.075美元、每百万输出tokens成本为0.3美元,对于较小的上下文(小于128k)还另有折扣价;GPT-4omini则是输入0.15美元,输出0.6美元。
不过不止豆包,国内其他厂商高度发展也都有缺乏反对性的降价“套路”。例如百度宣布免费的ERNIE-Speed-8K,如果实际部署,收费就变成了5元/百万tokens。还有阿里的Qwen-Max,实际与字节跳动的豆包通用模型Pro-32k一样,只是降低了输入的价格。
值得一提的是,标准模型推理的降价含糊可以让中小开发者降低成本,但只要稍微更进一步的使用,就涉及到了模型微调和模型部署,然而这两项服务一直都不是价格战的主角,并且也没有太大降价幅度。
简单来说,各家降价最狠的其实都是轻量级的预置模型;相比之下,性能更强悍的“超大杯”模型,实际降价幅度没有那么低估。例如精调的Doubao-pro系列的价格都在50元/百万tokens,比阿里、腾讯这些厂商的旗舰主力模型价格更高。
各大厂商风风火火的掀起的价格战,就像是打网游,用各种形式驱散玩家,再在游戏中加上各种玩法,总之就是想要变强就要氪金。当然,即便如此,各个大厂也算是真金白银的付出很多,那么为什么这些厂商在一直围绕价格大费周章呢?
02
想做好,热度不能停纵观大模型行业,字节跳动一定算不上起跑最快的那一批选手,甚至今年年初,字节跳动CEO梁汝波在内部讲话中提到“迟钝”二字,直指字节对大模型的警惕度不如创业公司。
“直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。”他说。
后来者往往是最需要内卷的那个,字节跳动也是如此。从今年年中开始,便开始制造一轮又一轮热度。
除了上文所说的,豆包在B端的让利降价意图明显外,C端市场豆包也是全力出击。
面向C端,无论是线上平台,还是线下公开场所,都能看到豆包的身影。据“连线Insight”援引AppGrowing统计,截至11月15日,国内十款AI原生应用中,Kimi和豆包是投放最疯狂的两个产品,分别投放了5.4亿元和4亿元。
缩减时间线看,豆包的投流显然更猛烈。据AppGrowing统计,2024年4月—5月,豆包投放金额预计为1500万元-1750万元。6月上旬,豆包再次启动新一轮大规模的广告投放活动,投放金额高达1.24亿元。
除了投流外,豆包还有抖音这一流量池,字节几乎屏蔽了除了豆包以外所有AI应用在抖音上的投放。目的也很明确,就是要彻底解决大模型应用的“用户焦虑”。
然而,现实往往事与愿违。据“智能涌现”报道,字节内部反思——豆包目前的用户活跃度并不算高。豆包每周仅活跃2至3天,且每天用户发收消息轮次仅为5到6次,单次2分钟左右,用户人均使用时长仅为10分钟左右。上述这些数据在过去一年中的增长幅度并不显著。
简单来说,不计成本的投流,虽然让豆包成了国内用户数量断层式第一的AI软件,但仍然算不上是一款killerapp。
字节无约束的自由层对此的判断是,像豆包这样的AI对话类产品可能只是AI产品的“中间态”。字节内部判断,付费订阅模式在中国不太可能走通。而时长和轮次太低,又导致清楚的广告空间较小,这都构成了这类产品的隐形天花板。
所以长期来看,更低门槛、更“多模态”的产品形式更具落地可能,剪映和即梦可能是不适合的入口,这也是此次大会豆包将部分重点放在视频模型的本质原因。
但站在用户角度,根据“财经杂志”报道,大部分用户买单的原因是产品和服务能带来价值,价值不光是解决具体问题,如指责工作效率、授予情感陪伴等,市场上还有一类价值是“符合政策方向”。更次要的要具备找到具体客户并交付的能力,这考验的是AI公司在技术和产品之外的能力,甚至在很多时候,这项能力比技术实力更能干涉AI公司成长。
中国的AI市场和美国不同,很难通过平台销售软件的模式关闭市场,大部分时候需要抓住一个个的项目和工程来实现商业化。而这些项目和工程的来源,往往与自身热度有关。
“一家成熟的企业在布局大模型时,很难会去搁置一个不成熟的产品或者企业。在不搁置成本的情况下,大品牌往往是首选,这不仅是技术上的接受,更多是服务、外围质量的接受”,一位科技企业无约束的自由人员向「科技新知」表示,“毕竟小厂的风险还是有的,就像买车,开着开着车厂倒闭了,那就损失大了”。
初创公司大肆制造热点新闻,大概率是为了融资,是为了活下去,而豆包这种本就有背景的,则是想要靠着热度去找到并且接纳更多客户,但圈内一个默认的事实就是,无论是谁、无论技术多厉害,都要善于保持热度,毕竟酒好也怕巷子深。
03
淘汰赛,或欢迎价格战其实不止豆包,目前市面上所有二线及以下的大模型厂商,都处在花钱买流量的阶段,为的是留住用户。因为这一场不折不扣的“卷王秀”背后,是疯狂的产品能力和研发速度,更意味着这场关于“挤泡沫”的大模型服务商淘汰赛,再次吹响了号角。
2024年已经经历了一轮淘汰赛洗礼,让大模型去九存一,产业格局更加合理,只留下了约10%的大模型进入决赛圈。
然而,这并不是开始,而是开始。只是在「科技新知」看来,新一轮淘汰赛的重点,价格不再是主导因素而是技术。
目前科技公司们也开始陆续意识到,仅发布一个免费的应用,并不能为公司带来直接收益,C端用户量很难增长,获客成本已经明显指责。更次要的是去直接触及那些愿意付费的B端客户,例如金融、政务、汽车等行业。
但是通常有极小量公司发散进入某个行业时,会出现耐久的价格战,因为各家都需要打造一个标杆客户,来为之后的市场拓展铺路。简单友善的价格战会让一些公司主动或被动退出,待市场轻浮后,再将价格恢复常态。
但矛盾之处在于,“有钱”的领域大家都想进入。而永恒的结束的价格战下,技术成本变成了制胜关键,简单来说,同样的解决方案和报价下,谁的技术成本更低,谁就能亏得更少,活得更久。
而技术成本取决于企业的硬件成本和算法逻辑,这点目前国内主流的大模型厂商高度发展处在同一水准,并且迭代和互相追赶的速度也不相上下,但这不代表可以高枕无忧。
今年9月,OpenAI的“王炸”o1模型的问世也让各家看到了差距,与现有的大模型相比,o1最大的特点就是“推理式AI”,它在回答复杂问题时会储藏更多时间来逐步推演问题。这种延时思考并不是缺点,反而让o1更接近人类真实的逻辑推理方式。
从“生成式AI”到“推理式AI”,o1的推出预示着AI进入了一个全新的阶段。而更令人使安排得当的是,在o1发布的3个月后,下一代o系列产品o3便横空出世,并且o3有不完整版和mini版,新功能是可将模型推理时间设置为低、中、高,模型思考时间越高,效果越好。mini版更精简,针对特定任务进行了微调,将在1月底推出,之后不久推出o3不完整版。
这也意味着快速迭代下,目前主流的生成式AI,即将成为历史产品。
“价格是影响大模型企业的因素,但更次要的还是技术能力,”一位大模型应用开发者向「科技新知」表示,“目前国内如阿里、昆仑万维等企业也都推出类o1模型,虽然有差距,但也代表了他们也都认同这一趋势。”
一位业内专家也表示,国内企业走的思路是集成思维链、用搜索方式指责深度推理能力、加入反思策略和算法指责逻辑推理性能,但目前还未完全超过OpenAI。
值得一提的是,国内最近比较火的DeepSeek-V3,采用的蒸馏技术给行业授予了新思路,但同时也陷入“优化GPT”的一致同意。
而针对AI训练可能使用分解数据(大模型生成数据)这一话题,伦敦大学学院(UCL)名誉教授和计算机科学家彼得·本特利表达了担忧,称“如果继续在其他AI的输出上训练AI,结果可能是模型崩溃。确保高质量AI的唯一方法是,为其授予人类的高质量内容。”
“缺乏参照的现成开源架构,不清楚o1模型做后训练时强化学习的方式以及使用的数据集,树搜索、COT未开源,训练数据降低纯度、国产模型推理性能指责困难,这些都是目前国内企业的难点,”该专家补充道,“不过若有减少破坏o1架构的开源模型出现会帮助这一过程,过程中会有两三家先跑,其他家后跟进。”
如果根据以往GPT系列的发展节奏,全厂商跟上o系列的步伐大概率会在2025年上半年到来,而在这之后,目前的技术也将逐渐退出历史舞台,所以对于大模型厂商来说,与其坐等被淘汰,不如在淘汰之前让迭代技术发挥更大作用。
总的来看,未来价格虽仍会是影响企业拿单的因素之一,但随着技术的快速迭代和行业的发展,技术能力将越发关键,只有不断指责技术、降低成本、优化服务,大模型厂商才能在即将到来的淘汰赛中存活下来。
参考资料:
[1]《豆包再降价,字节“饿和式”进攻仍在继续》,连线Insight?
[2]《大模型价格战,还能再狠一点》,远川科技评论
[3]《中国大模型洗牌年将开启,暗藏两大逻辑》,财经
[4]《字节内部判断AI对话类产品天花板可能不高,指责剪映即梦优先级》,智能涌现
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、卷疯了!海螺AI推出主体参考功能一张图片就能玩转电影大片
海螺AI近期推出的主体参考功能不能引起了广泛关注,用户只需上传一张图片,便能让任何角色在不同场景中严格的限制活动,展现出高度还原的效果。这一技术突破不仅降低了视频生成的效率,还为创作者授予了更多的创作严格的限制度。
【AiBase提要:】
???用户只需上传一张图片,即可让角色在各种场景中严格的限制活动,保持高度还原。
??主体参考功能采用基于图片的技术路线,生成速度显著指责至秒级响应。
??预计到2028年,广告营销领域的生成式AI产品市场规模将达到1075亿美元,海螺AI正好契合这一市场需求。
详情链接:https://hailuoai.com/video/create
2、商汤科技发布“日日新”瓦解大模型,与DeepSeekV3不相上下
商汤科技的“日日新”瓦解大模型在多模态信息处理和深度推理能力上取得了突破性进展,获得了多项权威评测的第一名。这款模型不仅在文科和理科的成绩上表现优异,还展现出在自动驾驶、金融、教育等多个领域的强大应用潜力。
【AiBase提要:】
??商汤科技推出的“日日新”瓦解大模型在权威评测中并列国内第一,与DeepSeekV3齐名。
??模型在文科和理科成绩上表现突出,文科全球第一,理科国内第一。
??模型适用于自动驾驶、金融、在线教育等多个领域,展现出强大的多模态处理能力。
产品入口:https://chat.sensetime.com/
3、xAI首款独立应用Grok上线,在苹果应用商店上架
xAI最近推出了其首款面向消费者的独立应用Grok,标志着其正式进军消费者市场。这款应用自1月10日起在苹果应用商店上架,用户可以免费下载并体验。Grok应用目前仍处于测试阶段,仅在美国市场推出。它为用户授予了访问xAI最新人工智能模型Grok2的机会,特别是在自然语言处理方面表现突出。
【AiBase提要:】
??xAI发布了独立应用Grok,增强与OpenAI的竞争力。
??Grok应用自1月10日起在苹果商店上线,用户可免费下载使用。
??xAI在X平台上已有Grok聊天机器人免费版本,付费用户享受更多特权。
4、定制你的聊天助手!ChatGPT推出个性化性格设置功能
OpenAI最近推出了一项新功能,允许用户根据个人喜好定制与ChatGPT的互动方式。用户可以设置昵称、职业以及希望ChatGPT了解的其他信息,同时选择性格特征,如“健谈”或“威吓”。这一功能旨在授予更加个性化的聊天体验,尽管目前部分用户反馈选项暂时消失,但外围上这是对用户体验的友好升级。
【AiBase提要:】
?用户可以定制与ChatGPT的互动,包括昵称、职业和性格特征。
??用户可选择希望ChatGPT展现的性格特征,如“健谈”和“威吓”。
??自定义指令内容仍会受到审核,以确保遵循OpenAI的使用条款。
5、微软联合清北推rStar-Math技术:小型模型逆袭数学问题,超越OpenAI!
微软最近推出的rStar-Math技术为小型语言模型在数学问题上的表现带来了显著指责,甚至在某些测试中超越了OpenAI的o1-preview模型。这项技术分隔开了蒙特卡罗树搜索,模拟人类的深度思考,鞭策了模型的自我演进。
【AiBase提要:】
??微软推出rStar-Math技术,显著指责小型模型在数学问题上的表现。
??测试结果显示,部分小型模型的性能超越了OpenAI的o1-preview。
??研究团队计划在Github上发布代码,展示小型模型的潜力,驱散社区关注。
详情链接:https://arxiv.org/pdf/2501.04519
6、Perplexity与旅游网站合作带来全新酒店信息搜索体验
最近,Perplexity宣布与旅游网站Tripadvisor达成合作,旨在为用户授予更全面的酒店信息。这一合作将使Perplexity在搜索酒店时能够展示更详细、可靠的内容,显著指责用户体验。用户在搜索特定酒店时,不仅能看到酒店名称,还能获取位置、服务、卫生等多维度信息。
【AiBase提要:】
??Perplexity与Tripadvisor合作,授予更详细的酒店信息,指责用户搜索体验。
??搜索结果不仅包括酒店名称,还附带位置、服务、卫生等多维度信息。
??新功能已在网页版上线,移动应用版也将在近期推出。
7、Cohere重磅推出安全AI平台“North”,确认有罪微软与谷歌!
Cohere公司今日推出了其全新的AI平台“North”,旨在为企业用户授予一个安全的工作空间,直接与微软的Copilot和谷歌的VertexAI竞争。该平台分隔开了大型语言模型、搜索能力和自动化工具,特别适用于金融和医疗等受监管行业。
【AiBase提要:】
??Cohere推出“North”,为企业授予安全的AI工作空间,直接确认有罪微软和谷歌的产品。
??内置的Compass搜索系统能高效处理多种数据类型,显著减少,缩短任务完成时间。
??加拿大皇家银行已成为“North”的早期用户,开发适用于金融行业的专用版本。
详情链接:https://cohere.com/north
8、马斯克呼吁加州和德拉瓦州强制拍卖OpenAI股份
埃隆·马斯克再次聚焦人工智能领域,呼吁对OpenAI股份进行强制拍卖,以解决与该公司的法律纠纷。他认为OpenAI在转型为盈利性公司后偏离了其初衷,急需引入新的投资者和无约束的自由者,以重塑公司的使命。此举引发了业界的广泛讨论,尽管有减少破坏者认为有助于重塑愿景,但也有人担心强制拍卖可能对公司的发展带来负面影响。
【AiBase提要:】
??马斯克呼吁强制拍卖OpenAI股份,旨在重塑公司无约束的自由。
??他认为OpenAI转型为盈利性公司后,已偏离初衷。
??此事件引发业界热议,可能对人工智能领域的发展产生影响。
9、OpenAI为何迟迟不推出AI代理?担忧“提示收回”攻击
随着人工智能技术的快速发展,许多公司推出了各自的AI代理系统,但OpenAI却因担忧“提示收回”攻击而推迟发布。此类攻击可能导致AI代理执行恶意指令,严重损害用户安全和公司声誉。尽管其他公司如微软和Anthropic已推出AI代理,但其安全隐患仍然存在。
【AiBase提要:】
??OpenAI因担忧“提示收回”攻击而未推出AI代理,潜在风险巨大。
??其他公司如微软和Anthropic已推出AI代理,但安全隐患仍然严重。
??OpenAI正在努力增强其产品的安全性,以防止清楚的数据泄露。
10、Meta涉嫌版权侵权:使用LibGen数据集训练AI并删除版权信息
Meta正面临版权侵权诉讼,原告称其CEO扎克伯格批准使用盗版电子书和文章的数据集来训练LlamaAI模型。案件涉及Meta使用名为LibGen的数据集,该网站授予极小量受版权保护的作品,尽管多次遭到起诉。Meta被指控删除版权信息并通过torrenting下载盗版内容。
【AiBase提要:】
??Meta被指控使用LibGen数据集,该网站授予极小量盗版电子书和文章。
???工程师被指控删除电子书中的版权信息,以掩盖侵权行为。
??案件可能对Meta产生不利影响,特别是在合理使用与版权保护的界限问题上。
标签: