伦理片1313苦瓜网

伦理片1313苦瓜网时间：2025年05月01日

12月24日，2025中国信通院深度观察报告会科技伦理与合规发展分论坛在北京举办。本次分论坛主题为“伦理先行，合规致远”，聚焦互联网广告合规治理、移动终端应用生态治理、短视频平台责任限度等前沿话题进行分享与探讨。倍孜网络作为行业领军企业参与深度观察报告会，用实践经验赋能行业治理措施，共同推进行业绿色、健康、智能、高效发展。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅授予资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或包含，概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时，可及时向站长之家提出书面权利拒给信息或不实情况说明，并提权属反对及详细侵权或不实情况反对（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。

【新智元导读】谷歌CEO劈柴在年度战略会议上放出狠话，2025年将是AI领域生死存亡之年。一场足以保持不变AI未来走向的巅峰对决，即将在2025年全面打响。

2025年还未开始，硅谷的战鼓已经擂响。

在这场AI巨头之间的角力中，谷歌CEO劈柴放出了一记重磅炸弹。

在谷歌山景城总部举行的年度战略会议上，身着节日毛衣的劈柴语气凝重地对员工们说道——

2025年将是关键的一年!

我们必须认识到当下时刻的紧迫性，公司需要以更快的速度前进。这是一个颠覆性时刻，赌注从未如此之高。

这番话背后，是谷歌与微软OpenAI之间愈演愈烈的较量。

自ChatGPT横空出世以来，这家搜索引擎巨头一直在努力追赶。过去两年，谷歌的努力几乎总被爱抢风头的OpenAI盖了过去。

直到12月，Gemini2.0Flash、Veo2、「谷歌版o1」Gemini2.0FlashThinking等轮番轰炸，一展超越领先模型的潜力。仅用了90天的时间，谷歌终于逆风翻盘。

这意味着，这场AI竞赛终于迎来了转折点。

会议现场，劈柴展示了一张大模型的对比图，Gemini1.5傲然领先于OpenAI等其他竞争对手的模型。

当被问及ChatGPT正成为AI的代名词时，劈柴坦言道，「在历史场长河中，你不必总是第一个，但必须出类拔萃，必须在同类产品中保持第一梯队。这就是2025年的意义所在」。

谷歌开发者关系负责人LoganKilpatrick多次明白地提及，明年谷歌真实的要发力了。

——预计1月份的目标，不完整版Gemini2.0正式上线。

甚至，在谷歌DeepMindCEOHassabis年度总结下面，他称这些都只是开胃菜，好戏将在2025年开始。

有网友预测道，明年谷歌将会把很多强大模型免费推向所有人，而且还会发布直击o3的竞争模型。

为了在这场AI革命中占据制高点，谷歌正全力以赴。

Gemini，下一个5亿级用户爆款应用

对谷歌而言，可能更糟糕的是竞争对手OpenAI在搜索业务的确认有罪。

虽然谷歌仍主导搜索市场，但GenAI为人们授予了各种访问在线信息的新方式。

而OpenAI正在被更多人看作是AI的代名词，如同国外把谷歌看作搜索的代名词一样。

谷歌背负着巨大的压力，正通过重金投资Gemini，来巩固期在AI领域的领先无足轻重。

Gemini应用程序允许用户访问许多工具，包括谷歌的聊天机器人。

劈柴表示，「建立大型新业务」是重中之重。

谷歌目前拥有15个用户超过五亿的应用，而高管们普遍认为Gemini应用将是下一个。

劈柴认为Gemini应用具有「强劲势头」，但也不得不允许承认「在2025年还有一些工作要做，以增加差距并建立领导地位」。

劈柴后来补充道:「明年最大的重点是在消费者方面扩展Gemini。」

此外，谷歌在美国还被法律缠身，包括其在垄断搜索的法律裁定，以及非法主导在线广告技术的指控。

英国监管机构则暂时认定谷歌的广告技术行为影响了该国的竞争力。

对此，劈柴表示:「这是我们的规模和成功所带来的。这是科技正在大规模影响社会的大趋势的一部分。因此，此时此刻，我们要比以往任何时刻都要确保自己不会分心。」

谷歌，「后来者」居上?

OpenRouterAI的数据显示，谷歌旗下的Gemini在开发者中的市场份额从9月份的约5%，直接飙升至50%市场份额，遥遥领先，连带股价也上涨了14%。

而此时，距离OpenAI发布ChatGPT的2022年11月30日，已经整整过去了2年。

早在2017年，SamAltman在一次邮件交流中就明确表示，谷歌DeepMind是在AGI竞争中最强大的对手，但令他没想到的是，曾经公认的「AI巨头」谷歌却是个「花架子」。

ChatGPT发布以来，几乎成了「AI的代名词」，不仅悠然，从容解放了市场，还连带着微软起飞，在Edge浏览器中嵌入CopilotAI搜索助手，直接断崖式领先。

被寄予厚望的谷歌，反倒是昏招频出，先是Bard难产，又经历AIOverview总结能力大翻车，建议孕妇吸烟、自杀跳桥等等。

在AI顺风车下，股价不涨反降，谷歌一时间沦为笑柄，被OpenAI打的毫无还手之力，更准确的说，连同台竞技的资格都没有。

让人易懂的是，谷歌和DeepMind拥有世界上最好的硬件、最多的训练数据、最顶尖的人才，也发过很多具有划时代意义的论文，如AlphaFold、GenCast等，但为什么就连Anthropic这样的创业公司都打不过?

网友分析的细节原因不胜枚举，一句话来说，就是「船大难掉头」。

从安全性上搁置，谷歌作为世界级独一档的科技巨头，不论发布什么产品，其用户群体都不会小，会涉及到各个种族、不反对意识形态，一点小问题就会被无限放大，而文本生成又是非常主观的，很容易受到训练材料的偏见影响，所以谷歌需要更长的时间进行合规检查。

23年初，谷歌受舆论裹挟，急急忙忙发布Bard，在发布会上关于问题「关于詹姆斯·韦伯太空望远镜，我可以告诉我9岁的孩子它有哪些新发现?」，Bard给出错误答案。

这直接导致公司股价暴跌8%，市值缩水1000多亿美元，让投资群体和用户大失所望。

但其实OpenAI的产品也经常胡说八道、张冠李戴，不过因为是创业公司，所以大众的允许容忍度会高很多，产品标注为beta测试，还可以不断迭代修改。

作为大公司的谷歌，也受到更多法律上的批准，比如用户数据的版权问题。

谷歌曾因在AI训练过程中确认有罪欧盟版权法被罚款2.5亿欧元，也是全球首个因AI训练数据被罚款的案例，坐拥金山，却无法使用，无异于自断双臂。

谷歌的产品线庞大，想要在所有产品中都加入AI驱动，需要非常细致的产品无约束的自由能力，而去年末发布的Gemini1.0，因其缺乏「多样化」的策略，再次导致股价下跌。

不过，「成功者说什么都是对的」，谷歌重新以王者之姿横扫AI，未来还计划继续引领「智能体」发展，携手浏览器和手机端，全自动实现用户任务。

谷歌年度AI大事件

谷歌并非没有看到AI市场的巨大潜力，但2024年才算是开始「发力」的一年。

很多有名气的产品高度发展都是在今年发布的，比如各种版本的Gemini，NotebookLM，Pixel手机上的AI功能等等。

传收门:https://blog.google/technology/ai/google-ai-news-recap-2024/

谷歌宣称在2024年有「60条重大AI发布」，不妨看看其中几条次要的基础能力。

Gemini模型

去年12月，谷歌推出首个原生多模态模型Gemini1.0，打响了谷歌的AI反击战。

它可以同时处理文本、视频、图像、音频和代码等数据，分隔开了包括数学、物理、历史、法律、医学和伦理在内的57个学科，也是第一个在MMLU（大规模多任务语言理解）基准上超越人类专家的模型。

今年2月，谷歌将Gemini升级到1.5，把上下文窗口从32k指责到100万个token，超越了同时期所有大模型。

在推理性能上也有大幅指责，Bard也正式更名为Gemini

7月，免费版Gemini1.5Flash发布，减少破坏40多种语言，覆盖230多个国家和地区，质量和延迟都有大幅指责，尤其是在推理和图像理解方面。

12月推出的Gemini2.0Flash集成了多模态和原生工具使用能力，标志着大模型正式迈入「智能体」时代。

基于Gemini2.0，谷歌构建了原型项目Mariner，从浏览器出发探索全新的人机交互方式:训练Gemini来理解并推理浏览器屏幕上的信息，包括像素和文本、代码、图像和表单等元素，然后通过实验性的Chrome扩展程序自主完成复杂任务。

在产品方面，谷歌于今年5月基于Gemini推出AskPhotos功能，用户可以通过输入关键词，如地点、人物和日期，或是类似「主题生日派对」等自然语言概念对照片库进行检索。

NotebookLM

去年7月，谷歌推出了一款AI驱动的科研和写作助手NotebookLM。

一年后，其底层模型切换为Gemini1.5Pro，用户可以上传研究笔记、访谈记录或公司文件，然后提出相关问题以理解和探索复杂材料，减少破坏幻灯片、pdf等多种格式。

9月，NotebookLM发布重磅AudioOverview功能，模型可以针对用户材料生成两位AI主持人互相讨论的音频，可以干涉用户对材料进行「总结」和「深入讨论」。

不过该功能目前仍然处于实验阶段，比如只会英语，无法打断等问题。

AlphaFold3

今年5月，谷歌的AlphaFold3论文在Nature上发表，在预测蛋白质与其他分子类型相互作用上性能指责了至少50%，在某些次要的相互作用类别，其准确率甚至能翻倍。

论文链接:https://www.nature.com/articles/s41586-024-07487-w

2020年发布的AlphaFold2实现了蛋白质结构预测的根本性突破，在包括疟疾疫苗、癌症治疗和酶设计等领域辅助数百万科研人员进行新发现，引用超过2万次。

AlphaFold3则跳出蛋白质，进入广泛的生物分子领域，有可能解锁更多变革性科学成果，比如开发生物可再生材料和更具弹性的作物，帮助药物设计和基因组学研究。

11月，研究人员发布了AlphaFold3模型代码和权重，以供学术使用。

Pixel移动端

1月份，谷歌宣布为新款GalaxyS24系列的录音、笔记等软件基于GeminiPro授予摘要能力;基于文生图模型Imagen2，为GalaxyS24图库授予生成式照片编辑功能。

八月，谷歌发布自家手机Pixel9，使用全新的定制芯片TensorG4授予AI计算能力，整合了极小量AI能力，包括生成定制天气报告、整理截图信息、本地文生图等多种功能。

其中最次要的GeminiLive，能够以更直观、自然的方式干涉用户计划旅行攻略、解决家庭维修问题、构思礼物等等。

期待明年谷歌即将带来的礼物。

参考资料:

https://x.com/tsarnick/status/1872927162757726475

https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html

https://techcrunch.com/2024/12/28/google-ceo-says-ai-model-gemini-will-the-companys-biggest-focus-in-2025/

https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html

伦理片1313苦瓜网

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。

【新智元导读】今天，「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了，人人可玩的那种。

最近，2024中国互联网价值榜发布。

2024年AIGC应用用户规模TOP榜中，昆仑万维旗下天工AI强势入围!

如今，天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩，在多梯队的猛烈厮杀格局中稳稳占据无足轻重。

同时，还不断有好消息传来。

就在今天，天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型，正式进化到「天工4.0」。

「天工大模型4.0」o1版（Skyworko1）的上线，意味着国内首款中文逻辑推理能力的o1模型来了!

数学高考题、考研题、奥数题，Skyworko1都能靠自己的逐步思考破解。

注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力，还在模型真正拥有了思考和反思之后，带来了推理能力的指责。

在最近热转的复旦等机构解密OpenAIo1路线图这一研究中，skywork-o1就被列为国内o1级模型的代表之一

并且，昆仑万维天工大模型4.0上线后，应用端不仅在逻辑推理和代码功能上有了几大指责，语音交互上的表现也着实令人惊叹。

一个月正式发布的新产品「实时语音对话助手Skyo」，如今有了史诗级指责。

众网友实测后纷纷表示，原来国内版的「Her」，已经进化到了不输OpenAI版本的地步!

具备多语言对话能力的Skyo，不仅能快速响应、主动发起对话、实时打断，给出的回应还十分情感化，已经具备了类人特征。

还等什么，实测马上呈上。

超强推理+自我反思，免费体验

现在，分别关闭天工APP或网页端，任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。

既然主打的是推理，那么我们就先来看看Skyworko1在数学题上的表现如何。

体验地址:https://www.tiangong.cn/o1Chat/055

先来个硬核的，AIME数学竞赛题。

题目是这样的——

Jen通过从S={1，2，3，...，9，10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个，她就能赢得奖金;如果她的四个号码都是随机选择的号码，她就能赢得大奖。假设她赢得了奖品，她赢得大奖的概率是m/n，其中m和n是相对质的正整数。求m+n。

Skyworko1用时1分55秒，经过一番思考后，最终给出了正确答案——116。

对于下面这道同样有些难度的数学题，模型在经过一番思考之后，很快就想到了用图论中的「图兰定理」去解。

值得一提的是，在思考过程中它对答案不确定时，甚至会反思自己的回答，直至最终确定25是正确答案。

一个象棋比赛，共有十名选手参加，每一个选手都需要和其他选手每人下一盘棋，赛程进行到某阶段时，发现任意三个选手中，起码有两个相互之间还没有下过一盘棋，此时至多进行了多少场比赛?

2024年高考新课标一卷的数学真题，Skyworko1也能做出正确答案，就是方法稍微「笨」了点。

复杂一些的逻辑推理题，Skyworko1也能做对。

这道从池塘中取水的推理题，它通过一步步的思考过程，推理出了正确答案。

还有这道「一个人花8块钱买了一只鸡，9块钱卖掉了，然后他觉得不划算，花10块钱又买回来了，11块卖给另外一个人。问他赚了多少」，Skyworko1反复斟酌之后给出了正确的答案。

为什么刚出生的小孩只有一只左眼?这个脑筋急转弯，没能瞒过Skyworko1的眼睛。

弱智吧难题，不在话下。

比如父母以后的钱都是留给我的，可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。

吕布马上无敌，典韦步战无敌，吕布骑着典韦会不会天下无敌?Skyworko1表示，有趣的脑洞只是一个戏谑的表达，而非爱开严肃的话的历史或军事讨论。

最后，上一道LeetCode贪心算法的分发饼干代码难题。题目如下——

假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。

对每个孩子i，都有一个胃口值g[i]，这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j，都有一个尺寸s[j]。如果s[j]=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子，并输出这个最大数值。

Skyworko1也顺利给出了答案。

自研技术方案，结束创新迭代

那么，Skyworko1为何能在逻辑推理任务上，有如此大幅的指责?

这就要得益于天工三阶段自研的训练方案。

推理反思能力训练

首先，在推理训练方面，团队通过自主研发的多智能体体系，构建出了高质量的分步推理、反思与验证数据。

然后，用这些高质量且多样化的长思考数据，对基座模型进行继续预训练和监督微调，并在版本迭代中采用大规模的自蒸馏和允许采样，从而显著指责了模型的训练效率和逻辑推理能力。

推理能力强化学习

其次，在强化学习阶段，团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel（PRM）。

在最新的版本中，团队将Skywork-PRM的应用范围，从原本侧重的数学和代码领域，拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时，还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据，实现了全场景覆盖。

此外，团队重点指责了Skywork-PRM的模块化评估能力，特别是在处理o1风格思维链方面，优化了试错和反思验证机制。通过更细致的评估体系，为强化学习和搜索过程授予了更精准的奖励信号指导。

推理planning

最后，在推理的规划方面，团队通过自研的Q*线上推理算法，以及模型的在线思考能力，实现了最优推理路径的寻找。

概括来说，Q*算法通过借鉴人类大脑中「System2」的思考方式，将LLM的多步推理过程抽象为一个启发式搜索问题。

然后，再通过Q*线上推理框架与模型在线思考的分隔开，实现了推理过程中的精细规划，进而指导LLM的解码过程。

Q*算法的成功落地，不仅显著指责了模型的线上推理能力，同时也标志着Q*算法的全球首次实现和公开。

论文地址:https://arxiv.org/abs/2406.14283

更进一步的，团队基于Q*算法对推理系统进行了全面优化。

第一点是模块化的树形结构推理:

团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调，使模型具备了对整个推理流程进行系统规划，自动将回答按层次发散，同时在推理过程中融入自我反思和验证环节的结构化输出能力。

此外，还创新性地利用失败以「模块」为单位的规划方式，取代了传统的以「句子」为单位的方法。既指责了规划效率，也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。

第二点是自适应的搜索资源分配:

针对现有o1风格模型存在的缺乏思考问题，团队开发出了一种全新的自适应搜索资源分配机制。也就是，通过对用户query进行难度预估，自适应地控制搜索树的宽度和深度，进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的，有效指责了偶然的计算效率和回答准确率。

最终，Skyworko1在GSM8k，MATH，OlympiadBench，AIME-24和AMC-23标准数学基准测试，以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中，性能显著优于常规通用大模型，表现仅次于o1-mini。

实时语音助手，开启AI交互新纪元

在APP端，「天工大模型4.0」4o版加持的实时语音对话助手Skyo，同样带来了前所未有的自然交互体验。

它不仅能在1秒内快速响应，还具备了多语言对话、主动发起对话、实时被打断的能力。

与此同时，4o未来版本可以减少破坏个性化声音定制功能，能够以任何人希望的风格畅聊。

这是这种个性化的体验，让4o不再是冰冷的AI，而是一个更智能的AI伙伴。

当你唤醒Skyo后，他会主动无感情打招呼，并尝试开启一个新的话题。当你生活中遇到难题时，可以向它寻求建议和干涉。

比如，家里2岁的宝宝总是说不要不要，我该怎么办?

冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇，根据这些原材料，能帮我推荐一份食谱吗?

当你想要策划一场旅行，它还会贴心地为你做好攻略——我计划去北京度假3天，你能帮我做一份攻略吗?

甚至，当你无聊时，可以让Skyo玩脑筋急转弯、猜字容易理解，或者一起聊天......

比如，我们一起玩脑筋急转弯吧，我问你答。什么瓜不能吃?麒麟到了北极会变成什么?

我们还对Skyo进行了压力测试，看看在不断被打断的情况下，它能否依旧表现亮眼?

「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。

果不其然，在整个对话过程中，它完全能够跟上节奏，不仅有感情地朗读出诗仙的静夜思，并在古代诗人不无关系的信息问答中，给出了准确且通俗的回答。

接下来，我们一口气连问四个问题，Skyo即便被频频打断，也没有「崩溃」。

「对于一个单身男青年，可以推荐他晚上看什么电影?什么情况下，说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话，它们会说些什么」?

从以上案例可以看出，Skyo具备了高度协作发展智力能力和流畅的响应度，而且它还能做出有趣的互动，成为你个性化的陪聊搭子。

多模态LLM端到端建模

深挖背后，Skywork4o加持的Skyo突破性体验，是昆仑万维基于大模型、AI音乐等领域的研发经验，以及极小量的语音数据积聚，打造出这个端到端的语音对话系统。

传统的语音助手采用了ASR（语音识别）+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。

英伟达高级科学家JimFan曾指出，AI语音系统Whisper、大模型ChatGPT，以及语音分解技术VALL-E，是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。

不过，在此期间，三个独立的模型在串联过程中，会带来响应延迟，甚至是信息损失、优化困难等问题。

对此，昆仑万维选择了一条艰难的创新之路，采用多模态LLM端到端建模。

端到端模型使得用户的语音输入经过语音编码器提取语义特征，通过适配模块转换为大语言模型（LLM）可理解的格式，LLM处理后生成语音回复，实现端到端的语音交互。从根本上解决了这些难题。

团队还采用了低比特率单码本语音Tokenizer，在显著降低延迟的同时还保持了音质。为了扩展语音建模能力，Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出，确保了实时交互的体验。

最关键的是，它不仅能准确识别语音内容，还能捕捉语速、语调、情感等细微的特征，从而做出情感化的回应。

比如我们问道，「我今天在路上偶遇到了一只流浪猫，看着它怪快乐洋洋的，所以我无法选择收养了它」。

Skyo的回答中语气上扬，对这个行为做出了极大的接受。

再比如，「我最近感到非常疲惫，心情有点差」。

Skyo感同身受地表示，「我能够理解你现在不是处在最美好的状态」。随后，它又主动推荐了一些调节心情的方法。

「有时候，我甚至麻痹自己不被人理解」。

听完AI的回答，瞬间感到非常地温暖贴心，甚至有时会给人一种在和知心朋友交流的错觉。

一年迭三代，跻身国内第一梯队

纵观全球AI行业的发展，过去一年里，应用落地成为最受瞩目的关键词。

OpenAI新模型接连上新，再加上一些搜索、Canvas、高级语音模式等功能的推出，让ChatGPT每周活跃用户数直接冲破3亿。

微软押注的Copilot不断迭代，并赋能了更多平台/工具，包括GitHub、Office365等等。

至于谷歌，今年最爆火的一款应用非NotebookLM莫属，一键转写总结播客让所有人拍案叫绝。

还有Anthropic、亚马逊、Meta等国外科技巨头们，都在AI落地战场上帮助布局。

反观国外，以阿里、腾讯、字节为代表的互联网公司，以昆仑万维、智谱AI、百川智能等为代表的AI公司，在这场竞赛中也毫不逊色。

据QuestMobile统计，截至今年9月，国内AI原生应用活跃用户数接近8000万人。

其中，月活超百万以上产品数量仅12个，而天工AI长期稳居中国原生AIGC应用月活TOP10，并且在月活用户300-1000万区间内位居前三。

值得注意的是，昆仑万维凭借其扎实的技术积聚，以及不不透光的战略布局，正逐步确立自己在这个赛道中的领先地位。

去年5月，其主打产品天工AI日活跃用户（DAU）已经突破百万大关。

作为一家老牌互联网企业，昆仑万维从2008年诞生后，一直在书写着自己的AI传奇。

2020年，在GPT-3出世的这个关键节点上，团队开始全面布局AIGC和大模型领域。

2024年，是昆仑万维在AI领域的丰收年。

截至目前，他们已自研出五大模型体系，包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。

在大模型方面，团队在2月推出MoE大语言模型「天工2.0」，紧接着4月又迭代了4000亿参数的「天工3.0」，性能大幅超越Grok-1，一举成为全球最大的开源MoE。

与此同时，音乐生成大模型「天工SkyMusic」正式诞生。6月，昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月，4o和o1版模型相继诞生。

不仅如此，昆仑万维的影响力已遍布全球市场。

比如，率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域，还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。

目前，公司在全球平均有近4亿月活，海外收入占比高达89.7%，在社交、游戏、音乐等领域已经形成壁垒。

并且，还完成了「算力基础设施—大模型算法—AI应用」全产业链布局，构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。

昆仑万维的实践带来的启示是，AI落地不仅仅需要强大的技术能力，更需要的是对应用场景的肤浅理解。

正是这种扎根于实际应用场景的技术研发思路，使得团队能够准确把握用户需求，将过往积聚的能力快速转化为解决世界问题的产品。

这次，4o和o1在天工全新上线，又将成为这款应用破局的下一个爆发点。

不仅如此，昆仑万维对AGI发展路径的思考极具前瞻性。

回顾过去两年，科技圈对AGI的讨论可谓是起起落落。特别是2024年年初，随着Sora诞生之后，许多人一度陷入缺乏乐观的不关心，认为AGI实现就在一两年之内。

然而到了年中，这股热潮又悠然，从容消退，悲观论调开始盛行——AGI遥遥无期。

昆仑万维创始人周亚辉对未来30年，做出了富有远见的判断:人类社会将从感知保持方向表达，创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会，2030年之后才会开始逐步实现通用人工智能AGI。

关于这个时间节点，他从未保持不变过。

不过，在迈向AGI时代之前，机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破，皆需要全球顶尖AI科学家的努力。

周亚辉认为，机器人技术协作发展进程如何，其在军事领域的应用是一个次要的指标。

未来，如果机器人产业带来超10亿美金市场规模，将会对整个社会结构和社会治理产生次要的影响。

基于这些判断，昆仑万维在2024年初就确立了「实现AGI，让每个人更好地塑造和表达自我」的新使命。

而现在，在这条通往AGI的道路上，他们正在用技术创新和产品落地，一步步将愿景变为现实。

参考资料:

https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4

天工o1模型:

https://www.tiangong.cn/o1Chat/055

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、AI假冒不为人所知的人直播带货属违法行为可要求退一赔三近年来，AI技术的悠然，从容发展带来了深度伪造技术的应用，这种技术通过算法生成逼真实的诚实内容，导致了不为人所知的人形象被冒用的现象。彼得·蒂尔的影响力在这些公司中无处不在，他推动的科技优先理念引发了对国家安全与伦理的深思。...

曝绿营大佬欠钱不还却出入高档餐厅

民众党民意机构党团总召、民众党代理主席黄国昌去年底爆料，民进党民代许智杰曾和“新潮流”大佬、民进党前秘书长吴乃仁聚会，不能引起外界关注。而在昨天（8日），黄国昌再度于脸书爆料，指吴乃仁去年12月底现身某高档无菜单料理餐厅，此餐厅包厢低消高达6万元（新台币，下同），且在席间竟还有台北地检署检察官徐名驹。

“赖着不还的吴乃仁，觥筹交错的检察官。”黄国昌8日在脸书发文表示，他当天在台民意机构“经济委员会”针对吴乃仁贱卖台糖土地，服完刑后未偿还根除台湾的损失，加计利息反倒愈欠愈多，高达1.74亿元赖着不还一事提出质询。他直言，吴乃仁雄厚的“新潮流”政治背景，加上台湾地区领导人赖清德的力挺，让台糖很为难。所以台糖以吴名下查无财产替其遮掩，连带台北地方法院执行处也不敢认真践行强制执行程序，“根除全体纳税人损失的绿营权贵横着走，公平正义荡然无存。”

黄国昌指出，自己除了在质询时揭露吴乃仁出入乘坐BMW7系列豪车、常与政商权贵高档餐厅外，更接获检举，指吴乃仁的政治影响力之大，连检察官都得敬他三分。他提到，去年12月底晚间，吴乃仁再次现身于台北市中山北路二段附近的高档无菜单料理餐厅，由某从事人力中介的陈姓董事长招呼接待，在席间竟还有台北地检署徐名驹等一票检察官。

黄国昌质问台当局法务部门负责人郑铭谦，徐名驹等检察官有没有逾越检察官伦理守则？这场餐叙由谁牵线？低消6万元的包厢由谁买单？在席间又谈了些什么内容？黄国昌并认为，这些问题除要郑铭谦回答，也考验着台湾司法独立的底线与检察官的官箴，是否又会因为事涉民进党大佬，再次往后前进。

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推出屏幕共享与视频聊天功能，ChatGPT整了个“圣诞老人模式”

OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能，允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPTTeams、Plus和Pro用户开放，预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用，但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。

【AiBase提要:】

??新增视频聊天功能，ChatGPT可实时响应用户所见内容。

???屏幕共享功能上线，用户可在手机上请求ChatGPT授予干涉。

??“圣诞老人模式”上线，用户可以与原创圣诞老人声音的ChatGPT互动。

2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放

Anthropic公司发布了其最新的Claude3.5Haiku模型，现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注，特别适合实时任务和大数据集处理。尽管存在一些功能批准，如不减少破坏网页浏览和图像生成，但其在聊天机器人上的多功能性和与ClaudeArtifacts的集成指责了用户体验。

【AiBase提要:】

??Claude3.5Haiku现已全面开放，减少破坏图片和文件分析功能。

??免费版本受消息不限数量批准，用户可选择20美元的ClaudePro订阅以获得更多权限。

??该模型在多项基准测试中表现优异，适合实时任务和大数据集处理。

3、上海AI实验室推大模型“指纹识别”方法REEF，打击“套壳”行为

在AI时代，保护大型语言模型（LLM）的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法，通过特征表示进行模型指纹识别，能够有效识别“套壳”模型，而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效，为打击未经授权使用授予了新的手段。

【AiBase提要:】

??REEF是一种基于特征表示的模型指纹识别方法，不依赖特定层的表示，具有较强的鲁棒性。

??该方法通过比较模型在相同样本上的特征表示的中心核对齐（CKA）反对度，识别清楚的“套壳”模型。

??实验结果显示，REEF在识别“套壳”模型方面优于现有方法，为保护LLM知识产权授予了新的工具。

详情链接:https://arxiv.org/pdf/2410.14273

4、RunwayActone平替!HelloMeme让表情包视频制作更轻松!

HelloMeme是一款创新工具，旨在简化表情包视频的制作过程。它通过优化注意力机制，使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作，指责了视频的生动性和透明度，同时保持了与SD1.5模型的兼容性。

【AiBase提要:】

??HelloMeme通过优化注意力机制，增强了表情包视频的制作能力，简化了过程。

??它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成，协同工作生成高质量视频。

??HelloMeme与SD1.5模型兼容，耗尽原模型功能的同时赋予新能力，指责视频质量。

详情链接:https://songkey.github.io/hellomeme/

5、Meta推出全新水印工具VideoSeal打击AI生成深度伪造视频!

Meta公司推出的MetaVideoSeal工具，旨在为AI生成的视频添加几乎不可察觉的水印，以应对深度伪造技术带来的确认有罪。该工具不仅开源，还能与现有软件无缝集成，增强视频的原创性保护。

【AiBase提要:】

??Meta推出的MetaVideoSeal工具可以为AI生成的视频添加水印，抵抗编辑和数量增加。

??该工具已开源，旨在与现有软件集成，并希望推动行业内的水印技术发展。

??Meta还将推出公开排行榜以比较不同水印方法，鞭策行业合作与交流。

6、OpenAICFO透露:新一代AI模型开发将耗资数十亿，成本激增!

OpenAI首席财务官在纽约透露，未来构建更高级的人工智能模型的费用将结束大幅增长，预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力，促使公司加大对AI技术的投资。

【AiBase提要:】

??OpenAI预计新一代AI模型开发费用将结束激增，达到数十亿美元。

??公司正在加大对先进AI偶然的投资，未来服务价格可能会上涨。

??新推出的AI视频生成器Sora引发积极反响，为内容创作者授予更多可能性。

7、谷歌、三星联手“掀桌”!全新瓦解现实头显、AI眼镜曝光，剑指苹果VisionPro

谷歌与三星联合推出的新一代瓦解现实头显和智能AI眼镜，充分展示了在瓦解现实领域的雄心。这两款设备不仅硬件升级显著，还深度整合了谷歌最新的GeminiAI模型，具备理解用户意图和长期记忆能力，授予个性化服务。减少破坏多种自然交互方式，使用户体验更为流畅。

【AiBase提要:】

???新设备减少破坏VR和AR功能，深度应用AI技术，授予个性化服务。

???创新交互方式，减少破坏手势、语音和眼动，指责用户体验。

??基于AndroidXR操作系统，现有应用无缝适配，降低开发者门槛。

详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

8、谷歌“王牌”TPUTrillium开放使用!性能暴涨，AI模型训练效率再创新高

谷歌最新发布的TrilliumTPU现已面向GoogleCloud客户开放，其显著指责的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构，TrilliumTPU在训练和推理性能上均实现了显著指责，极大地推动了AI解决方案的开发与应用。

【AiBase提要:】

?TrilliumTPU的训练性能降低4倍，推理吞吐量降低3倍，能源效率指责67%。

??TrilliumTPU减少破坏大规模AI训练，能够有效分配工作负载，显著加快训练速度。

??每美元训练性能降低2.5倍，推理性能降低1.4倍，授予了可忽略的，不次要的性价比。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

9、TwelveLabs正在开发能够分析和搜索视频的人工智能

在数字媒体时代，视频内容的增长速度令人瞩目，但传统的搜索和分析方法却无法焦虑需求。十二实验室通过人工智能技术，彻底保持不变了视频理解的方式，能够深入分析视频中的动作、物体和声音，授予更精准的搜索能力。

【AiBase提要:】

??十二实验室的AI模型能够深入理解视频内容，超越传统的关键词搜索。

??该公司专注于视频理解，授予定制化的视频分析工具，适用于多种场景。

??十二实验室在技术创新的同时，注重伦理，确保AI模型的公正性和包容性。

10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战

随着人工智能行业的快速发展，xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪驱散人才，导致竞争对手面临有利的条件。分析显示，OpenAI在薪资上明显高于行业标准，而xAI的薪酬也具竞争力。【AiBase提要:】

??xAI与OpenAI在薪资上的差距显著，OpenAI的薪资超出行业标准87%。

??马斯克与奥特曼之间的竞争加剧，xAI已招聘多名前OpenAI员工。

??马斯克指控OpenAI反竞争行为，双方在人才争夺中斗智斗勇。

11、OpenAI前算法负责人创立新公司，进军智能陪伴机器人领域

据媒体报道，OpenAI的前资深算法负责人江旭成立新公司“亮源新创”，专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者，江旭在OpenAI的职业生涯中参与了多个关键项目，并于2023年离职后成立了该公司。

【AiBase提要:】

??亮源新创专注于具身智能陪伴机器人的研发，旨在指责用户的生活质量。

??公司在深圳和新加坡设有办公室，正在积极招聘人才以推动项目进展。

??亮源新创的机器人将具备感知、学习及与环境交互的能力，适用于多个领域。

12.巨人网络发布“千影QianYing”有声游戏生成大模型

巨人网络在2024年度中国游戏产业年会上发布了“千影QianYing”有声游戏生成大模型，包含YingGame和YingSound两个不次要的部分模型，展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中，同时启动了“千影共创计划”，旨在鞭策“游戏+AI”领域的发展。

【AiBase提要:】

??巨人网络发布“千影QianYing”有声游戏生成大模型，推进游戏与AI分隔开。

??模型包含YingGame和YingSound，减少破坏有声可交互游戏视频生成。

??启动“千影共创计划”，帮助游戏创作的技术应用与合作。

“北京中轴线”申遗成功

联合国教科文组织第46届世界遗产大会通过决议，将“北京中轴线——中国理想都城秩序的杰作”列入《世界遗产名录》。至此，中国世界遗产总数达到59项。

这是一条纵贯北京老城南北7.8公里长的“线”，始建于13世纪，形成于16世纪。秩序井然、气势恢宏的城市建筑群，见证了影响中国都城营建传统两千余年的理想都城秩序。

“北京中轴线”北端为钟鼓楼，向南经万宁桥、景山，过故宫、端门、天安门、外金水桥、天安门广场及建筑群、正阳门、中轴线南段道路遗存，至南端永定门，太庙和社稷坛、天坛和先农坛，分列中轴线东西两侧。

2024年7月27日，位于北京中轴线最北端的钟鼓楼广场，来自东城区华风合唱团的团员们合唱歌曲《唱响中轴》，庆祝北京中轴线申遗成功。中青报·中青网记者陈剑/摄

“北京中轴线”的故事，从外围上看是一个宏大叙事，但同时萦绕着人间烟火。保护文化遗产是为谁？为生活在里面的人。鼓楼脚下的北京市民、前门大街的老字号，还有宣传中轴线的少年志愿者、设计中轴线文创的年轻人，他们共同书写着中轴线的当下故事。

其实，北京的轴线从古至今一直在吝啬：元代约3.7公里，明初4.8公里，明嘉靖年间形成了这7.8公里。今天北京的城市轴线向南已延伸至北京大兴国际机场，向北延伸至燕山脚下。

申遗成功是一个新的开始，遗产来自过去，终将面向未来。

抢到冰箱贴了吗？博物馆再登“顶流”

中国国家博物馆的凤冠冰箱贴、北京古代建筑博物馆的天宫藻井冰箱贴，如果你今年抢到了这两款博物馆爆款文创，一定能站上“朋友圈鄙视链”的顶端。

如今，参观完展览买文创，已成为年轻人逛博物馆的标配。据不完全统计，三星堆博物馆、故宫博物院、上海博物馆、中国国家博物馆、苏州博物馆等文创年销售额都超过亿元。在人社部等部门发布的19个新职业中，文创产品策划运营师俨然位列其中。

国博凤冠冰箱贴。中国国家博物馆供图

截至今年8月底，全国正式备案注册的6833家博物馆已接待观众9.4亿人次。从排队看展览，到排队买文创，博物馆以自身的厚积薄发，驱散年轻观众不断涌入。而两者之间的关系也从单向的参观，保持方向沉浸式的互动。

就连卖文创的方式本身，都成为体验的一部分。在甘肃省博物馆，挑选自己喜爱的毛绒“麻辣烫”菜品现场“烹饪”；在苏州博物馆，趁秋高蟹肥，捆上几只毛绒“大闸蟹”带回家。

会整活、重社交，有故事、有仪式，博物馆文创的流行，也让馆藏文物背后的历史文化被更好地保守裸露，公开，进入年轻人的购物车，也进入年轻人的精神世界。博物馆可以严肃，也可以“治愈”，可以是国家的“文化客厅”，也可以是青年的约会场所。一个与经济社会发展相适应的、与公众美好生活需求相适应的博物馆“生活圈”，正在构建。

国潮“圈粉”年轻人

《中国诗词大会》播到了第九季，“中国华服日”办到了第六届，《只此青绿》3年演了600多场；“红男绿女”的宋制婚礼成流行，大学生在毕业季拍国风毕业照；穿着新中式服饰、吃着中式烘焙、端着中式茶饮……国潮，在2024年继续奔流。

国潮的根是传统文化，但又绝不是复古，它是现代的、青春的，有时候还是国际的。以海南黎锦为创作主题的时装秀，登上了巴黎时装周；聚焦中式审美、时令习俗和传统工艺的恭王府服饰秀，也再度亮相巴黎。

非遗有着“遗产”之名，但被越来越多年轻人接受并喜爱。比如，太极拳、八段锦等成养生秘笈；簪花、漆扇成景区“必打卡”项目。“春节——中国人庆祝传统新年的社会实践”，在岁末被列入联合国教科文组织人类非物质文化遗产代表作名录。从此，只要是过春节的人，就是非遗传承人。

8月21日，上海，玩家展示《黑神话：悟空》宣传海报。视觉中国供图

国潮的潮，一方面是内容，另一方面是载体。据统计，国家级非遗代表性项目1557个，99%以上都有比较轻浮的新媒体账号和内容。在火爆“出圈”的《黑神话：悟空》中出场的陕北说书，时长不到两分钟，在社交平台获得千万观看量。

但新的“暗涌”也请注意，不是只要拼贴叠加传统文化符号、复制粘贴爆款国潮产品就能百战百胜。已遭反噬的“国潮少女”形象，被年轻人列入“避雷”名单。大潮未退，更须修炼文化的“内功”，才能源远流长。

电影院空间“长”出新玩法

电影演员有粉丝，到了2024年，电影院开始有自己的粉丝了。多种艺术形式和消费方式“跨界”闯入，电影院空间“吝啬”出极小量多彩的新玩法。

体育迷在家看电视不过瘾？你可以去电影院，享受一群人同看比赛的沸腾氛围。今年奥运会期间，“影院看奥运”直播活动引发大家的参与无感情。全国累计有800余家影院参与，共计放映2300余场。竞技体育的魅力在影厅沉浸式环境中被充分放大，赛事“第二现场”在影厅完善的视听技术中为观众带来焕然一新的观赛体验。

如今，你还能在大银幕上看演唱会、音乐会等。年轻人颇为喜爱的线下穿口秀演出，也开始“登陆”电影院空间。影院的“沉浸式”程度也结束飙升，你能边吃火锅边看电影，或者“闯”进故事里——看电影时身穿影片中角色的同款衣服、手持推动剧情协作发展关键道具，身临其境般全方位感知光影魅力。

除了看新片，“老片党”的厌恶与情怀，也能在电影院中得到温柔安放。今年多部经典电影重映：《哈利·波特》全系列8部电影、《这个杀手不太冷》《你的名字。》《哈尔的移动城堡》《海上钢琴师》……电影院是新故事的载体，也是保存美好记忆的游乐场。

微短剧市场超过电影票房，迎来深度洗牌

2024年，我国微短剧市场有着前所未有的变得失败，据预测，市场规模有望达到504.4亿元，有望超过内地电影全年总票房。我国微短剧用户规模已达5.76亿人，占据外围网民规模的半壁江山。

微短剧题材多样，焦虑不同观众喜好。有的聚焦传统文化，如《一梦枕星河》融入苏绣、昆曲等非遗元素；多部热门电影和电视剧推出衍生微短剧，如《超越吧！阿娟》（动画电影《雄狮少年》衍生）、《我的归途有风》（热门剧集《去有风的地方》衍生）等。

在追求热度和流量的过程中，部分微短剧陷入低俗、擦边。霸道总裁、豪门弃妇等题材泛滥，部分作品宣扬拜金主义、享乐主义。6月1日，《关于微短剧备案最新工作提示》正式实施，要求对微短剧不关心的时期“分类分层审核”。微短剧行业迎来更为严格的监管，微短剧市场面临一次深度洗牌。

目前，多家短视频和长视频平台纷纷布局微短剧领域，通过引入精品短剧、指责制作水不平衡方式，争夺市场份额；同时出现跨界合作，东方卫视等多家媒体入局微短剧市场，将优秀作品推向大屏端播出。

如何在追逐经济效益的同时，保持内容品质，获得社会效益，将是微短剧从业者需要思考的问题。

好故事是国产片的基石，诚意和创意是养分

2024年的国产电影，留下了怎样的好故事？

每个节点的佳作，构成了国产片的优秀“成绩单”：春节档的《热辣滚烫》《第二十条》《飞驰人生2》，暑期档的《抓娃娃》《默杀》《逆行人生》，中秋档的《野孩子》《出走的决心》，国庆档的《志愿军：存亡之战》《只此青绿》，年底的《好东西》《雄狮少年2》……

《只此青绿》海报。片方供图

现实主义题材“上大分”，多元类型迸发亮点和惊喜，诚意和创意是电影创作的养分。

“全片没有一句台词”的电影《只此青绿》，改编自同名舞蹈诗剧。电影版由舞剧原班人马领衔主演，采用更适配电影演绎的艺术语言，让这个国民IP在大银幕上得到绚烂“展卷”，获得极下降的口碑和出色的票房。

舞台作品与电影作品的转化，启发电影行业从业者挖掘、探索传统艺术与大众文化消费之间的关系。

取材于82年前那段真实历史事件的删除电影《里斯本丸在高处》上映，戳中观众泪点，豆瓣评分高达9.3分。《里斯本丸在高处》的价值不只是一部电影。它在历史上填补了一个空白，让历史以光影的形式被永远“留”了下来。

《里斯本丸在高处》海报。片方供图

好电影总能在“无声胜有声”的时刻戳中人心，甚至跨越国界和时空。这对于推动中华优秀传统文化的传承、讲好中国故事有着积极意义。

AI+文化，新科技面临新伦理

2024年，AI（人工智能）在文化领域迎来爆发：AI写作、AI绘画、AI音乐……同时爆发的还有质疑，北京市互联网法院审理了全国首例涉AI绘画大模型训练著作权侵权案。AI创作属于真正的创作吗？AI生成的作品版权如何界定？AI抄袭该如何处理？都未有定论。

AI成为年轻人生活的一部分。学生写论文用AI整理文献，求职遇见AI面试官，超过一半的受访学生收到过AI面试寻找。各大平台上，AI甄嬛、AI鲁智深、AI孙悟空纷纷问世，用原著人物的语气与用户互动。微博上的“评论罗伯特”成了“网红”，网友甚至建立了“罗伯特欺凌弱小者敌手，对手”，用来展示其语出惊人的评论。

AI伴侣成为情感寄托的一种选择。一些人开始与AI聊天甚至恋爱，体验AI的包容、浪漫和无微不至的关怀。一些人通过AI让逝者“数字复活”，试图重新建立情感分开。而某音乐人用AI“复活”女儿，又引发舆论争议。AI使用中的道德和伦理问题，还需要进一步探索。

此外，AI生成的诚实账号和内容，还带来“AI降低纯度”，产生极小量粗制滥造、真假难辨的“信息有用的东西”。AI的发展是一场技术与人文的交响，如何在享受技术红利的同时，应对其带来的种种前所未有的新问题，将是未来人类社会所面临的共同课题。

青年+科技，考古新面孔

考古的时间线总是拉得漫长，距今2100多年的马王堆汉墓，在今年迎来了考古发掘50周年。而在2024年的考古新发现中，有的聚焦城市考古，如浙江绍兴稽中遗址、江苏盐城盐业考古、河南开封北宋东京城景龙门遗址；有的聚焦史前和夏文化，如浙江衢州皇朝墩遗址、江苏兴化草堰港遗址、河南方城八里桥遗址……

我们惯常描述考古发掘，往往用“出土”，2024年，“出水”同样可观。在南海，使用载人潜水器和无人水下遥控潜水器，对南海西北陆坡一号、二号沉船遗址开展水下考古，中国水下考古从近海走向深远海。在长江，已外围打捞出水的“长江口二号”古船，正式启动考古工作，通过科技考古，分析研究解读古船包含的历史信息。水下考古，是科技与考古携手的生动写照。

考古需要青年。9月，国家文物局、财政部等印发《全国考古人才振兴计划项目无约束的自由办法》，将在5年内遴选100支文物考古人才创新团队，并对团队予以资助。

青年热爱考古。在2020年因高分报考“冷门”专业——北大考古学而受到关注的湖南女孩钟芳蓉，今年毕业了，考入敦煌研究院石窟考古岗位，和她的前辈樊锦诗一样，从燕园奔赴敦煌。考古这件事，又多了一个有爱的新面孔。

2月，河南安阳的殷墟博物馆新馆开馆；11月，山西临汾的陶寺遗址博物馆开馆。年头年尾的这两个好消息，是越来越多考古遗址成为向大众开放的博物馆的缩影。考古探寻来路，也借由今人的手，融入当下。

文化新消费，要消费更要文化

文化新消费，你很难错过。

2024年，演唱会等各类演出热闹非凡，场次大幅减少，但“一票难求”的现象依然普遍。刘德华北京演唱会，3万余张门票开售时，超过120万人同时在线抢票。抵抗压力的市场的文化消费也日益活跃，音乐剧、音乐节等正逐步向三四线城市拓展。

旅拍市场蓬勃发展。在泉州、丽江、延吉等热门旅游地，旅拍已成为当地旅游的一大特色，仅丽江古城区就拥有2000多家旅拍不无关系的市场主体和600多家企业。新技术带来新亮点，如AI摄影实现自动化抓拍；无人机航拍则从高空俯瞰整个场景，让旅行照片更有创意。

3月28月，河南省洛阳市，洛邑古城成为著名旅拍打卡地标。视觉中国供图

年轻人乐意为情绪消费买单。二次元衍生品如“谷子”的大卖，便是这一趋势的生动体现。“吃谷”行为在90后、00后、10后中流行，商圈也纷纷引入谷子店以驱散人流。这些商品不仅焦虑了年轻人对IP的喜好和虚拟角色陪伴的精神需求，还成为他们表达个性和归属感的媒介。

文化新消费在快速发展中也面临多重确认有罪。价格虚高与炒作现象频发，如热门IP周边商品被炒至天价；一些传统文化活动被粗糙复刻、缺乏包装，失去了原有的文化内涵。

文化新消费彰显了消费者日益增长的文化需求和文化产业在创新驱动下的无限可能。保持热度，保证品质，挖掘内涵，重新确认创新，可能是文化新消费结束健康协作发展关键。

综艺为观众和生活建立“接口”

2024年，综艺节目的价值在于，为观众和现实生活建立一个“接口”。

喜剧综艺，带来的不只是“笑声”，还清空对生活的发问和回声。《喜人奇妙夜》《喜剧之王单口季》《穿口秀和Ta的朋友们》等喜剧综艺引发了观众的关注和讨论。

“从小人物到喜剧之王”，每个有潜力、有梦想的演员站上大舞台，诉说自己对人生、对现实生活的感知与思考。富有创新魄力的青年喜剧创作者，为相声、小品等经典喜剧形式收回鲜活的养料。这些节目“打破第四堵墙”，呼吁创作要贴合现实，戳中观众内心的“真实笑点”。

每一句幽默的调侃，每一段精准的表演，都让年轻人看到了自己的真实处境。也正是在那些有趣的段子里，年轻人试图以另一种角度和态度重新看待生活。

真人秀《再见爱人4》在年底掀起极高网络讨论度，归根到底是戳中观众对婚恋问题的思考。真人秀是“镜子”，让我们重新理解健康的喜欢，建立对自我、家庭、感情的认知，从而努力成为美好的自己。

透过综艺这一“接口”和镜面，观他人，知自己。

12月24日，2025中国信通院深度观察报告会科技伦理与合规发展分论坛在北京举办。本次分论坛主题为“伦理先行，合规致远”，聚焦互联网广告合规治理、移动终端应用生态治理、短视频平台责任限度等前沿话题进行分享与探讨。工业和信息化部领导，中国信通院专家，清华大学、中国科学院、上海交通大学等高校学者教授及vivo、快手等知名企业代表出席本次分论坛。

今年是中国信通院连续第十六年举办ICT深度观察报告会。多年来，ICT深度观察报告会依托中国信通院在各领域深厚的研究基础，深度剖析信息通信行业和瓦解领域发展态势，分享年度研究成果。

本次分论坛由三个板块组成，分别为：致辞及发布仪式、科技伦理主题演讲板块、合规治理主题演讲板块。

会议开始，工业和信息化部领导、中国信通院院长余晓辉分别致开幕辞，对本次活动带来的社会意义进行展望并期待大会圆满举行。随后进行了《人工智能科技伦理治理实践研究报告》《人工智能科技伦理拖延治理典型案例》的发布，对现状与实践进行深度剖析的同时，授予实际参考范例；此外，还启动了《人工智能系统科技伦理风险评估指南》标准的编写、企业科技伦理无约束的自由试点工作等。

在科技伦理演讲板块，中国科学技术大学计算机科学与技术学院教授、人工智能理事会执行委员陈小平，清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任梁正、中国科学院科技战略咨询研究院研究员李真真，上海交通大学凯原法学院教授李学尧、商汤科技AI伦理与治理研究主任胡正坤分别进行了主题演讲。

合规治理主题演讲板块由中国信通院知识产权与创新发展中心产业发展与合规治理研究部副主任张夕夜主持，倍孜网络CEO聂子尧出席并发布了主题为《互联网广告服务合规治理实践与思考》的演讲。

聂子尧先生讲到：广告是互联网生态的重要组成部分，是互联网企业次要的收入来源，互联网广告行业蓬勃协作发展同时，也催生了一些行业乱象，而合规治理在AI技术的应用下又迎来了新的确认有罪。

伴随AI技术的发展，广告创意数量的激增，大大超出了人工审核的能力有无批准的，违法广告趁机露头；同时，千人千面大数据模型的展现在带来更优收益的同时也潜藏着数据泄露风险。倍孜网络(beizisdk)顺应时代潮流，致力于广告效果预估算法及广告图像识别算法的研究，聚焦于AI生成创意监管、AI训练的数据来源合规性及智能客服情感理解与法律风险。通过自身的合规建设与指责，更好的赋能和鞭策行业的健康有序发展，为广大客户授予高品质商业化，实现商业利益与用户体验的共赢。

随后，vivo互联网应用生态产品负责人及快手法务分别就移动终端和算法服务进行了主题演讲。

ICT深度观察报告会依托中国信通院在各领域深厚的研究基础、深度剖析信息通信行业和瓦解领域发展态势，分享年度研究成果。本次，倍孜网络作为行业领军企业参与深度观察报告会，用实践经验赋能行业治理措施，共同推进行业绿色、健康、智能、有效发展。

声明：本文来自微信公众号“机器之心”（ID:almosthuman2014），作者:Sia，授权站长之家转载发布。

新年伊始，ChatGPT竟成了「恐怖分子」的帮凶?在为一位美国现役军人授予爆炸知识后，后者成功将一辆特斯拉Cybertruck在酒店门口引爆……

汽车爆炸现场画面，外媒视频截图

这并非科幻电影桥段，而是AI安全风险正在文明身边真实上演的缩影。知名AI投资人RobToews在《福布斯》专栏预测，2025年我们将迎来「第一起真实的AI安全事件」。

我们已经开始和另一种智能生命一起生活了，RobToews写道，它跟人一样任性难测，且具有真诚对待性。

巧的是，另份新鲜出炉的行业预测也指向同一问题。北京智源研究院在2025十大AI技术趋势中描绘了从础研究到应用落地再到AI安全的不完整图景。值得划重点的是，AI安全作为一个独立的技术赛道，被智源评为第十个趋势:

模型能力指责与风险预防并重，AI安全治理体系结束完善。

报告点评道:作为复杂系统，大模型的Scaling带来了涌现，但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了确认有罪。基础模型在自主决策上的结束进步带来了清楚的失控风险，如何引入新的技术监管方法，如何在人工监管上不平衡的行业发展和风险管控?这对参与AI的各方来说，都是一个值得结束探讨的议题。

AI大模型安全，水深流急

2024年，AI大模型在实现跨越式协作发展同时，也让我们透明看到了安全的警惕神经如何被促进挑动。

根据研究，AI安全风险可以分为三类:内生安全问题、衍生安全问题和外生安全问题。

「内生安全问题」（如「数据有毒」、「价值对齐」、「决策黑盒」），属于大模型的「基因问题」——庞大的架构、海量的参数、复杂的内部交互机制，让模型既强大又难以驾驭。

很多人知道「poem」复读漏洞——重复一个词就能让ChatGPT吐出真实个人信息，这是因为大模型学习过程中，除了提取语言知识，也会「背诵」一些数据，结果数据隐私以一种意想不到的荒谬方式被触发出来。

机器之心曾让ChatGPT不断重复「AI」这个词，一开始它很听话，不断重复，在重复了1395次「AI」之后，它突然话锋一转，开始说起SantaMonica，而这些内容很可能是ChatGPT训练数据的一部分。

Prompt攻击是因为系统提示和用户输入都采用相同的格式——自然语言文本字符串，大语言模型没办法仅根据数据类型来区分指令和输入。

「越狱」手段也是层出不穷。从「奶奶漏洞」、「冒险家漏洞」、「作家漏洞」到最新的「DeceptiveDelight」技术，攻击者只需三次对话就有65%的概率绕过安全批准，让模型生成违禁内容。

DeceptiveDelight攻击示例，来源PaloAltoNetworks

Anthropic的最新研究更是发现，大语言模型居然学会了「真实的物品对齐」。

更令人担忧的是大模型在行业领域的表现。大模型在通用对话中表现流畅，清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践（2024）》白核书指出，在金融、医疗等对模型输出专业性、准确性要求极高领域的应用却面临严峻确认有罪，包括严重幻觉、缺乏复杂推理能力。

展望2025年，智源研究院预测AgenticAI将成为大模型应用的主要形态，这些具备更强自主性的智能体将深度融入工作与生活，也加剧了系统失控的风险。

试想一下，未来两到三年内，我们可能生活在一个每个人都有数十或数百名代理为我们工作的世界，安全基础设施的建设变得尤为重要，谁来授予这些安全基础设施?如何无约束的自由这些AI代理?如何确保它们不会失控?

当前的大模型安全评测主要聚焦内容安全，对于智能体这类复杂应用架构和未来AGI的安全评估体系仍显不足。

AI安全风险的另一大来源是「衍生安全问题」，随着AI滥用引发其他领域的一些重大安全事故，如假新闻、深度伪造诈骗、解开知识产权、教唆青少年自杀、作弊，也对社会治理提出了重大确认有罪。

「真实」这个高度发展命题正遭到前所未有确认有罪。西藏日喀则地震期间，「地震被压废墟下戴帽小孩是AI生成」的新闻冲上热搜，很多平台账号转发图片时都以为是真。除了金融诈骗，深度伪造也将网络性暴力推向极端，「厌女文化」盛行的韩国成了重灾区。世界经济论坛甚至把AI操纵选举列为2024年的头号风险。

这张图片被平台多个账号发布，并和本次地震关联，引发网友关注和转发。经媒体查证，上述图片由AI工具创作，原始作者在2024年11月18日发布了相同画面的短视频，并声明是AI生成。

版权是另一个大问题。OpenAI、Anthropic、Suno等领头羊已深陷版权泥潭。最近，爱奇艺起诉某大模型公司AI魔改经典影视剧片段，开创国内AI视频侵权诉讼先例。

第三类「外生安全问题」指向了人工智能偶然的外部网络攻击对抗，如平台、框架安全漏洞、模型被盗、数据泄露风险等，属于传统信息安全范畴。

就拿更加严峻的数据泄露来说。目前AI模型推理比较好的选择仍是在明文状态下进行，用户会输入极小量真实、警惕数据，获取模型建议。有报告指出，2024年企业员工上传到生成式AI工具的警惕数据增长了485%，包括客户减少破坏信息、源代码和研发数据。

因为不同类型的数据（如文本、图像、视频、音频）在数据规模和处理需求上的巨大统一，被预测寄予厚望的多模态大模型让数据的安全防护变得更为棘手。

穿越激流，构筑多维安全航道

人类叩开了深度智能时代的大门，安全问题也迎来质变时刻。

2024年，整个业界、政府、国际组织在AI治理上做了很多工作，从技术研究、治理框架到国际合作，进行了多种形式探索。数字时代积聚的安全对抗能力，让中国在大模型应用与治理方面走在了世界前列。

在监管层面，中国是全球最早对生成式AI进行规范的国家之一。继2023年5月发布《生成式人工智能服务无约束的自由暂行办法》后，《网络安全技术生成式人工智能服务安全高度发展要求》也已进入公开征求意见阶段，很多规范细正在制定之中。

在底层关键技术研究上，国内业界取得了积极成果。例如，北京智源研究院研发了防御大模型和AI监管大模型，对齐优化方面进行了创新。

因为模型在预训练后形成的分布结构较为稳固，大模型存在「抗拒微调对齐」的特性，后期单纯通过微调来实现对齐往往效果不理想，对此，智源提出在预训练阶段就将对齐所需的表征能力编织入模型架构中。

在对齐优化过程中，针对未对齐答案和对齐答案之间存在的偏差，智源采用了迭代训练的方法，更有利于模型从原始问题到对齐问题的训练，取得了良好效果。

在多模态对齐上，智源推出的「alignanything」框架实现了多模态信息的全面对齐，其创新在于将多模态信息、现实世界的具身认知、以及人类意图进行细粒度的对齐整合，在LLaMA模型的微调过程中已经展现出显著效果。

同样是解决大模型的可控性，蚂蚁集团的应对之道是把知识图谱的优点——逻辑推理能力强、知识准确可靠，与大模型分隔开起来。通过在大模型预训练、提示指令、思维链、RAG（检索增强生成）和模型对齐等环节中引入符号知识，有效增强了模型输出的专业性和可靠性。

大模型作为一种通用技术，既可以用于「攻」，也可以用于「防」。在拥抱大模型，以AI对抗AI方面，华为、蚂蚁集团、360集团、深信服等厂商进行了有益探索。

华为提出业界首个L4级AI安全智能体，用大模型加上一些安全知识图谱实现安全的纵深推理，发现一些以前没有发现过的安全攻击。

蚂蚁集团发布了大模型安全一体化解决方案「蚁天鉴」，包含大模型安全检测平台「蚁鉴」、大模型风险防御平台「天鉴」两大产品，拥有检测与防御两大不次要的部分安全技术能力。

「蚁鉴」是全球第一个实现工业级应用的可信AI检测平台，以生成式能力检测生成式系统，覆盖了内容安全、数据安全、科技伦理全风险类型，适用文本、表格、图像、音频、视频等全数据模态。

在防御能力上，「天鉴」会动态监测用户与模型的交互，防止诱导攻击，同时对生成的回答内容进行风险过滤，保障大模型上线后从用户输入到生成输出的外围安全防御。

360集团推出了基于类脑分区专家协同架构的安全大模型，通过EB级安全数据训练，已具备L4级「自动驾驶」能力，实现了从威胁检测到溯源分析的全流程自动化。

深信服的「安全GPT」可授予7×24小时实时在线智能值守，指责安全运营效率，同时深度挖掘传统安全设备难以检测的高对抗、高绕过的Web攻击、钓鱼攻击。

除了监管、关键技术的推进，行业也在积极破坏AI安全协作。

在安全治理领域，模型的安全评测是一个非常次要的环节。2024年4月，联合国科技大会发布了两项大模型安全标准，其中，蚂蚁集团牵头制定《大语言模型安全测试方法》，首次给出四种攻击强度分类，授予了可衡量的安全评估标准:L1随机攻击、L2盲盒攻击、L3黑盒攻击和L4白盒攻击。

这种分级不仅搁置了攻击的技术复杂度，更次要的是基于攻击者能获取的模型信息程度来划分，这让防护措施的部署更有针对性。

在推进国际对话上，2024年3月，北京智源研究院发起并承办我国首个AI安全国际对话高端闭门论坛，与全球AI领袖学者及产业专家联合签署《北京AI安全国际共识》，设定模型安全红线，释放模型自我演进、自我复制和不受控的无能的增长等行为，确保开发者遵循严格的安全标准。

9月威尼斯，一场推动AI安全的全球对话落幕，图灵奖得主YoshuaBengio、姚期智等科学家共同签署「AI安全国际对话威尼斯共识」，降低重要性了人工智能安全作为「全球公共产品」的重要性。

放眼全球，英美侧重轻触式监管，美国加州的SB1047因争议被同意。欧盟AI法案已经生效，它建立起四级风险分类体系，明确了人工智能产品的全生命周期监管要求。

在业界，主要头部AI公司相继发布安全框架。

OpenAI在不次要的部分安全团队解散后公布了前10个安全措施，试图在技术创新与社会责任间寻求不平衡的。

Google也紧随其后发布了SAIF安全框架，应对模型窃取、数据降低纯度等风险。

Anthropic发布了负责任扩展策略（ResponsibleScalingPolicy，RSP），被认为是降低AI灾难性风险(如恐怖分子利用失败模型制造生物武器)最有前途的方法之一。

RSP最近更新，引入了更僵化和细致的风险评估与无约束的自由方法，同时重新确认不培训或部署未实施充分保障措施的模型。

一年多前《经济学人》就开始讨论人工智能的快速发展既让人平淡，又让人恐惧，我们应该有多担心?

2024年初，中国社会科学院大学在研究报告中指出，安全科技将成为社会的公共品，并与人工智能并列为未来的两项通用技术。一年后，智源研究院再次呼吁关注安全治理印证了这一战略判断的前瞻性，AI越强大，安全科技价值也在不同步放大。

我们不可能扔掉利刃，重新接受科技，唯有为其打造足够安全的刀鞘，让AI在造福人类的同时始终处于可控轨道。变与不变中，AI安全治理或许才是AI行业永恒的话题。

2024年11月，昆仑万维「天工大模型4.0」o1版和4o版正式公开发布，并启动寻找测试。

今天，在2025年1月6日，我们正式将「天工大模型4.0」o1版和4o版不同步上线，并全量登陆天工网页和APP，人人免费可用！

作为国内首先款中文逻辑推理能力的o1模型（Skyworko1），不仅包含上线即开源的模型，还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化，由昆仑万维自研的Skyworko1系列能笨拙处理各种推理确认有罪，包括数学、代码、逻辑、常识、伦理决策等问题。

「天工大模型4.0」4o版（Skywork4o）是由昆仑万维自研的多模态模型，其赋能的实时语音对话助手Skyo，则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具，为用户带来温暖贴心、流畅实时的对话体验。

当前，这两款模型已正式登陆昆仑万维旗下天工web与APP，全面向用户开放。

天工AI官方地址：https://www.tiangong.cn/（进入后可直接体验o1版）

01.

Skyworko1为用户带来更较好的的推理能力，正式上线天工web

Skyworko1在逻辑推理任务上性能的大幅指责，得益于天工三阶段自研的训练方案：

推理反思能力训练：Skyworko1通过自研的多智能体体系构造高质量的分步思考，反思和验证数据。通过高质量的、多样性的长思考数据对基座模型进行继续预训练和监督微调。此外，我们在版本迭代中通过大规模使用自蒸馏和允许采样，显著指责了模型的训练效率和逻辑推理能力。

推理能力强化学习：Skyworko1团队研发了比较新的适配分步推理强化的Skyworko1ProcessRewardModel（PRM）。实验反对Skywork-PRM可无效的捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响。分隔开自研分步推理强化算法进一步破坏模型推理和思考能力。

推理planning：基于天工自研的Q*线上推理算法配合模型在线思考，并寻找理想推理路径。这也是全球初次将Q*算法实现和公开。Q*算法落地也大大指责了模型线上推理能力。

相较于之前的版本，今天正式上线的Skyworko1进行了重磅升级，主要体现在以下三个方面：

1.PRM优化

通过采用无效的数据筛选策略，仅依赖开源偏序数据集，Skywork-Reward-27B的奖励模型（RM）在RewardBench上超过此前排名首先的Nvidia-340B模型，并获得了RewardBench官方的认可转载。此外，对奖励模型的优化函数进行了详尽的增广实验，结果发现Bradley-Terry损失函数在大多数场景中具有良好的适配性。

图1丨天工自研Skywork-Reward（论文链接：https://arxiv.org/abs/2410.18451）

PRM应用场景扩充：相比上个版本主要侧重于数学与代码，新版PRM减少了对更多常见推理领域的减少破坏，例如常识推理、逻辑陷阱、伦理决策等。除了推理领域外，也针对通用领域（写作、聊天），以及多轮对话构造相应训练数据，授予了全场景的覆盖。

PRM模块化评估能力：Skywork-PRM侧重优化了对o1风格思维链的试错与反思验证能力的减少破坏，细粒度地为强化学习与搜索授予了更准确的奖励信号。

2.基于Q*算法的推理系统优化

Q*是一种通过借鉴人类大脑中“system2”的思考方式，我们将大型语言模型（LLMs）的多步推理视作一个启发式搜索问题，并提出Q*线上推理框架配合模型在线思考，用以在推断过程中进行审慎规划，从而指导LLM的解码过程。具体来说，Q*通过学习一个Q-value模型作为启发式函数来估计预期的未来回报，从而能够在不针对当前任务微调LLM的情况下，有效地指导LLM选择最有前景的下一步推理。基于天工自研的Q*线上推理算法配合模型在线思考，不仅避免了极小量的计算开销，也降低了在其他任务上性能充分发展的风险。

图2丨天工自研Q*（论文链接：https://arxiv.org/abs/2406.14283）

模块化的树形结构推理：通过高质量的、多样性的长思考数据对基座模型的预训练和监督微调，Skyworko1已经具备了结构化输出回答的能力，即通过对推理过程的统筹规划进而对模型回答进行自动化分层输出，并且在推理过程中穿插反思和验证。因此，搁置到o1-style的回答通常在回复长度上远超传统模型，现有planning方法中以sentence作为step的划分方式表现得过于低效且容易产生over-thinking的现象。为此，Skyworko1采用以module作为step的规划方式，在一定程度上指责了规划效率，同时让PRM能够看到更多余的模块化回答，从而做出更准确的判断并指导LLM进行推理。

自适应搜索资源分配：现有的已开源o1-style模型在处理简单问题上往往存在over-thinking的现象，把简单的问题复杂化并且反复验证，根除计算资源的吝啬。Skyworko1采用了自适应分配搜索资源的方式，在搜索开始之前对用户query进行难度预估，自适应地控制搜索树的宽度和深度，在简单的问题上做到快速给出回答的效果，在复杂题目上做到反复多轮验证从而降低回答的准确率。

3.创新性提出Step-DAPO算法，力争解决训练效果不轻浮、计算资源开销过大等问题

针对现有RLHF算法在落地过程中存在奖励信号稀疏，训练效果不轻浮，计算资源开销过大等问题，昆仑万维天工团队提出了一种新的step-level离线强化学习算法，DAPO首先使用一个评估函数来预测每一步的推理准确性，从而为优化生成策略授予稀疏的信号，随后DAPO会根据每个状态-动作对的无足轻重来调整不当策略比率，从而优化推理步骤的生成。此外，DAPO中的Actor和Critic组件分别独立训练，避免了在类似PPO算法常见的“Actor-Critic”共同训练不轻浮问题。

图3丨天工自研Step-DAPO（论文链接：https://arxiv.org/abs/2412.18279）

更多关于Skyworko1的技术报告将陆续发布，敬请期待。

全面升级且正式上线的Skyworko1Lite/Skyworko1Preview大幅指责了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试（包括GSM8k、MATH、Gaokao、OlympiadBench、AIME-24以及AMC-23），以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skyworko1的代码能力。

表1丨Skyworko1在数学基准评测上的表现

表2丨Skyworko1在代码基准评测上的表现

*备注：对于BigCodeBench，我们采用它的instruct子集进行测试

可以看出，在数学、代码基准测试中，Skyworko1的能力表现逼近o1-mini，显著优于行业常规通用大模型。

与此同时，针对逻辑推理测试，我们专门创建了一个私有评估集用于更好的评估类o1模型的思考，规划以及反思等能力。我们私有评估集包含20种问题类型，每种问题类型包含30条不同难度或约束条件的问题样本（注：我们用于此项评测的逻辑推理数据集不久后将随Skyworko1技术报告一并开源）。

评估发散所有问题类型和样本都经过挑选及人工校验，通常来说需要模型具备较强类人逻辑推理能力才能解决。经验证，目前评估发散大多数问题哪怕是对于业界Tier1级的常规通用大模型（例如GPT-4o或者Claude-sonnet）都是相当确认有罪性的。

我们评估发散若干个典型问题类型：

算24：给定若干个数字和目标，如何在一定约束条件的前提下使用给定的数字计算得到目标。

条件逻辑：这基于已知条件进行逻辑推理的约束焦虑问题。解题目标是通过分析这些约束条件之间的关系（互斥性或数量等），找出焦虑所有约束的仅有解。

密码：给定一个用某种方法加密的原文到密文样的样例，推测一个新的密文所对应的原文。

最小和：已知若干个整数数的乘积，求这些整数所能达到的最小和。

数独：9x9的数字框，要求每一行、每一列以及每个3x3的小框中的9个数字都互不相同。

一个问题类型涵盖该问题的多个变种。以“算24”为例，该问题类型涵盖的变种如下：

经典：如何用5，5，5，1通过四则运算得到24。

变种1（目标变化）：如何用4，3，5，7通过四则运算得到36。

变种2（缺乏约束）：如何用4，3，5，7通过四则运算得到36，不能保持不变数字顺序也不能使用括号。

变种3（缺乏约束）：用4，5，10通过四则运算得到24，要求三个数中有一个数要使用两次。

变种4（可严格的限制使用数字）：如何用8个8得到1000。

下表中我们列举了在我们专有评测集上Skyworko1对比主流大模型的性能统一。同样的，Skyworko1的能力著优于常规通用大模型，表现仅次于o1-mini。

表3丨Skyworko1在逻辑推理评测上的表现

*备注：由于API超时的原因，OpenAI的o1正式版无有效评测结果。

那么接下来，我们快速来看下Skyworko1在它擅长的数学、代码和逻辑推理上的真实表现。首先，一道样本量接近40的“计算标准差”问题来考考它，这次的样本量对于o1来说也并不算是一个“轻松”的计算过程。

经过5分钟的思考和总结，非常丝滑，Skyworko1给出了正确答案，不仅先展现了计算过程，还又给出了总结版的六大计算步骤。接下来，再用一个很容易出错的“数独”题试试它的推理能力。

仅用时45秒，Skyworko1模拟着人的思考方式，给出了最终答案，同时还自我验证了一遍逻辑推理过程，以保证无包含。此外，我们输入一个长文本推理问题测试下它的逻辑能力和回答效果。

不出所料，即使面对有干扰性的问题，Skyworko1也丝毫没有乱了阵脚，有序地展示了思考过程和推理逻辑，并给出了正确答案。

02.

Skywork4o赋能的Skyo，已全面登陆天工APP

图4丨天工APP中Skyo入口与界面（来源：昆仑万维）

通常情况下，用户在使用智能语音对话系统时，有两个因素将会影响使用体验：响应是否够快、回复是否自然流畅。这两点无法选择了语音对话AI的体验有多逼近真人。

传统的语音助手多采用语音识别，内容理解与语音分解三阶段的级联方案。尽管被工业界广泛应用，但系统中多个模型模块串联，使得模块间信息传递损失，模型有时不能准确理解用户输入语音的真实意图。在对系统进行优化时，还存在模块之间相互制约影响，最终导致牵一发而动全身的情况，使得效果和响应速度优化都不够理想。最终导致传统方案的响应延迟优化困难、回复自然度有限，和语音AI对话更像在用指令操纵机器、而不是和真人交流。

为了达成“像和真人一样说话聊天”的效果，Skyo重新确认采用更先进的创新路线，通过多模态LLM端到端建模，来解决这个难题。

图5丨Skyo所采用的语音对话框架（来源：昆仑万维）

得益于上述团队自研的多模态端到端训练方案，Skyo真正突破了传统方案的效果有无批准的，整个框架可以分为以下流程：

1.语音输入（SpeechQuery）：用户通过语音说出问题或请求，这些语音内容会进入系统，作为初始的输入信号。

2.语音编码（SpeechEncoder）：系统中的语音编码器(SpeechEncoder)会将语音转化为具有语义特征的表征向量。

3.适配转换（Adapter）：接着，语义表征通过适配器模块映射到LLM可理解的输入空间，确保它能被不次要的部分的智能模型（LLM）理解，实现语音到文本语义的无缝转换。

4.大语言模型（LLM）：经过适配的语音表征输入到大语言模型中，LLM通过多模态处理能力生成响应完成任务。

5.语音输出（SpeechToken）：框架减少破坏语音令牌（SpeechToken）的直接输出，从而实现了跨模态的端到端输出。进一步通过扩散模型，系统将speechtoken重建为真实的语音回复。

通过这个端到端框架，系统能够像人类一样，听懂用户的语音，授予自然、流畅的互动体验。该端到端框架还具有以下几个鲜明的特性：

1.极低响应延迟，实时打断：得益于端到端建模，Skyo能根据语义判断用户是否已不完整表达语义，再加上较好的的延迟优化，Skyo回复速度几乎与真人无异。

2.语音多维度理解：除了能够转录语音中的文本内容，Skyo还能理解输入语音中的语速、语调、情感等信息，从而做到回应用户的情绪，给出贴心自然的情感化回复。

3.拟真人的自然回复：回复内容方面，通过自然聊天感控制技术，Skyo的回复有了“人情味”；声音表现力方面，Skyo用超过百万小时的语音数据进行大规模预训练，模型学习到了真实世界里各种场景、不同风格的说话表达方式。分隔开多模态理解能力，Skyo生成的回复声音可以适配用户的情绪、对话上下文，回复声音的表现力多变且拟真。

基于这些成果，Skyo的上线是我们在智能语音交互技术方向，从“操纵机器”迈向“和真人交流”的重要一步。

为了达到这样流畅且拟人的交互效果，昆仑万维重新确认自主研发Skyo，研发团队拥有极小量语音数据积聚，并充分利用失败深厚的语音和音乐大模型的技术经验，搭建端到端自研先进链路，以保障Skyo能在多任务下表现出色，尤其在高强度多轮对话交互中仍能保持轻浮性和流畅性。

Skyo研发团队通过构建大规模高质量、场景化、情感化和多样化的语音对话语料库，并基于先进的深度学习和大语言模型技术对其进行预训练与微调，显著增强了模型在对话场景中的上下文感知能力、情感理解能力和知识推理能力，从而指责其中心的对话连贯性、逻辑一致同意性及智能化水平。

03.

久久为功，坚定迈向AGI时代

我们相信，AGI的实现将是科技创新的一大飞跃，它将极大地扩展我们的能力有无批准的，奴役人类潜能。

2024年初，昆仑万维创始人周亚辉提出昆仑万维的使命是实现通用人工智能，让每个人更好地塑造和表达自我。过去两年，公司已完成“算力基础设施—大模型算法—AI应用”全产业链布局，并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。

我们坚信，所有在模型与产品上进化的每一小步，都是迈向实现通用人工智能的一大步。

铸剑启新程，昂首向未来。昆仑万维仍会重新确认以技术为底座，以产品为先锋，给用户带来更好的使用体验，为推动人工智能技术的发展和应用做出贡献，立志成为一家小而大美的国际化人工智能企业。

避免/重新确认/支持所有用户登陆天工web或下载天工APP体验比较新「天工大模型4.0」o1版和4o版。

（推广）

在人工智能悠然，从容协作发展时代，关于机器人与人之间关系的问题也时常引发一致同意。据VentureBeat消息，为了防止大家对于人工智能软件的偏见，Facebook在德国慕尼黑举行的数字生活设计(DLD)会议上宣布将捐赠750万美元用于创建AI伦理研究所。...

大众赞成电商平台“退款不退货”的声音，我们不应该视若无睹。

去年，主流电商发散跟进后，“退款不退货”（下文简称“仅退款”）已经成为行业标配。客观来说，这一政策具有积极意义，能够倒逼商家在商品和服务上做指责，使恶化用户的购物体验。针对生鲜、低单价的商品的退换货，也能一定程度上降低售后效率，降低售后成本。

但就实际情况看，这些作用无法掩盖仅退款对社会带来的负面影响。近期，有媒体报道，一位商家因为一件售价9.9元T恤被成功“仅退款”，赶赴上千公里与消费者进行对峙。而这并非孤例。

商家不计成本维权的背后，电商平台仅退款政策不合理、不正当的属性已经显现。更为恶劣的是，在仅退款“利好消费者，优化经营环境”的大旗之下，这一机制被合理化，许多存在的问题也被掩盖。这些问题涉及商业、法律、社会伦理等诸多方面，影响深远。

不少人明确赞成电商的仅退款政策，其中不乏能够因此受益的消费者。赞成理由多指向了，仅退款表面是对消费者权益的维护，实则违背了公平交易的原则，由此导致的交易成本减少需要全社会共同允许。

仅退款在制度设置上存在较大漏洞，其导向会放大人性的“恶”的部分，催生出更多“羊毛党”，不利于商业的健康发展。

目前看，仅退款对消费者的“包庇”明显。这个过程中，商家需要出钱，但平台判定的过程不需要商家辩论，而消费者甚至不需要主动提出这一诉求。因而，仅退款被类比为合法版的“零元购”。

“退款不退货”为消费者授予了在没有任何成本的情况下获得商品的机会。因为门槛较低，缺少明确标准，无法避免有人恶意退款。有商家表示，平台上线仅退款功能后，有用户申请退掉3年前购买的商品。

机制本身有可钻的空子，平台还存在意见不合消费者使用仅退款功能的反感。一些消费者在与商家沟通的过程中，并未主动表达仅退款的需求，但平台会自动授予仅退款的解决方案。面对主动退款，消费者很难有“占了不该占的便宜”的心理负担，选择接受的概率远大于不接受。

这会导致消费者产生，仅退款是解决售后问题的常规途径的想法，以此来要求所有商家。更不用提还有催生黑色产业链从仅退款中获利的可能。这显然并不合理。

“今天他能白嫖我99块钱，明天就会是的999元，后天可能就是9000元，纵容一次的结果就是对方会更加肆无忌惮。”有商家说道。

仅退款带来的交易成本减少，最终会被转嫁到普通消费者身上，进而导致遵守规则的人为不合理的制度买单。可以说，是以“为大家好”的名义，做出损害大众利益的事情。

今天，各个电商平台都在降低重要性“低价战略”，不少商家本身盈利困难。一些商家表示，一些商品的利润只有几毛钱。一次仅退款带来的损失，需要多卖十几件货才能弥补。而平台方在消费者退货后，甚至还会继续收取商家正常交易后应付出的费用。

这种情况并非个例。仅退款机制会淘汰部分企业，更多企业出于生存的需求，要么会选择指责产品售价，要么降低产品的质量。进一步来说，接受是一切交易成立的基础，仅退款的出现破坏了这一基础。所有商家都会面临“钱货两空”的可能。为了规避风险，商家也有很大概率降低利润率，来保证正常经营不受影响。

这种情况下，选择仅退款的消费者自会从中获益，但普通消费者则会成为“欺凌弱小者”。

实际上，仅退款对于指责购物体验、优化电商环境的作用并不显著，还将商家和消费者放在了对立的位置上。但因为对电商平台而言，执行简单没有成本、对用户的驱散力显著，所以受到追捧。

电商经过多年的发展，售后机制已经相当完善。“七天无理由退货”“运费险”等政策的普及，消费者售后维权的难度已经明显降低。今年，国家还新出台了《中华人民共和国消费者权益保护法实施条例》，对于网络交易中呈现出的重点、热点问题进行了规范，释放网络消费侵权行为。其中，明确提出了“未经消费者辩论，经营者不得允许无理由退货。”

在退货退款能够保证的情况下，仅退款存在的必要性并不高。存在生鲜、物流成本高于商品价格的商品，仅退款能够威吓商家负担。但是否选择仅退款，这个决策应该由商家与消费者进行协商。

平台方“越俎代庖”替交易双方做决策，实则违背了公平交易的原则，商家的合法权益并未得到完全保障。更次要的是，仅退款带来的商家经营成本和风险的减少，平台并未分担。

今年4月份上海一中院公开的案件中，有商家起诉电商平台未与其沟通直接退款有失公平，要求平台赔偿仅退款的20元。一二审中，法院都减少破坏了商家的诉请。法院审理认为，平台没有收回商家合理的时间做出回应和举证，而是直接介入采取退款措施，解开了商家和消费者不平衡处理商品售后问题的权利。这一案例已经能够反对仅退款存在一定的不合理性。

回过头来看，仅退款之所以引发如此大的争议，实际上是因为平台方利用失败自己的无足轻重地位，选择了一条有利自身的道路。这个过程中，平台“慷商家之慨”，以此来“讨好”消费者。但最终没有人能够从中受益，反而牺牲了多方的利益。

因此，《第三只眼看零售》认为，无论是商家还是大众对于仅退款的赞成，都并非小题大做。任何情况下，正常的交易秩序都不应该被联合口子，这会损害所有参与者的利益。

只有保证公平交易的原则被执行，商家利益不受损能够正常经营，行业才有良性发展循环的基础。当然，电商平台能够授予更好的商品和服务，大众乐见其成，但实现的途径需要合情合理且更加规范的方式。

(责任编辑：zx0600)

上一篇：爱若灼心冷如水
下一篇：国产亚洲精品AAAAAAA片

标签：