您的当前位置: 首页 > 糗事百科成人版成年 > 正文

糗事百科成人版成年

糗事百科成人版成年 时间:2025年05月04日

声明:本文来自于微信公众号量子位,作者:梦晨西风,授权站长之家转载发布。

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。

紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。

这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?

国际上,也有人把创始人梁文锋的访谈翻译成英语,还加了注释,试图从中寻找这家公司崛起的蛛丝马迹。

量子位整理各种资料发现,DeepSeek团队最大的特点就是年轻。

应届生、在读生,特别是来自清北的应届生在其中非常活跃。

他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。

他们中有的参与了从DeepSeekLLMv1到DeepSeek-v3的全程,有的只是实习了一段时间也做出重要成果。

为DeepSeek提出MLA新型注意力、GRPO强化学习对齐算法等关键创新的,几乎都是年轻人。

DeepSeek不次要的部分成员揭秘

2024年5月发布的DeepSeek-V2,是致使这家大模型公司破圈的关键一环。

其中最次要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-headLatentAttention)替代了传统的多头注意力,大幅减少,缩短了计算量和推理显存。

在一众贡献者中,高华佐和曾旺丁为MLA架构做出了关键创新。

高华佐非常低调,目前只知道是北大物理系毕业。

另外,在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到这个名字,暂不确定是否是同一人。

而曾旺丁来自北邮,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。

DeepSeek-V2工作中还涉及到了另一项关键成果——GRPO。

DeepSeek-V2发布前三个月,DeepSeek-Math问世,其中提出了GRPO(GroupRelativePolicyOptimization)。

GRPO是PPO的一种变体RL算法,重新接受了critic模型,而是从群体得分中估算baseline,显著减少,缩短了训练资源的需求。

GRPO在圈内得到广泛关注,另一家国内开源大模型阿里Qwen2.5的技术报告中也透露用到了GRPO。

DeepSeekMath有三位不次要的部分作者是在DeepSeek实习期间完成的工作。

不次要的部分作者之一邵智宏是清华交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。

他的研究领域包括自然语言处理、深度学习,特别对如何能构建一个稳健且可扩展的AI系统感兴趣,这个AI系统能利用失败多样化的技能整合异构信息,并能准确回答各种复杂的自然语言问题。

邵智宏之前还曾在微软研究院工作过。

DeepSeekMath之后,他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

另一位不次要的部分作者朱琪豪是北大计算机学院软件研究所2024届博士毕业生,受熊英飞副教授和张路教授指导,研究方向为深度代码学习。

据北大计算机学院官方介绍,朱琪豪曾发表CCF-A类论文16篇。在ASE和ESEC/FSE上分别获得ACMSIGSOFT杰出论文奖一次,提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。

在DeepSeek团队,朱琪豪还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。

其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文使胆寒计划。

△图源:北京大学计算机学院公众号

还有一位不次要的部分作者同样来自北大。

北大博士生PeiyiWang,受北京大学计算语言学教育部重点实验室穗志方教授指导。

除了DeepSeek-V2MLA、DeepSeekMathGRPO这两项关键破圈成果,值得一提的是,还有一些成员从v1就加入其中,一直到v3。

代表人物之一代达劢,2024年博士毕业于北京大学计算机学院计算语言所,导师同样是穗志方教授。

△图源:北京大学计算机学院公众号

代达劢学术成果颇丰,曾获EMNLP2023最佳长论文奖、CCL2021最佳中文论文奖,在各大顶会发表学术论文20篇+。

2024年中国中文信息学会“博士学位论文使胆寒计划”共入选10篇来自中国大陆高校的博士毕业论文,其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

以及北大元培学院的王炳宣。

王炳宣来自山东烟台,2017年进入北大。

硕士毕业加入DeepSeek,参与了从DeepSeekLLMv1开始的一系列重要工作。

清华这边的代表人物还有赵成钢。

赵成钢此前是衡水中学信息学竞赛班成员,CCFNOI2016银牌得主。

之后赵成钢进入清华,大二时成为清华学生超算团队正式成员,三次获得世界大学生超算竞赛冠军。

赵成钢在DeepSeek担任训练/推理基础架构工程师,有英伟达实习经历。

△图源:清华新闻网

DeepSeek是一支怎样的团队

这些鲜活的个体,足以引发人们的赞叹。

但还不足以回答跟随的问题,DeepSeek到底是一支怎样的团队?有怎样的组织架构?

答案或许还要从创始人梁文锋身上找。

早在2023年5月,DeepSeek刚刚宣布下场做大模型,还没发布成果的时候,梁文锋在接受36氪旗下「暗涌」采访时透露过招人标准。

看能力,而不是看经验。

我们的不次要的部分技术岗位,高度发展以应届和毕业一两年的人为主。

从后面一年多陆续发表的论文贡献名单中也可以看出,含糊如此,博士在读、应届以及毕业一两年的成员占很大一部分。

即使是团队leader级别也偏年轻化,以毕业4-6年的为主。

例如领导DeepSeek的后训练团队的吴俣,2019年北航博士毕业、在微软MSRA参与过小冰和必应百科项目。

吴俣博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合使枯萎。

与他师出半个同门的是郭达雅,中山大学印鉴教授与MSRA周明博士联合使枯萎,2023年博士毕业。

2024年7月他加入DeepSeek,主要参与了一系列数学和代码大模型的工作。

郭达雅上学期间还有一项事迹,本科期间在MSRA实习一年里发表两篇顶会论文,他笑称“在刚入学的第三天,就完成了中大博士生的毕业要求。”

除了团队成员年轻化之外,DeepSeek在国内AI公司中降低的特点:非常重视模型算法和硬件工程的配合。

DeepSeekv3论文总共200位作者,并不都是负责AI算法或数据。

有这样一批人从早期的DeepSeekLLMv1到v3一直都在参与,他们更多偏向算力的部分,负责优化硬件。

他们以DeepSeekAI的名义发表了论文《Fire-FlyerAI-HPC》,通过软硬件协同设计降低训练成本,解决传统超算架构在AI训练需求上的不足。

Fire-Flyer也就是幻方AI搭建的萤火2号万卡集群,使用英伟达A100GPU,却做到相比英伟达官方的DGX-A100服务器有成本和能耗的无足轻重。

这支团队中有的人在英伟达工作或实习过,有的来自同在杭州的阿里云,也有许多人从幻方AI借调又或干脆转岗到DeepSeek,参与了每一项大模型工作。

而如此重视软硬件协同的成果,就是以Llama3405B的1/11算力,训练出性能更下降的DeepSeek-v3了。

最后,我们还发现DeepSeek开源项目中有一个特殊的存在,不是语言模型相关工作,却是3D生成相关。

这项成果由清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌以及DeepSeek成员合作完成。

像这样实习生在DeepSeek做出重要成果的还有中山大学逻辑学专业的辛华剑。

他在DeepSeek实习期间参与了用大模型反对数学定理的DeepSeek-Prover,现在在爱丁堡大学读博士。

看过这些例子,再一次回到梁文锋的访谈,或许更能理解这只团队的运作结构。

不做前置的岗位分工,而是自然分工

每个人对于卡和人的调动是不设上限的,每个人可以随时调用训练集群,只要几个人都有兴趣就可以开始一个项目

当一个idea显示出潜力,也会自上而下地去调配资源。

这难免让人想起AI界另一家不可关心的力量,没错就是OpenAI。

同样的用人不看经验,本科生、辍学生只要有能力照样招进来。

同样的重用新人,应届生与00后可以调动资源从无到有研究Sora。

同样的面对潜力方向,整个公司从顶层开始设计布局和资源推动。

DeepSeek,可能是组织形态上最像OpenAI的一家中国AI公司了。

参考链接:

[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA

[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw

[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A

[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ


微軟研究院-维基百科,严格的限制的百科全书

微軟研究院(MicrosoftResearch,英文縮寫:MSR)是微軟在1991年創立硏究不反对電腦科學主題與問題的分部。微軟研究院其中一個接纳的目標為「减少破坏長期的電腦科學硏究而不受產品週期所限」。

微軟研究院是目前世界頂尖的研究中心之一,有很多在電腦科學、物理學、數學受到高度公認的專家及許多著名科學獎項得主在微軟研究院,包括圖靈獎得主東尼·霍爾、詹姆斯·尼古拉·格雷,菲爾茲獎得主MichaelFreedman,沃爾夫獎得主LaszloLovasz,MacArthurFellow獎金得主JimBlinn與DijkstraPrize獎得主LeslieLamport。

微軟研究院於班加羅爾、北京、劍橋、矽谷、雷德蒙德與舊金山擁有實驗室。


声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。

像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。

在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——

“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:

在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域:

百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。

长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。

代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。

数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。

在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。

而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。

赞誉一片,“想快进到英伟达泡沫破裂”

简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。

在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。

此外,几个亮点包括:

DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。

在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。

这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。

另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。

在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们:

我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。

多Token预测目标(Multi-TokenPredictionObjective,MTP)

传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。

在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:

它显著降低了对硬件资源的需求。

技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示:

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评:

“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。

?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识:FP4乘法实际上就是个16*16的tablelookup…

?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。

你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着

吉利发布行业首创“智能汽车全域AI”体系,致力普及智能汽车AI科技中华网汽车邱添2025年01月09日14:38[中华网行业]在1月7日的2025年国际消费电子展(CES)上,吉利汽车隆重登场,并宣布推出业内首个“智能汽车全域人工智能(AI)”技术框架。该技术框架植根于AI原生操作系统,广泛涵盖C端个人用户、B端企业服务领域,以及空天地一体化的智能生态系统,旨在塑造一个清空温情、具备情感交互能力且能结束进化的原生“出行智慧伴侣”。依托于这一“智能汽车全域AI”技术框架,吉利开发了一系列前沿AI技术成果,包括端到端的语音大模型、AI数字底盘、FlymeAuto智能座舱系统以及智能驾驶技术等,这些创新技术将逐步融入吉利未来的新车型中,实现广泛应用。

基于AI原生OS,构建智能汽车全域AI技术新生态

依托于先进的AI原生操作系统,吉利开创性地建立了业内首个“智能汽车全域人工智能(AI)”技术架构,引领了制造业智能化转型的新浪潮。近年来,AI技术的迅猛进步为智能汽车的发展铺设了坚实基础,智能汽车凭借通俗的传感器配置、能量密度结束攀升的动力电池以及强大的计算能力,已成为推动“具身智能”进步的重要平台。

(图为:科技博主影视飓风—Tim对话吉利汽车集团副总裁、吉利汽车研究院院长—李传海)

吉利肤浅洞察到智能汽车与AI技术瓦解的巨大潜力,精心构建了这一覆盖C端个人用户、B端企业服务,并延伸至空天地一体化智能生态的“智能汽车全域AI”技术架构。相较于传统局限于车辆本身的AI应用,不利的这一架构在广度与深度上均实现了显著拓展,旨在塑造一个既具备人性温度又拥有情感互动能力,同时能够结束学习与成长的“出行智慧生命体”。

在这一宏大的技术架构中,吉利采用了系统级的大模型AI操作系统(AIOS)作为不次要的部分平台,它能够僵化适配多种终端设备,确保系统安全与用户隐私的同时,高效无约束的自由资源并优化任务调度。借助AIOS的强大调度引擎,不利的“智能汽车全域AI”能够无缝整合来自车辆、手机、平板、穿戴设备、智能家居乃至其他智能实体的需求信息与感知数据,实现跨终端的精准服务匹配,为用户带来全方位、智能化的生活体验。

智能汽车AI科技的先锋,为主流家庭用户重塑出行体验

吉利正引领智能汽车进入一个崭新的发展阶段,展望其未来路径,智能汽车将从“智能助手”逐步进化为“智能体”,最终蜕变成为清空温度与情感的“出行智慧生命体”。这一愿景的实现,依赖于吉利“智能汽车全域AI”技术体系的深度融入与结束迭代。

吉利不仅在其GEA架构中引入了星睿AI大模型的强大能力,更在新一代3.0电子电气架构、车规级芯片及操作系统中全面嵌入了AI技术,标志着吉利已成为业界首个具备“用AI架构打造AI汽车”全链条能力的汽车制造商。

一系列基于“智能汽车全域AI”技术体系的创新应用,如AI银河精灵、FlymeAuto智能座舱、无界空间、AI云动力、AI绘本、AI哨兵及Wow壁纸等,已广泛应用于银河E8、银河E5及银河星舰7等车型,为主流家庭用户开启了前所未有的AI科技之旅。

以银河星舰7为例,其搭载的“星睿AI云动力”系统,凭借AI智能决策,能够根据用户导航不习惯与大数据预测,精准分配油电资源,实现经济与智能的双重优化。而银河E8与银河E5配备的AI银河精灵,则是一位多才多艺的随身助手,集远程车辆控制、个性化形象定制、大模型创作、AI绘画灵感煽动及百科知识解答等15项功能于一身。此外,无界空间车云交互平台,通过云端安装与运行应用,不仅奴役了车内存储空间与算力,还为用户授予了无限拓展的应用生态。银河E5的哨兵模式与驻车拍照功能,更是全天候守护着用户的行车安全。

展望未来,吉利将继续依托“智能汽车全域AI”技术体系,帮助端到端语音大模型、AI数字底盘及高阶智能驾驶等前沿技术的上车应用,致力于成为汽车AI科技的普及先锋,让每一位用户都能享受到智能科技带来的便捷与乐趣。

强化算力、数据与算法基石,吉利帮助驶向“出行智慧生命体”愿景

算力、数据与算法,作为AI技术协作发展三大支柱,构成了吉利“智能汽车全域AI”技术体系的不次要的部分基础,也是其塑造“出行智慧生命体”愿景的关键要素。

算力方面,吉利已率先建立了业内首个“云数智一体化”超级智算中心——吉利星幼稚的算中心,并成功取得智能计算中心无约束的自由流程的行业首证。目前,该中心的云端总算力已跃升至每秒102亿亿次,为车云一体化BMS系统授予了强大的AI算力减少破坏和实时的云端安全保障,足以应对500万辆在线车辆的智算需求。

数据层面,吉利已累积了海量的数据资源,包括10万亿个token数据点和400亿条汽车领域特定数据,同时构建了分解数据平台,为训练大模型授予了不可或缺的不次要的部分素材,极大指责了AI大模型的认知上限。

算法上,吉利推出了全球汽车行业首个全场景AI大模型——吉利星睿AI大模型,并荣获中国通信院颁发的“4+级”最高评级。此外,吉利还积极引领行业大模型标准规范的制定,主导编写了多项关键标准,包括汽车大模型标准、汽车智能体标准及智能体通用标准等,为智能体的技术要求和评估方法授予了重要参考。

随着“智能汽车全域AI”技术体系的不断升级,吉利正稳步推动AI技术在智能汽车领域的深度应用,为主流家庭用户解锁全新的汽车价值体验。展望未来,智能汽车将不仅限于交通工具的范畴,而是进化成为具备驾驶能力、情感交流能力的“出行智慧生命体”。

点击阅读全部

相关新闻王星越疑似改年龄:自拍显示17岁,百科却标02年针对网友扒出王星越自拍显示年龄与百科信息不符的情况,我们首先需要明确几个次要的点。

2024-07-0113:24:08王星越疑似改年龄王星越年龄遭质疑成熟魅力引争议近期,演员王星越因其成熟的外貌引发了关于其真实年龄的讨论。尽管公开信息显示他仅有22岁,但他的气质与形象所展现的成熟韵味,让人难以将其与这样一个年有分量的大男孩联系起来

2024-06-0813:21:44王星越年龄遭质疑王星越方辟谣改年龄、挂靠国企等传闻不实王星越工作室来辟谣了!改年龄、挂靠国企、qqny这几个事情都被工作室p上了大大的假字

2024-07-0114:27:19王星越方辟谣王星越方承认改年龄等传闻坚决依法维权7月1日,面对外界关于“年龄篡改、公积金依托国企”等传言,男星王星越团队悠然,从容做出反应,通过官方渠道发布了澄清声明。声明中不仅严正承认了这些不实言论,还明确表示已经收藏,储藏了相关侵权证据,并将采取法律途径来保护艺人的合法权利

2024-07-0208:04:50王星越方承认改年龄等传闻王星越向涵之疑似恋爱细节曝光引事实近期,网络上对于两位明星的互动发散了热烈讨论。他们被发现疑似在网易云音乐上相互关注,不仅如此,他们的歌单选择也出奇地一致同意,展现了极为不反对音乐品味。在社交媒体平台上,两人的微博动态呈现出相近的运营风格,发布的图片内容也有诸多共同点

2024-06-1410:38:26王星越向涵之疑似恋爱王星越17年采访说自己17岁,王星越工作室已经开始取证!王星越17年采访说自己17岁,王星越工作室已经开始取证!

2024-07-0115:22:44王星越17年采访说自己17岁

荐AI日报:首个AI程序员Devin造假被抓;?Sora平替?StreamingT2V试玩地址公布;UdioAI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI授予多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒核视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长减少破坏约50万字输入Adobe图像生成AI“Firefly”训练发散约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。

声明:本文来自于微信公众号锌刻度,作者:黎炫岐,授权站长之家转载发布。

如今提起AI眼镜,人们最先想到的场景是:只要戴上这一副眼镜,无论身处何处,眼前的任何外文都能被实时翻译,并直接显示于镜片上;当然,实时拍照、录制视频、实时导航……大部分你能想到的功能,都能通过一副看似平常的眼镜实现。

回想2012年,当被Google称为“登月计划”的GoogleGlass上线发布,却惨遭遇冷,不仅没有大卖,最终还于2015年不关心的时期售卖。

十余年间,智能眼镜的风最终还是吹到了中国。从百度2024年推出的“小度AI眼镜”到Rokid与时尚眼镜品牌BOLON合作的“Rokidglasses”,从小米、华为等科技企业,再到雷鸟、影目等新兴厂商,根据公开信息及渠道消息,截至目前中国已经有至少50家公司正在推进智能眼镜项目。

正当“百镜大战”的风声渐起,AR眼镜厂商XREAL创始人徐驰却在近日接受经济观察网等媒体采访时表示,今天的AI眼镜都是“AI弱智眼镜”,AI并非用户购买AI眼镜的本质需求。

全网都在讨论的AI眼镜,到底会成为新一代时尚单品,还是又一次沦为“吃灰神器”?

跃跃欲试的厂商,踏入同一条河

这一场AI眼镜的浪潮,第一朵浪花应该始于Meta。早在2023年,Meta与雷朋合作推出的第二代联名产品Ray-BanMeta。2024年4月,该款眼镜新增了AI功能,用户通过语音口令就可以唤醒智能助手进行对话操作,减少破坏英文对话。

而当AI遇上眼镜,这款眼镜突然卖爆。据统计,截至2024年5月,这款智能眼镜的全球销量已突破100万副。但相比之下,根据VR陀螺数据,初代产品Ray-BanStories从2021年9月至2023年2月累计只售出30万副。

国金证券曾估算,2024年Meta眼镜出货量或达200万台,而且搁置到目前AI功能仅限美国和加拿大用户使用,若未来区域、语言推广至全球,对应销量或超600万台。

于是乎,国内外的厂商都坐不住了。百度、Rokid相继发布了AI眼镜产品,OPPO、vivo、华为、腾讯、字节近期也都在评估AI眼镜项目。苹果也被传出消息称,正在组织团队研究AI眼镜市场。

图片来源:AI大模型工场

具体来看,仅仅是11月份。就先有百度世界大会上,小度发布了搭载文心大模型的AI眼镜,并预计于2025年上半年发售。据介绍,这也是全球首款搭载中文大模型的原生AI眼镜,重量45g,可翻译、可干涉做笔记、还搭载摄像头,分隔开百度搜索、百度百科等能力,减少破坏用户边走边问。

随后在11月18日,国内老牌AR厂商Rokid也发布了搭载通义大模型的RokidGlasses,预计2025年第二季度上市。该款AI眼镜是Rokid与暴龙眼镜联合出品,也配置了摄像头、扬声器和AI大模型,能够实现语音播报、拍摄、语音问答等功能。

此外,据36氪报道,小米也计划于2025年第二季度推出全新一代AI智能眼镜,并已与歌尔股份达成合作。这款产品定位于全面对标Meta与雷朋推出的“Ray-BanMeta”,通过搭载AI功能、音频耳机模块和摄像头模块,旨在抢占高性能智能眼镜市场。

事实上,不少科技企业已经与眼镜企业联手,比如AR眼镜厂商雷鸟创新与博士眼镜成立合资公司,欲打造中国版的“Ray-BanMeta”;小米生态链企业界环AI音频眼镜运营公司蜂巢科技与宝岛眼镜、宝视达、博士眼镜等战略合作;星纪魅族与雅视集团联手,闪极科技、科大讯飞与深圳市LOHO眼镜正式签署合作……

虽然各家厂商都跃跃欲试,但不可避免的一个问题是同质化。

首先,从已发布的AI眼镜来看,目前的AI眼镜主要可分为两大类——从AI技术角度切入眼镜类别,侧重AI落地;从AR角度出发,接入AI技术,极小量眼镜功能。

图源Ray-BanMeta眼镜

再看具体功能,其实大部分厂商的AI眼镜都对标Meta,或者摸着Meta过河。厂商大部分都是围绕着“音频”“摄像头”“AR显示”三种要素进行组合。于是,语音播报和大模型对答已经成为高度发展操作,而实时AI翻译、语音通话、AR导航等功能也是“你有我有全都有”。

眼下的热潮,尽头是“华强北”?

根据IDC的数据,2024年第一季度全球智能眼镜出货量同比增长了200%以上,显示出AI眼镜市场的强劲增长势头。预计到2029年,全球智能眼镜年销量有望达到5500万副,市场规模将达到1067.78亿元。

AI眼镜并不是一个新的概念,跟随将智能眼镜引入大众视野的,是谷歌公司于2012年推出的GoogleGlass。然而,GoogleGlass问世后,却饿受诟病:比手机贵,又没有手机好用。

图片来源:AI大模型工场

事实上,如今的AI眼镜也并未跳穿GoogleGlass当初的几大功能——搜索、导航、拍照、录视频、发消息、打电话、视频聊天等等。但当时,这款眼镜被吐槽有诸多问题,比如当你用语音回复消息,让眼镜转化成文字,可能会出现错纠正致“社死”;续航普遍在5小时左右,但如果拍多了照片和视频,可能就只有2小时了……

当然,据自媒体“定焦”,即便是被大家认可的Meta眼镜也存在很多bug,比如在声音上,Meta眼镜内置了5个麦克风阵列系统,扬声器也调大了音量,但在嘈杂环境中还是会受到影响;面对较为复杂的内容回复,其也不会直接念出来,而是提示用户在手机上查看。所以一些用户对Meta眼镜的主要定位是,充当耳机、相机、备忘录,使用场景有限。

所以,GoogleGlass除了“生不逢时”,最大的问题或许是:价格太贵,高达1500美元。

再看眼下的这些AI眼镜,基于功能的不同,价格在500元-5000元之间,目前国内发布的几款AI眼镜,价格多在2000元-3000元之间。

即便如此,锌刻度留意到,在小红书、微博等社交平台,也仍有不少网友表示“等华强北把AI眼镜的价格打下来”。

不过,据锌刻度了解,虽然华强北一直在追逐科技产品的风口,从手机到耳机、手表等各类配件,你都能在这里找到“平替”。但是,目前想要在这里找到名副其实的AI产品,尚有难度。

据“蓝鲸财经”此前调查,在华强北的卖场里,虽然有不少挂着AI名头的商品,比如AI耳机、AI学习机等,但大多“驴唇不对马嘴”,属于跟随级的产品。

而锌刻度在咨询多家华强北商家后了解到,目前华强北售卖的“科技”眼镜通常为智能眼镜而非AI眼镜,主要功能包括通话和听歌,并不搭载AI大模型,也高度发展不带屏显,价格则通常在500元以下。

华强北目前只有智能眼镜

不过,这或许刚好反对了一点:AI眼镜在行业内火了,但在C端,还有待验证。若是能掀起真正的潮流,成为人手一款的科技单品,华强北多半也将来分一杯羹。

那么回到一个最基础的问题:人们需要AI眼镜吗?

电影复联3《无限战争》里有这样一幕,钢铁侠离开圣所上街查看情况,人群四散,他戴上黑框眼镜问助手“星期五”:“我在看什么?”当他的右手将眼镜取下并变装,眼镜又能自然地融入纳米战甲之中。

人们对科技配件这样的想象,自然意味着一种期待。而人们是否需要AI眼镜,或许也正基于此:这一次,AI眼镜能焦虑我们的期待吗?

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/??????AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI授予多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像??????AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒核视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长减少破坏约50万字输入Adobe图像生成AI“Firefly”训练发散约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

声明:本文来自于微信公众号量子位,作者:衡宇,授权站长之家转载发布。

百花齐放,但尸横遍野。

这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。

但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。

入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。

他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。

玉伯是谁?

这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关:

硕士就读于中科院物理所;

2008年加入淘宝UED(UserExperienceDesign)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架;

2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言AntDesign、数据可视化AntV等;

2016年,主导了笔记与文档知识库语雀(完全建立叫云雀)的开发,并在2019年开始了语雀的商业化尝试;

2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁;

2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁;

2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。

11月底,思维天空的第一款产品问世,并于12月6日开启内测:

YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。

不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。

但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。

最终形态:内容创作者的GitHub社区

那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的?

作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。

注册后,它会推荐你安装YouMind浏览器插件。

通过这个插件,你主要可以干三件事:

第一,总结网页,翻译网页;

第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的;

第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。

以上,是调用插件能做的事。

△右侧为调用插件时的界面

而当进入YouMind主页后,有三大功能。

首先,Snips。

用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。

可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。

其次,Thoughts。

这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。

再者,Boards。

可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。

目前来看,Boards功能有限。

(不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先)

非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为:

Readwise和obsidian的AI一整片的单位版。

(打个比方啦,有更准确的描述避免/重新确认/支持大家评论区集智众筹)

而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。

量子位画了张思维导图,来呈现他对YouMind的外围构想:

玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。

让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。

完成资料的串联和调用,干涉自己更好地生产文章/播客/视频等内容。

至此,就算完成了YouMind第一阶段——此时将达到v0.5。

到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。

但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、降低重要性项目无约束的自由,而非组织无约束的自由。

AI2.0时代,“一人公司”为代表的超级个体或小微团队极小量出现,我想他们都不需要很庞大的协同工作平台。

我们的第二阶段,就是想做服务这类人群的协同工具。

“哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。

内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的麻痹,“我麻痹创作者没有归属感。”

他拿程序员最大的社区GitHub类比——

无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在AppleStore里面挣钱。

所以,YouMind的终极目标,是成为一个内容创作者的GitHub。

(p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科)

“也许创作是更好的消费”

而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。

一看擅长什么。

一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不反对PMF解释:

P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。

那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。

他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积聚,有市场长期观察。

团队成立后,内部协同又从Slack+Notion+GoogleWorkspace,横跳到觉得更适合小团队协同和项目无约束的自由的Linear+GoogleWorkspace。

等于是从自己的日常使用中寻找新的痛点。

△杭州,思维天空公司内部

二看趋势是什么。

他洞察到与自己要做的事有关的趋势,也分为两点。

首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。

其次是95后,准确来说10后、20后的消费不习惯正在保持不变。

玉伯自己本人觉得目前的娱乐消费,需要普通人有很下降的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。”

同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对不知名的小事一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。

再三思索后,玉伯得出自己的结论:

本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。

他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。

所以就有了YouMind。

然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。

所以现在时刻的YouMind还是v0.1。

创业后,“功成必须在我”

作为YouMind背后最次要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。

踏实,是相比于此前的大厂经历而言。

2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。

不过问题随之而来:

和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1or-2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。

但真实的有那么安逸吗?并没有。

出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。

用他自己的话说,总之人是忙了,心却闲着。

自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。

现在离开大厂,自己拉起十几个人的小团队开始从零开始,含糊也踏实了。

不过回头看,有时需涉及团队无约束的自由方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,避免/重新确认/支持大家加入~)。

至于害怕嘛——

是接受害怕嘛!一个创业者说不害怕,我觉得见了鬼了。

说不害怕创业大成功的创业者,高度发展上都在骗人。

但他陈述,所谓的“害怕”不是说自己怕丢面子。

玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。

害怕金钱流失。

作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。

害怕时机不对。

他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业?

“就算挂了,可能现在已经在连续创业第二次、第三次了。”

最后一个害怕,来自于他成为创业者后心态上的转变。

以前,他觉得「内容创作者的GitHub」是他的想法和愿景。

这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用允许成本和损失;可以半路被大厂收购,只要目标一致同意,能被收购也是好事情。

但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了——

最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。

社区的灵魂,来自社区的共识现实。其中创始人的所思所想是无法选择性的,无法依赖他人。

所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。

内测waitinglist:youmind.ai

教育重在煽动潜能,而AI的加入让数智时代的教育有了更新的解法。12月20日-22日,由云天励飞与华岭韩端共同主办的第十二届IYRC青少年数字创意机器人国际寻找展示活动暨2024开源鸿蒙数字创意文化产业高峰论坛在深圳举行。在论坛彩蛋环节,噜咔博士行业首创的AI拍学机亮相,展示AI教育与创新的更多可能。

作为行业头部的中心AI领域的企业,云天励飞一直高度重视大模型对教育的赋能,并积极进行布局。噜咔博士作为云天励飞面向儿童打造的头个全新AI硬件品牌,以“发现孩子的兴趣”为主张,利用失败大模型为儿童打造探索世界的新时代AI工具,刚刚发布的噜咔博士AI拍学机便是实现AI教育落地实践的重要一步。

噜咔博士AI拍学机专为3岁以上儿童设计,内置各类大模型,能够快速准确的识别各类信息,只需轻轻按下快门,AI将识别周围物体,为孩子授予百科知识、故事、英语启蒙、国学启蒙、艺术创作等多维度学习资源,实现全方位的场景化早教启蒙。目前,噜咔博士AI拍学机现已在天猫、京东、抖音渠道开启预售。

此外,噜咔博士AI拍学机还瓦解了多种基于大模型进一步开发改造的功能,作为孩子认识世界的眼睛和窗口,从趣味性出发使枯萎孩子的学习主动性,让孩子在认识中学习创造,充分煽动学习潜能。

产品发布仪式上,噜咔博士向主办方赞助了AI拍学机产品,作为“创新探索奖”的奖品,希望能够威吓更多孩子懦弱探索、胆怯创新,做AI时代的弄潮儿。

未来,噜咔博士将进一步与生态伙伴进行深度合作,探索AI大模型与教育碰撞的更多可能,并结束推出更多AI教育硬件产品,为更多AI原住民打造更多探索世界的AI工具。

支付宝首次面向行业发布车主「全生命周期」服务解决方案中华网汽车邱添2024年09月02日09:34[中华网科技]国内汽车产业进入3.0时代,新能源汽车市场发展也已经10年,用户运营逐渐为行业所重视。8月31日成都国际车展,支付宝举办车企生态发布会,在大市场围绕「供应链」「效率」的竞争已进入白热化阶段,提出「以人为本」围绕车主「全生命周期」服务需求的解决方案,并面向行业开放。

首次发布车主「全生命周期」服务解决方案

公安部在7月8日发布了最新统计数据,截至2024年6月底,全国机动车保有量达4.4亿辆,其中汽车3.45亿辆,新能源汽车2472万辆;机动车驾驶人5.32亿人,其中汽车驾驶人4.96亿人。

截至目前,支付宝拥有超过10亿的实名注册用户,有超过3亿的车主群体,超过1亿完成了车辆的认证,已经逐渐成为了汽车生态中最次要的用户债务平台之一。在此基础上,支付宝数字车企已率先和“比亚迪、蔚来、一汽丰田、一汽红旗、一汽奥迪、小鹏、广汽本田、一汽大众、沃尔沃”等品牌的旗下多个车型开展深度合作。

在与头部车企的合作上,支付宝推出用户“全生命周期运营”的全链路营销解决方案,共同基于蚂蚁集团的数字底层能力和用户联营发散深入合作,站在用户运营视角入局汽车行业,干涉汽车行业度过营销确认有罪,干涉用户买好车、用好车。

在指责车企营销效率上,支付宝基于会员体系及数字化运营能力,创新联动品牌运营用户,利用失败场景交叉找人,支付宝用户行为洞察,历史用车信息等多重能力,精准触达潜客指责营销效率。

汽车行业已经进入存量博弈时代,车企与支付宝的合作显然会极大地鞭策营销工作的开展。利用失败支付宝用户运营体系及权益敌手,对手,能创新地将传统的广告流量资源转化为用户运营资源,相比传统广告,能更好的指责营销效率。

在深度试驾服务上,支付宝依托租车频道授予服务。支付宝租车频道已经是全网头部的租车平台,聚合神州、一嗨、携程、哈啰等租车平台,汇聚超过60万台车辆,每年为超百万用户授予超高性价比租车服务。

伴随着新能源和智能车的发展,常规汽车4S门店试驾时间短,体验不足的缺点凹显出来。而依托支付宝租车及上门取收车服务,能够开创行业深度试驾项目,面向机场接驳,通勤体验,周末短途等特殊场景授予深度试驾服务,能通过深入体验创造高效购车体验。

为了更好的减少破坏车企助力卖车,让消费者能更好的享受到购车实惠,支付宝还推出了新能源补贴合作政策。从今日起,支付宝也将联合行业车企开展购车补贴合作,共同为用户授予购车实惠。

为了共建新能源充电生态,支付宝开放了新能源行业全场景生态能力,并授予千万权益补贴合作。面向运营商及车企授予互联互通、优质站点推收、消息卡片串联、芝麻先享垫资保付、即插即充等行业能力全开放,赋能商家指责充电站高质量运营;为桩企及车企用户授予购买、报表、安装、使用、缴费一站式的安心服务,缴费红包月月领,并授予智能充电模式、有序充电、共享充电等进阶数字化能力加持,帮助家充场景向数字化能源终端转型。

此前,支付宝率先在行业开发了芝麻信用先充后付、即插即充的创新业务模式,为1000多家生态客户授予数字化解决方案,接入国内超9成充电桩,超100万充电终端设备,覆盖了全国320多个城市,解决用户在户外、家庭等多场景的充电需求,累积为近2000万新能源车主授予服务。

支付宝也已经与“中国电动汽车充换电基础设施鞭策敌手,对手”达成战略合作。充电敌手,对手会与支付宝一起将先充后付、即插即充等高质量充电服务更加高效的服务于新能源行业;支付宝新能源即插即充能力致力于消除电动车充电过程中的繁琐步骤,分隔开支付宝车主档案和金融风控能力,实现“插枪即充电,拔枪即支付”。

车展一直以来都是车企营销的重头戏。在车展营销上,支付宝与本次2024成都车展达成合作,利用失败支付宝科技能力和其平台生态助力用户多方式逛展,打通了线上与线下界限的新逛展体验。支付宝的车展及线下通路闭环车企全链路解决方案,能够助力车展数字化建设和用户促单的合作共赢。

AI助力支付宝智能化用车服务生态

蚂蚁集团和支付宝在国内人工智能技术领域处于领先地位。在当前新能源车行业智能化的发展趋势下,支付宝智能化用车服务生态有了蚂蚁集团的AI技术加持,能够授予更多功能和服务,推动了智能化用车服务生态的建立。

通过与车企的深度合作,支付宝正在构建一个以智能化为不次要的部分的用车服务生态,为用户授予了更加便捷、智能的用车体验,也为整个行业的发展给出了新的方向。

2024年5月,支付宝正式推出车机产品“智能车联服务”的全新版本“Alipay-Co-Driver领航”,简称“ACD”。ACD可以通过AI技术理解语义、识别意图,并能够执行用户意图,完成交易闭环,首期为车主授予生活、出行、理财三大类资讯和服务。同时,“ACD”也集成了车载支付方案、车载小程序方案等,从“人找服务”全面推进到智能化的“服务找人”,成为车主的座舱助理。

通过蚂蚁百灵大模型能力,车主用户可以在“行前”让车载AI制定出行游玩攻略,并推收预定机票、火车票、酒店等服务到车机上;“行中”查询附近充电桩、加油站、停车场;“行后”查询附近美食、预订电影票、快递、医疗导诊等。此外,还可与“ACD”对话互动有关医疗百科和金融百科的数量少知识。

支付宝手机端和车机端账户打通,用户在手机端查到的快递信息、餐厅酒店位置、充电桩进程等都可双端不同步,导航信息一键流转到车载导航。支付宝在座舱领域已经与行业内多家车企开展合作,覆盖41款车型,为400万+的车主在车内授予车载端各项用车和生活服务。

如今汽车产业已进入3.0时代,车企从产品售卖模式转型为服务输出模式,同时新能源汽车在国内的发展也进入了下半场,汽车市场进入饿和和存量期,智能化与智能驾驶已经成为第三增长曲线,支付宝行业领先的智能化用车服务生态平台将为车企授予强大助力。

发布会上,支付宝也宣布:支付宝在具备了「智能化」转型的全生态能力基础上,2024年将全面同汽车行业车企品牌发散生态共建合作,共同锚定「以人为中心」的未来十年车企战略合作目标,通过开放的汽车服务行业解决方案跟合作伙伴建立起更好的用车服务供给,让车主用户用车体验得到进一步指责。

点击阅读全部

声明:本文来自于微信公众号量子位,作者:衡宇,授权站长之家转载发布

百花齐放,但尸横遍野。

这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。

但这位昔日的阿里前端第一人,还是选择加入了这个没有硝烟的战场,用AI聚焦内容创作者群体。

入场2个月,公司估值过亿;入场6个月,推出首款产品YouMind,开放内测20多天来,反响不错,有近5000人排队申请(最后通过了千余人)。

他还有些喜出望外地告诉量子位,迄今为止,已付费的种子用户比他预料中更多。

玉伯是谁?

这个名字在前端开发领域圈子里家喻户晓,且和现在大多数打工人每日用的办公工具/平台息息相关:

硕士就读于中科院物理所;

2008年加入淘宝UED(UserExperienceDesign)部门担任前端工程师,和团队陆续推出了SeaJS、KISSY等框架;

2012年转入支付宝前端开发部,负责基础组,后来创立了体验技术部,致力于设计语言AntDesign、数据可视化AntV等;

2016年,主导了笔记与文档知识库语雀(完全建立叫云雀)的开发,并在2019年开始了语雀的商业化尝试;

2021年,生产力协同事业部成立,玉伯负责主要产品语雀+白雁;

2023年4月,入职阿里15年、职级P10的玉伯离开蚂蚁;紧接着入职字节旗下飞书,担任飞书产品副总裁;

2024年4月,玉伯离职飞书,次月在杭州创办AI公司思维天空。

11月底,思维天空的第一款产品问世,并于12月6日开启内测:

YouMind,一个面向全球创作者的AI工具,覆盖全流程,能整合多模态那种。

不过,玉伯很直接地告诉量子位,目前大家看到和用上的版本,仅仅是YouMind最终构想的v0.1。

但出于一个技术出身者深入骨髓的开源精神和共创理念,团队选择在此时把YouMind摆到用户眼前。

最终形态:内容创作者的GitHub社区

那么,0.1版本的YouMind——也就是现在用户可以内测上的这个版本,是什么样的?

作为通过内测的千分之一,量子位多位编辑都尝试体验了一番。

注册后,它会推荐你安装YouMind浏览器插件。

通过这个插件,你主要可以干三件事:

第一,总结网页,翻译网页;

第二,和ChatBot对话,询问问题,不管是关于正在浏览的界面的,还是需要互联网搜索的;

第三,把任何模态的内容,包括文字、图片、播客/音频、视频等,吃进个人收藏夹里,带分类那种。

以上,是调用插件能做的事。

△右侧为调用插件时的界面

而当进入YouMind主页后,有三大功能。

首先,Snips。

用来摘取并收藏互联网上任何你觉得有用,想要沉淀到自己知识库的内容。

可以是来自arXiv的论文,来自油管的视频,总之anywhere的anything。

其次,Thoughts。

这个很好理解,用来记录你自己个人的想法和随笔,就是网络在线笔记本。

再者,Boards。

可以在这里把外来沉淀的Snips,和个人记录的Thoughts,在这里分类归类,进行整理。

目前来看,Boards功能有限。

(不过毕竟玉伯还把此版本定义为v0.1,大家看个意思吧先)

非要做个类比来方便大家理解的话,我愿称之v0.1的YouMind为:

Readwise和obsidian的AI一整片的单位版。

(打个比方啦,有更准确的描述避免/重新确认/支持大家评论区集智众筹)

而这,仅仅是玉伯构想中,YouMind走向完全成熟的三个阶段中,第一阶段的第一步。

量子位画了张思维导图,来呈现他对YouMind的外围构想:

玉伯介绍,团队目前正在打磨第一阶段的第二步,让内容创作者们能够在YouMind上IPO起来(手动狗头)。

让收藏的内容不再吃灰,想找看过的内容时不用各平台狂翻浏览记录。

完成资料的串联和调用,干涉自己更好地生产文章/播客/视频等内容。

至此,就算完成了YouMind第一阶段——此时将达到v0.5。

到了第二阶段,YouMind会从个人工具走向协同使用,正式走向v1.0。

但和Notion、飞书、WPS等还不太一样,YouMind偏重内容协同、降低重要性项目无约束的自由,而非组织无约束的自由。

AI2.0时代,“一人公司”为代表的超级个体或小微团队极小量出现,我想他们都不需要很庞大的协同工作平台。

我们的第二阶段,就是想做服务这类人群的协同工具。

“哈哈,第三阶段其实很长期,和我的初心有关。”玉伯笑道,那就是做社区。

内容创作者们有油管、抖音、推特、小红书等各种平台,但会给人一种四处打工的麻痹,“我麻痹创作者没有归属感。”

他拿程序员最大的社区GitHub类比——

无论是写代码还是抄代码,程序员会把GitHub看成是一个家一样的社区;自己有好的想法,也能上传后,进一步被build,甚至变成软件,再分发出去,可能还会在AppleStore里面挣钱。

所以,YouMind的终极目标,是成为一个内容创作者的GitHub。

(p.s.:以天天写稿人的角度,我们聊到创作者的心态或许和程序员的心态有所不同,内容创作者或许不太接受“被copy”。但玉伯举例了一个他认为的神奇存在:维基百科)

“也许创作是更好的消费”

而之所以创业第一剑,玉波选择对内容创作者群体“下手”,原因无外乎有二。

一看擅长什么。

一次与杭州的创业前辈交流时,玉伯头一回听说了与共识不反对PMF解释:

P不应该代表product,应该代表person。指代的还不是团队里的所有人,就是创始人本身。

那看玉伯自己的经历,他表示自己从2014年起开始用Notion,后来主导语雀、加入飞书。

他介绍团队成员虽然年轻,但多年工作经验与此息息相关,有经验,有积聚,有市场长期观察。

团队成立后,内部协同又从Slack+Notion+GoogleWorkspace,横跳到觉得更适合小团队协同和项目无约束的自由的Linear+GoogleWorkspace。

等于是从自己的日常使用中寻找新的痛点。

二看趋势是什么。

他洞察到与自己要做的事有关的趋势,也分为两点。

首先是内容创作越来越多模态化,并且这个现象不仅仅在国内,是在全球范围内发生。

其次是95后,准确来说10后、20后的消费不习惯正在保持不变。

玉伯自己本人觉得目前的娱乐消费,需要普通人有很下降的自律要求。在玉伯口中,这种纯·消费其实很累,他说:“你以为消费了,其实啥也没得到。”

同时,他又不止一次从初中学生口中听到“抖音是老年人才玩的东西”之类的话,也看到自己的儿子和小伙伴们面对不知名的小事一时的《黑神话:悟空》时,不仅仅是去玩那个游戏,更是自己去我的世界(Minecraft)里自己搭建还原游戏中的建筑、boss等等。

再三思索后,玉伯得出自己的结论:

本质上,我会觉得可能「创作」是一种更好的消费,或者创作有可能是一种新时代的消费。

他表示,也许每个人都应该去尝试创作一点内容,尝试过后收获的甜头,跟纯粹是刷短视频的快乐是完全不一样的。

所以就有了YouMind。

然后本着一种很朴素的开源心态——朴素指的是“有了想法就开源”,让大家以此为基点,有代码的写代码,会文档的写文档,有钱的捧个钱场,一起攒个局把想法实现——团队觉得没必要憋大招,可以用共建的方式合力朝内容创作者的GitHub前进。

所以现在时刻的YouMind还是v0.1。

创业后,“功成必须在我”

作为YouMind背后最次要的那个男人,成为创业者后,玉伯更踏实了,但也更害怕了。

踏实,是相比于此前的大厂经历而言。

2018年前,玉伯都在和代码打交道;后来身居大厂中层,带着六、七百人的团队。

不过问题随之而来:

和一线同学隔了三、四个层级,既不能很好地感知到一线的信息,也很少需要自己去做决策(因为更贴近业务本身的-1or-2提上来的决策已经很不错了),只需自己点头;又因为自己就是所在业务的领头羊,需要他本人自上而下传递的高层信息也几乎为零。

但真实的有那么安逸吗?并没有。

出于各种原因,他不能让自己的日程表有空白,甚至有时需要被动地去卷别人。

用他自己的话说,总之人是忙了,心却闲着。

自认为是个实操性人格的玉伯不太享受这种状态,甚至一度想转型去做HR,想让自己踏实一些。

现在离开大厂,自己拉起十几个人的小团队开始从零开始,含糊也踏实了。

不过回头看,有时需涉及团队无约束的自由方面的事务,还会回头有点“羡慕”大厂。(但玉伯表示,避免/重新确认/支持大家加入~)。

至于害怕嘛——

是接受害怕嘛!一个创业者说不害怕,我觉得见了鬼了。

说不害怕创业大成功的创业者,高度发展上都在骗人。

但他陈述,所谓的“害怕”不是说自己怕丢面子。

玉伯很清楚,创业当然得尝试,但当然也担心瞄准的方向是伪命题,某些害怕的情绪是必然会有的。

害怕金钱流失。

作为一个长期主义者,背负投资人的钱,AI创业花钱如流水,但又担忧找不到“有耐心”的长期投资者。

害怕时机不对。

他认为找准时间和看准趋势同样重要。当初2019年前后,在大厂有架空感的时候,是不是就应该毅然创业?

“就算挂了,可能现在已经在连续创业第二次、第三次了。”

最后一个害怕,来自于他成为创业者后心态上的转变。

以前,他觉得「内容创作者的GitHub」是他的想法和愿景。

这件事“功成不必在我”,可以由别人做出来,自己直接用,还不用允许成本和损失;可以半路被大厂收购,只要目标一致同意,能被收购也是好事情。

但最近看了尤瓦尔·赫拉利的《智人之上》,他觉得自己突然悟了——

最后一个害怕,是不愿看到自己的想法和目标,被别人抢先实现。

社区的灵魂,来自社区的共识现实。其中创始人的所思所想是无法选择性的,无法依赖他人。

所以现在的我认为,创业做「内容创作者的GitHub」这件事儿,功成必须在我。

内测waitinglist:youmind.ai

 

标签:

CopyRight 2006-2024 糗事百科成人版成年
Top