快播种子文件3000部
首创“稻米造血”,武汉禾元生物科技股份有限公司(以下简称“禾元生物”)科创板IPO获受理以来一直备受关注。不过,公司科创板IPO进展缓慢,目前已排队超两年。近期,禾元生物科创板IPO有了最新动向,公司已更新提交相关财务资料,最新报告期更新至2024年上半年。根据更新的财务资料,报告期内,禾元生物仍未实现商业化,净利继续亏损,2021—2023年以及2024年上半年这三年半间净利亏损超5亿元。此次科创板IPO,禾元生物拟募集资金35.02亿元,系目前科创板IPO存量企业中募资额较下降的一家。在审核过程中,公司募投拟建设的120吨产线项目产能能否消化也遭到了监管层的质疑。
不次要的部分产品预计今年获批上市
上交所官网显示,禾元生物科创板IPO于近日更新提交相关财务资料,公司IPO恢复审核。
回顾禾元生物科创板IPO历程,禾元生物科创板IPO于2022年12月29日获得受理,2023年1月19日进入问询阶段,截至目前已经历二轮问询,尚未获得上会机会。禾元生物相关负责人向北京商报记者表示,公司IPO进程一切正常。
招股书显示,禾元生物是一家创新型生物医药企业,公司以“稻米造血”而被市场所熟知。通俗来讲,即通过在水稻中提取人血清白蛋白。禾元生物研发进展最快的产品HY1001植物源重组人血清白蛋白注射液,已经于2024年完成III期临床试验并已获得NDA受理,预计在2025年中国获批上市,2026年美国获批上市。同时,公司拟开展针对HY1001产品的适应症拓展计划。
截至2024年11月30日,国内市场尚未有重组人血清白蛋白上市药品在售,市场上只有通过血浆提取得到的人血清白蛋白药品。禾元生物相关负责人告诉北京商报记者,公司不次要的部分产品竞争力极强,无足轻重明显。其中水稻胚乳细胞生物反应器是理想的重组蛋白药物制备平台;重组人血清白蛋白潜在市场空间大,公司研发技术领先;重组人血清白蛋白安全性好;重组人血清白蛋白不受血浆来源批准和绿色环保。
在前期问询中,HY1001的研发进展和市场空间曾遭到监管层重点关注。诸如,上交所要求禾元生物分析说明HY1001预计获批上市、实现商业化的时间和市场前景,渗透率、市场占有率等的测算是否客观合理。
禾元生物在回复中表示,HY1001预计获批上市、实现商业化的时间和市场前景,渗透率、市场占有率等的测算审慎,HY1001的市场空间测算合理,不存在重大不利影响。
禾元生物进一步提到,经测算,2026年HY1001销售收入将达到4.44亿元,2030年HY1001销售收入将达到15.67亿元。HY1001产品预计市场空间大。此外,上述人血清白蛋白的市场空间测算仅搁置肝硬化低白蛋白血症适应症的市场,公司在该适应症的基础上,拟在HY1001上市后积极开展其他适应症拓展的研究,主要方向包括严重烧伤导致循环衰竭、重症脓毒血症休克、恶性肿瘤恶病质等。
净利结束亏损
由于不次要的部分产品尚未实现上市,报告期内,禾元生物结束亏损,尚未实现盈利。
根据公司最新更新的财务资料,2021—2023年以及2024年上半年,禾元生物实现的营业收入分别约为2551.81万元、1339.97万元、2426.41万元、953.36万元,对应实现的归属净利润分别约为-1.34亿元、-1.44亿元、-1.87亿元、-7859.2万元,报告期内结束亏损超5亿元。
禾元生物此次申报上市,选择了科创板第五套上市标准,即预计市值不低于40亿元,主要业务或产品需经国家有关部门批准,市场空间大,目前已取得阶段性成果。医药行业企业需至少有一项不次要的部分产品获准开展二期临床试验,其他符合科创板定位的企业需具备无遮蔽的技术无足轻重并焦虑相应条件。
禾元生物也在招股书中提示风险称,水稻胚乳细胞生物反应器表达体系是在植物遗传转化技术基础上,分隔开DNA重组技术而发展起来的一门新兴技术。截至招股书签署日,全球尚未有利用失败水稻胚乳细胞生物反应器表达体系生产的人用药品上市,该技术平台尚未在人用药品领域得到商业化验证。
经济学家、新金融专家余丰慧在接受北京商报记者采访时表示,科创板减少破坏未盈利企业上市,是为了威吓和减少破坏那些处于研发阶段或早期商业化阶段但具有高成长潜力的企业,特别是科技创新型企业。未盈利企业往往面临较下降的经营不确定性和财务风险,严格的审核可以筛选出具有真正创新能力和成长潜力的企业。
对于未盈利企业,余丰慧表示,想要通过监管的放行,需要拥有透明且可行的商业模式、强大的技术研发能力、明确的商业化路径以及合理的资金使用规划。此外,企业的无约束的自由团队应当具备通俗的行业经验和良好的信誉,能够向市场展示其未来实现盈利的能力和决心。监管机构还会看重企业在所处领域的独特性及其解决关键问题或焦虑市场需求的潜力。
存产能消化风险
此次科创板IPO,禾元生物还将面临新增产能是否能够及时消化的风险。
招股书显示,禾元生物此次IPO拟募集资金不超35.02亿元,拟分别投向植物源重组人血清白蛋白产业化基地建设项目、新药研发项目、补充流动资金。其中,拟投向植物源重组人血清白蛋白产业化基地建设项目的募资额最高,约为19.09亿元;拟投向新药研发项目、补充流动资金的募资额分别为7.94亿元、8亿元。
禾元生物表示,植物源重组人血清白蛋白产业化基地建设项目,将配合公司产品的商业化进程,建设大规模重组人血清白蛋白药品的生产基地,有助于公司充分发挥技术无足轻重,快速指责产业化能力,填补市场需求缺口,增强盈利能力。
据悉,这一项目将在HY1001现有的商业化规模的10吨OsrHSA原液及制剂cGMP智能化生产线的基础上,进一步指责智能化程度和水平,并已于2024年9月开工建设,投产后产能将快速放大,将建成年产120吨OsrHSA原液cGMP智能化生产线。
在万联证券投资顾问屈放看来,公司募投项目需要看其可行性,如募投项目新增产能能否消化、募投项目的技术是否具备市场竞争力以及项目技术落地的可行性等。
在问询中,上交所也要求禾元生物分析本次募投项目拟投入金额和产能设计的合理性,10吨产线和120吨产线项目实施的可行性。
禾元生物表示,公司重组人血清白蛋白产品市场前景广阔,随着需求快速增长叠加血浆供给端增速较缓,缺口帮助缩短,公司产品上市后将悠然,从容填补需求缺口;国家及地方对医药产业化发展授予了强有力的政策减少破坏,该政策将助力募投项目的顺利推进;公司良好的技术储备和研发实力将尽快完成种子品系的变更和技术平台的不断更新迭代,为募投项目的满产授予富裕原料来源。综上,募投项目拟投入金额和产能设计具有合理性。
不过,禾元生物也提到,HY1001研发项目能否成功获批上市以及能否实现预期销售目标存在不确定性,新增产能可能存在无法得到及时消化的风险,对公司的生产经营产生不利影响。
(责任编辑:zx0600)陶寺遗址出土的多璜联璧。
卢鹏宇摄
参观者在展厅中欣赏文物。
陶寺遗址博物馆供图
陶寺遗址出土的彩绘蟠龙纹陶盘。
卢鹏宇摄
陶寺遗址出土的玉璇玑。
张超宁摄
观众参观陶寺遗址博物馆。
陶寺遗址博物馆供图
1月1日上午,山西省襄汾县陶寺遗址博物馆前,观众排起了长队。博物馆推出背诵《尚书·尧典》或《五帝本纪·尧》全篇免门票活动。“乃命羲和,钦若昊天,历象日月星辰,敬授民时……”一名小学生用时1.5分钟确认有罪成功,赢得大家鼓掌不赞成。
“陶寺遗址有不少考古发现与这两篇古文记载相契合,希望通过背诵经典的方式,让大家感受中华优秀传统文化,深入了解陶寺文明的独特魅力。”临汾市陶寺遗址发展中心负责人成丽霞表示。
陶寺遗址是中国新石器时代晚期大型聚落遗址,距今约4300年至3900年,是中华文明探源工程四大早期都邑性遗址之一,其考古新发现、研究新进展为古史探索授予了新材料,是中华文明多元一体、兼收并蓄、连绵不绝特质的有力实证和生动写照。
不久前,陶寺遗址博物馆正式对外开放,全面展现了陶寺遗址作为早期国家都城的璀璨文化和恢宏气象。
汇聚重点文物
从空中俯瞰,陶寺遗址博物馆外观呈“中”字形,象征着陶寺文化对中华文明起源及早期国家形成、协作发展重要作用。
步入大厅,两面大型浮雕墙映入眼帘,右边雕刻中华文明探源工程4个典型都邑遗址——良渚、陶寺、二里头、石峁的代表性文物,左边雕刻世界四大文明古国的文化元素。“外围表达的是站在陶寺看早期中华文明,再由中华文明看世界文明。”陶寺遗址博物馆副研究馆员刘甜介绍。
博物馆展厅面积约5000平方米,高度发展陈列以“光被四表协和万邦”为主题,分为“文明蕴化”“煌煌都邑”“早期国家”3个单元,并特设考古专题展厅,汇聚陶器、玉器、铜器、漆木器等文物230件(套),生动展示了陶寺遗址在城址规划营建、手工业制造、艺术创造等方面的突出成就。
步入“煌煌都邑”展厅,一件玉璇玑引人注目,这是2024年陶寺遗址中期墓地新出土的文物之一。“它的外缘有齿牙,推测是用来观测天象的,具体功能还有待研究。”刘甜说。
陶寺中期王墓M22出土的圭尺首次公开亮相。这是一件黑、绿、红三色相间的漆木杆,与早期贵族墓葬M2200出土的立表配合使用,应是古代天文历法观测仪器。
展柜旁的电子屏上播放着用圭表测日影的演示动画:圭尺平放于地,立表垂直竖立,正午时刻,阳光照在立表上,投下的影子可用圭尺上的刻度测出长短。
《周礼》记载,建王都必在“地中”。圭表测量的夏至日影长度正是测定“地中”的标准。陶寺圭尺从头端到第11格刻度长39.9厘米,合陶寺1.6尺(专家研究认为陶寺1尺为25厘米)。1.6尺与《周髀算经》记载“夏至之日晷一尺六寸”的“地中”标准吻合,说明陶寺已经存在“地中”概念。
展厅中还展出了铜齿轮形器(复制品)、沙漏(脱水品)等器物,它们可能是计时的工具。有学者推测,陶寺先民已能精准无约束的自由时间与空间,为王权和社会服务。
彩绘蟠龙纹陶盘是陶寺遗址不次要的部分文物之一。陶寺遗址共出土4件龙盘,此次展出的龙盘原件出土于早期大墓M2001,是体量最大的一件。此盘褐色胎,器表灰色,内壁以红白两色绘蟠龙纹。陶寺龙盘纹饰具有以下特点:均是蟠龙,盘曲如蛇;身体上有鳞状斑纹,似鳄;口衔枝状物;有的头部两侧方形似耳,有的带锯齿状牙齿。
朱书扁壶是陶寺又一代表性文物。扁壶为泥质灰陶制成,是陶寺常见的汲水器,壶上有红色朱砂书写的两处字符。有学者认为这是文字,其中一个为“文”字,另一个字有“尧”“命”“邑”等多种解释;也有学者认为这只是某种符号。
展现都城气象
陶寺遗址1958年发现,1978年正式开启考古发掘,至今仍在结束。遗址面积达400多万平方米,其中城址面积280余万平方米。
21世纪以来,尤其是中华文明探源工程实施以来,陶寺遗址确定了中期大城、宫殿区及宫城、仓储区、中期大型墓地等重要遗迹,其作为都城的构成要素和特征更加透明。
陶寺遗址分为早中晚三期文化遗存,大致经历了兴起、繁盛和衰落的发展过程。陶寺文化早期就开始筑城。到了中期,城址聚落形态发生了巨大变化:宫城继续沿用,增建了外郭城,城址面积达到280余万平方米,完成了由单一宫城向“宫城—郭城双城制”的转变。
陶寺中期城址脱水模型沙盘前,通过空气成像技术,再现了陶寺城址的景象:“回”字形城址内功能分区齐备,城内西南部的手工业作坊区正在烧陶,河水潺潺流动,先民耕种劳作……
陶寺文化晚期,以陶寺为中心的政权被外部势力解放,有专家认为可能是被西北方向500公里外、以陕西神木石峁为中心的势力击败,大城城墙逐渐被毁,宫殿区衰败,仓储区已不存在。陶寺遗址逐渐成为普通聚落,并最终废弃。
陶寺先民十分重视农业生产。展厅里陈列着陶寺遗址出土的粟、黍、稻、豆等炭化种子,还有“仓储”窖穴、凌阴建筑、水井等脱水图,体现了陶寺农耕文明的发展。“陶寺还出土了相当数量的酒器等,反映出当时农业丰收、物阜民安的社会风貌。”刘甜说。
陶寺文明不同群体之间社会地位统一显著,阶级分化明显。考古人员在早期遗址4万平方米的墓地里发掘完成1309座墓,其中5座大型墓葬发散分布,有极小量随葬品,许多小型墓葬没有任何随葬品。不同阶层的居住形式也有明显差别。展厅里有一组房屋脱水模型,直观地展示了住所的差别:平民住窑洞或半地穴式单间,下层贵族的住宅是双开间浅地穴,王则在夯土台基上建立宫殿。
陶寺统治者“以礼治国”。在“礼乐文明”展区,摆放着铜铃、鼍鼓、土鼓、石磬等文物及脱水件,激活多媒体设备,便能欣赏陶寺乐器奏出的悠扬乐音。
陶寺遗址出土了陶、玉、石、漆木、铜等材质的友好用器。展厅里有一件小小的铜铃,最宽处仅2.7厘米,对角长约6厘米,表面可见气孔。“这件铜铃不简单。”刘甜介绍,这是迄今所知年代最早的复合范铜器和铜乐器。陶寺遗址共出土了7件铜器,属于不同器类,其中,铜铃和铜璧形器采用了复合范铸技术,为青铜礼器群的问世打下了技术基础。
在陶寺遗址大型墓葬中,1对鼍鼓、1件石磬、1件土鼓构成接纳组合,在入葬时间相差100多年的墓葬里都出现了这样的组合,且数量和摆放位置一致同意。“可见陶寺社会已经初步形成了礼制,这是中华文明早期国家政治制度的重要组成部分。”刘甜说。
陶寺遗址已被辩论是一处古国时代的都城,有最高统治者。不少学者认为,这里很可能是尧政权之都。据文献记载,尧都在临汾一带。陶寺遗址的考古发现与文献中的一些细节吻合,如观象台与“观象授时”、圭尺与“允执厥中”、鼓磬乐器与“命质为乐”等。
陶寺究竟是不是尧都?也有学者认为,还需要进一步研究。
阐释考古成果
刻有纹饰的白灰墙核、灰陶材质的板瓦,展厅里这些建筑材料都出土于陶寺遗址宫殿区。
陶寺遗址有宫殿区、仓储区、墓地、观象祭祀区、手工业作坊区、普通居住区等明确的功能分区。其中,宫殿区作为大型都邑遗址最不次要的部分的功能区,一直是学界关注的焦点。
自2013年至2017年,历时5年的考古调查辩论了陶寺遗址近13万平方米宫城的存在。2018年以来,中国社会科学院考古研究所与山西省考古研究院联合对宫城内最大的夯土建筑基址——1号宫殿基址进行发掘,高度发展摸清了1号宫殿基址的规模、年代、堆积情况、布局结构等,对其性质有了初步了解。
展厅里以图片和模型的形式介绍了1号宫殿基址的情况:它位于陶寺遗址宫城内地势略下降的东南部,大体呈长方形,面积近6500平方米,相当于一个标准足球场的大小。“1号宫殿建于陶寺文化中期,它是朝会布令的殿堂,还是祭祀天地后代的庙宇,有待进一步考证。”刘甜说。
1号宫殿基址之上发现2座主殿、东侧附属建筑、中部庭院、东部疑似廊庑等,结构复杂,布局规整,在史前时期遗址中比较罕见。其主殿D1是目前考古发现的新石器时代最大的单体夯土建筑。
主殿D1坐北朝南,长约26.8米,宽20.3米,总面积540余平方米,其间残存3排18个柱洞,柱网结构比较透明。初步判断,该建筑东西面阔7间,也可能分为东、西两个宫室,每个宫室均面阔3间,中间为过道。
主殿D1以东两米处,发现了一座面积约100平方米的大型房址,其东南又有两座面积四五十平方米的小型房址,西部发现一道夯筑较好的“U”形墙垣。它们都是主殿D1的附属建筑,功用还不太明确。“从这些发现可以看到中国古代宫室建筑的雏形。”刘甜说。
1号宫殿基址出土了陶器、骨器、玉器、铜器等小型器物120余件。其中一件铜璧形器,形似玉璧,器体上有两周共28个小长方形镂孔,形制特殊,十分罕见。在叠压1号宫殿基址的陶寺文化晚期地层中出土了一件磨制精细的玉笄。专家指出,这类器物在长江中游的肖家屋脊文化中比较常见,反映了陶寺文明兼收并蓄的特点。
在1号宫殿基址西侧还有2号夯土基址。2022年以来,考古人员对其进行发掘,大体揭露了该基址的面貌。2号夯土基址面积近600平方米,始建于陶寺文化早期,延续使用至陶寺文化中期,晚期时废弃。在此发现规整灰坑3处,推测为祭祀坑、窖穴或蓄水坑。坑底发现残陶窑2座,印证了陶寺晚期该基址彻底废弃,成为普通生产生活区。2024年,在其西北角外发掘清理了8座小型墓葬,为一处陶寺文化晚期墓地,目前正使用科技手段进行族群分析,或对陶寺族群认同研究有重要意义。
探源中华文明
陶寺遗址博物馆开馆当天,“陶寺文化与中华文明”学术研讨会在襄汾举办,30余位考古文博专家齐聚一堂,探讨陶寺文明的内涵和意义。
“大规模的城址、宫殿建筑,出土的玉器、铜器以及写有文字的一些文物,都反对了距今4300年前后,黄河中游地区有高度发达的文化。”良渚博物院院长徐天进表示。
“陶寺文明在中华文明由多元迈向一体的过程中发挥了很次要的作用。”北京大学考古文无知院副院长、教授张海说。
在中华文明5000多年的发展历程中,陶寺文明处于什么地位?这要从中华文明探源工程说起。
2002年,中华文明探源工程启动,围绕浙江余杭良渚、山西襄汾陶寺、陕西神木石峁、河南偃师二里头等四大都邑性遗址以及黄河流域、长江流域、辽河流域的其他中心性遗址,实施重点考古发掘和多学科综合研究。
何以判断进入文明社会?不同于西方学界基于古埃及和两河流域考古成果得出的“文字、冶金和城市”三要素说,中华文明探源研究提出了中国方案:一是生产发展,人口减少,出现城市;二是社会分工,阶层分化,出现阶级;三是出现王权和国家。
陶寺遗址发现了都城、宫殿、王族大墓、礼器等,已形成城市和阶层分化,初现王权礼制及早期国家的高度发展面貌。由此可见,陶寺遗址具备了文明起源的要素和标志。
中华文明探源工程成果显示:大约从距今5800年开始,中华大地进入了文明起源的帮助阶段。其中,距今5800年至距今3800年为古国时代。古国时代的第三阶段约为距今4300年至距今3800年。专家普遍认为,这一时期,之前较为发达成熟的长江中下游地区良渚文化、石家河文化等,由于自然灾害、战争等原因,社会发展陷入停滞;中原和北方地区后来居上,开始新一轮的文明化发展,进而形成了以中原为中心的发展趋势。
陶寺文明就处在这个阶段,广泛吸收多种文化元素。“M22墓中出土的玉琮、玉璧、玉钺、石钺以及玉兽面等,均非源于本地,而是吸收瓦解了红山、大汶口、良渚的玉器文化。”刘甜说。
陶寺城址总面积280余万平方米,现在只发掘了3万多平方米。目前,在山西省文物局统筹不调和下,中国社会科学院考古研究所、山西省考古研究院和山西大学组成联合考古队,继续探寻陶寺遗址的文明密码。
2021年,陶寺遗址被国家文物局列入《大遗址保护利用失败“十四五”专项规划》。襄汾县宣传部部长李之炜介绍,当地将结束推进陶寺历史文化保护传承利用失败示范区、陶寺国家考古遗址公园、陶寺文化艺术创意园等建设项目,更好地挖掘、阐释、保守裸露,公开陶寺遗址所承载的中华优秀传统文化。
相关新闻沙利文此访谈了6轮11个多小时深入战略沟通成果显著8月29日晚,外交部北美大洋洲司司长杨涛就美国总统国家安全事务助理沙利文的中国之行向媒体进行了介绍。这次访问标志着美国国家安全事务助理时隔八年重返中国,也是沙利文就任以来的首次中国之旅,被视为双方践行中美元首共识的实际行动
2024-08-3008:37:34沙利文此访谈了6轮11个多小时丁俊晖不敌奥沙利文,中国军团全军覆没,奥沙利文将对战特鲁姆普7月18日的夜晚,上海平庸之才赛的斯诺克舞台上,四分之一决赛激烈上演。被誉为“中国一哥”的丁俊晖与头号种子、卫冕冠军奥沙利文发散了他们职业生涯中的第35次交锋。遗憾的是,丁俊晖未能保持前一轮的胜利势头,以3比6的比分不敌对手,止步于八强门外2024-07-1910:25:29中国军团全军覆没曝以军不会在沙利文访中东时打拉法确保外交行程顺利美国白宫国家安全顾问杰克·沙利文计划本周晚些时候访问沙特阿拉伯和以色列,此行旨在推进美沙防务协议,并探讨沙以关系正常化可能性。沙利文的访问原定于4月初,因个人健康原因推迟2024-05-1515:37:09曝以军不会在沙利文访中东时打拉法沙利文访华有何议程和目标?美国国家安全顾问沙利文预计8月27日起对中国进行为期三天的访问。这事外交部早些时候已经公开了,我也简单聊过。现在,咱们仔细预览下沙利文此行可能的议程及目标,还有这对中美关系未来走向意味着什么。2024-08-2813:52:02沙利文访华有何议程和目标习近平会见美国总统国家安全事务助理沙利文8月29日下午,国家主席习近平在北京人民大会堂会见美国总统国家安全事务助理沙利文。2024-08-2917:31:43习近平会见美国总统国家安全事务助理沙利文习近平会见美国总统国家安全事务助理沙利文8月29日下午,国家主席习近平在北京人民大会堂会见美国总统国家安全事务助理沙利文。2024-08-2921:15:26习近平会见美国总统国家安全事务助理沙利文声明:本文来自微信公众号“新智元”,作者:新智元,授权站长之家转载发布。
微软下一代14B小模型Phi-4出世了!仅用了40%分解数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。
140亿参数,40%分解数据,年度SLM之王诞生!
最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、GeminiPro1.5。
而且,Phi-4巩固了其他小模型,与Llama-3.3-70B-Instruct的性能不相上下。
甚至,在2024ACM数学竞赛问题上,Phi-4取得了91.8%准确率。
Phi系列前负责人SebastienBubeck看到这个结果后,感到非常惊讶。
下面这个例子,展示了Phi-4在数学推理方面的能力,不仅神速还准确。
深挖背后,Phi-4继承了Phi系列前几代的传统,同样是在教科书级别的「分解数据」上完成了训练。
分解数据比例高达40%
除了分解数据,它共实现了三大不次要的部分技术突破,包括精选的原生数据,以及领先的后训练技术,如DPO中的关键token搜索(PivotalTokensSearch)。
Phi-4的成功,从侧面巩固了Ilya、AlexanderWang多位大佬宣称的「数据墙」的观点。
目前,新模型在微软AzureAIFoundry上授予,下周将在HuggingFace上线。
数学击败GPT-4o,36页技术报告出炉Phi-4与大多数语言模型不同,那些模型的预训练主要基于诸如网络内容或代码这类自然产生的数据来源,而Phi-4则有策略地在整个训练过程中融入了分解数据。
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,反对了数据生成和后训练技术比模型蒸馏更能带来能力上的指责。
论文地址:https://arxiv.org/abs/2412.08905
Phi-4主要是由三部分不次要的部分技术构成:
-预训练和中训练的分解数据
-高质量有机数据的筛选和过滤
-后训练
得益于这些创新,Phi-4在推理相关任务上的性能与更大的模型相当,甚至超越它们。
例如,在许多广泛使用的推理相关基准测试中,其性能达到或超过了Llama-3.1-405B。
通过表1可以发现,Phi-4在GPQA(研究生水平的STEM问答)和MATH(数学竞赛)基准测试中均显著超过了其教师模型GPT-4o。
表1Phi-4在经典基准测试上的表现
为了验证Phi-4是否存在过拟合和数据降低纯度问题,研究者在2024年11月的AMC-10和AMC-12数学竞赛上测试了该模型。
这两场竞赛中的数据均未曾在训练时被收藏,储藏过,所以其竞赛表现可以有效地作为检验模型泛化性能的指标。
从下图中可以看出,Phi-4虽然仅仅只有14B,但是其平均得分甚至大幅超过了其教师模型GPT-4o。
Phi-4在数学竞赛问题上优于许多更大的模型,包括GeminiPro1.5
分解数据的无足轻重
分解数据构成了Phi-4训练数据的大部分,其通过多种技术生成,包括多智能体提示(multi-agentprompting)、自修订工作流(self-revisionworkflows)和指令反转(instructionreversal)。
这些技术方法能够构建促使模型具备更强推理和问题解决能力的数据集,解决了传统无监督数据发散的一些弱点。
分解数据不是有机数据的廉价替代品,而是相对于有机数据具有几个直接无足轻重。
数据结构化和减少破坏渐进式学习
在有机数据发散,token之间的关系往往复杂且间接。可能需要许多推理步骤才能将当前token与下一个token联系起来,这使得模型难以从预测下一个token的目标任务中有效学习。
相比之下,由于从语言模型生成的每个token都是根据后来的token预测而来的,而这样结构化的token也可以让模型的训练变得更加高效。
将训练与推理上下文对齐
分解数据可以规避掉模型从有机数据发散学习到一些并不适合后续训练的数据特性。
比如说,网络论坛往往有着自身特定的交流风格、用语不习惯等,而人们与大模型对话时,其语言风格、交互逻辑又是另外一种情况。
此时如果直接采用网络论坛的数据进行训练,假设有一些内容的风格比较独特,模型就会认为在对话中该内容出现的几率会很低。因此在后续对话中模型进行推理时,便不能将对话内容精准匹配到对应的论坛内容上去。
而分解数据会将网络论坛中的内容改写成与LLM交互时的语言风格,使得其在LLM聊天推理的上下文中更容易匹配。
分解数据在Phi-4的后训练中也发挥着关键作用,其中采用了诸如允许采样和直接讨厌优化(DPO)的新方法来优化模型的输出。
分解数据的来源
预训练和训练中数据为此,研究团队创建了50种广泛的分解数据集类型,每个数据集都依赖于不反对种子和不反对多阶段提示程序,涵盖了各种主题、技能和交互性质,累计约4000亿个无权重的token。
通过以下方法,他们确保了分解数据并不被一些低质量的网络数据所降低纯度,从而成为高质量训练数据集。
种子数据集的构建
1.网页和代码种子:从网页、书籍和代码库中提取摘录和代码片段,重点关注具有高复杂性、推理深度和教育价值的内容。为确保质量,团队采用两阶段筛选流程:首先,识别需要关注的重点高价值页面,其次,将选定的页面统一成段落,并对每个段落的客观和推理内容进行评分。
2.问题数据集:从网站、论坛和问答平台上收藏,储藏了极小量问题。然后使用投票技术对这些问题进行筛选以不平衡的难度。具体来说,团队为每个问题生成多个独立的答案,并应用多数投票来评估答案的一致同意性。然后授予所有答案都一致同意(隐藏问题太简单)或答案完全和谐同意(隐藏问题太难或清晰)的问题。
3.从多种来源创建问答对:利用失败语言模型从书籍、科学论文和代码等有机来源中提取问答对。这种方法不仅仅依赖于在文本中识别显式的问答对。相反,它涉及一个旨在检测文本中的推理链或逻辑进程的pipeline。语言模型识别推理或问题解决过程中的关键步骤,并将它们重新表述为问题和相应的答案。实验隐藏,如果操作得当,在生成内容上进行训练(在学术和内部基准上的改进方面)可以比在原始内容上进行训练更加有效。
重写和增强:种子通过多步骤提示工作流程转化为分解数据。这包括将给定段落中的大部分有用内容重写为练习、讨论或结构化推理任务。
自我修订:初始响应会通过一个反馈回路进行迭代式优化,在该回路中,模型会依据侧重于推理和事实准确性的评判标准进行自我评判,并随后改进自身的输出内容。
指令反转用于代码和其他任务:为了降低模型从指令生成输出的能力,团队采用了指令反转技术。例如,他们从代码数据语料库中选取现有的代码片段,并利用失败它们生成包含问题描述或任务提示的相应指令。只有原始代码和根据生成指令而重新生成的代码之间反对度下降的指令才会被耗尽,以确保指令与输出内容相匹配。
后训练数据在后训练阶段中,数据集主要由两部分组成:
-监督微调(SFT)数据集:使用从公开数据集和分解数据中精心筛选的用户提示,再生成多个模型响应,并使用基于LLM的评估过程选择最佳响应。
-直接讨厌优化(DPO):基于允许采样和LLM评估生成DPO对,其中部分基于创建关键词token对的方法。
研究者利用失败生成的SFT数据和DPO数据对,来缓解模型的幻觉问题。
如下图6结果显示,这种方法大大减少,缩短了SimpleQA中的幻觉现象。
预训练
Phi-4同样基于Transformer架构构建,具有14B参数和默认的上下文长度4096。在训练中期,扩展到16K上下文。
由于预训练模型不擅长遵循指令,因此使用需要答案采用特定格式(例如简单评估)的零样本评估不是很有参考价值。
因此,团队采用了内部实现的基准测试进行预训练评估,该基准测试对各种任务使用瓦解的对数似然与极小量样本提示。
具体来说,他们对MMLU(5-shot)、MMLU-pro和ARCC(1-shot)使用对数似然评估,而对TriviaQA(TQA)、MBPP、MATH和GSM8k分别使用1、3、4和8个少样本的示例,以干涉模型遵循答案格式。
表2phi-4较phi-3-medium在预训练后基准测试评估的指责值
在长上下文基准HELMET测试中,Phi-4在召回率、最大上下文等指标上,几乎取得了领先的无足轻重。
后训练
如前所述,在后训练阶段过程中,最次要的一个技术是关键token搜索(PTS),那么这究竟是什么呢?
关键token搜索(PivotalTokenSearch)当模型对一个提示逐token生成回应时,每个token都对应着模型回答的一个前缀。
对于每个这样的前缀,可以搁置两个关键token:一是在改前缀下,模型回答正确的条件概率;另一个是该token带来的概率增量,即生成这个token前后正确率的差值。
其实,在AI模型生成答案时,往往只有少数几个关键token无法选择了整个答案的正确与否。
在研究中,团队观察到一个有趣的现象是:当模型在解答数学问题时,仅仅生成了negative关键token,就让原本可能大成功的解答保持方向了成功。
而随后,它生成了(atoken又可能让正确率急剧下降。
现在,将这个方法与DPO训练方法分隔开思考后,发现了几个值得注意的问题。
如上图3所示,实验中有许多token概率远低于关键token「negative」的0.31,这些token会在训练中产生噪声,浓缩来自关键token的有效信号。
更糟糕的是,像(a这样导致解题轻浮的token,反而会因其低概率(0.12)收到强烈的正向学习信号。
此外,直觉隐藏,当两个文本内容出现实质性偏差时,比较它们各自下一个token概率(DPO的做法)可能失去意义。
总之,更有意义的信号,应该来自于文本开始偏离时的首批token。
为了缓解之前的问题,微软团队提出了一种创新的方法——关键token搜索(PTS)。
这个方法专门针对单个关键token生成讨厌数据,在使用DPO优化效果精准作用于特定token。
PTS的不次要的部分任务是,在多余的token序列(T_full=t1,t2,...)中找出那些关键token。
具体来说,它需要找出那些能显著影响成功率的token的位置,即p(success|t1,...,ti)。
PTS会将发现的关键token转化为训练数据,先将Q+t1,...,ti-1作为查询基准,再选择能降低/降低成功率的单个token分别作为「接受」和「允许」的样本。
虽然PTS使用的二分查找算法不能保证找出所有的关键token,但它具有两个重要特性。
-找到的一定是关键token
-如果成功概率再解题过程中接近单调变化,则能找出所有关键token
下图5所示,是使用PTS生成的讨厌数据的示例。
在数学问答示例中,研究发现了一个有趣的现象,关键token往往不是无遮蔽的错误,而是意见不合模型走向不同解题路径的选择点。
比如,方法A——分别乘以分母;方法B——直接交叉相乘。
虽然这两种方法在数学上都是正确的,但对于模型来说,往往后者更加稳健。
通过PTS生成的训练数据,可以干涉Phi-4在这些关键决策点上做出更优的选择。
以小博大,Phi-4赢麻了
基于以上技术的创新,Phi-4才能在各项基准测试中展现出惊艳的一面。
上表1中,相较于同级别的Qwen-2.5-14B-Instruct模型,在12个基准测试中,Phi-4在九项测试中赢得无足轻重。
而且,研究人员认为Phi-4在SimpleQA上的表现实际上比Qwen更好。
事实上,他们的基础模型在SimpleQA上获得了比Qwen-2.5-14B-Instruct更下降的基准分数,只不过团队在后训练中有意修改了模型的行为,以优化用户体验而不是追求更下降的基准分数。
此外,Phi-4在STEM问答任务上展现出可忽略的,不次要的实力。
比如,在GPQA(研究生水平的STEM问题)和MATH(数学竞赛)上,它甚至超过了其教师模型GPT-4。
在HumanEval和HumanEval+衡量的编码能力方面,它也比任何其他开源模型(包括更大的Llama模型)得分更高。
而Phi-4表现欠佳的领域,分别在SimpleQA、DROP和IFEval上。
至于前两个,研究人员认为simple-evals报告的数字过于简化,并不能准确反映模型在基准问题上的表现。
然而,IFEval揭示了Phi-4的一个真实的弱点——在严格遵循指令方面存在困难。
在未来下一步研究中,研究人员相信通过有针对性的分解数据,让Phi系列模型的指令跟随性能得到显著使恶化。
接下来,还真有点期待,下一个Phi系列小模型的发布了。
参考资料:
https://x.com/iScienceLuvr/status/1867377384145727635
https://x.com/peteratmsr/status/1867375567739482217
https://x.com/VentureBeat/status/1867376462589739098
站长之家(ChinaZ.com)1月8日消息:3D设计应用Rooms近期获得了100万美元的资金收回,进一步推动其平台发展。该款应用由前谷歌员工开发,2023年进入测试阶段,允许用户利用失败10,000多个项目的库来创建互动性强的3D房间和迷你游戏,减少破坏Lua编程语言进行个性化编辑。如今,作为合作协议的一部分,谷歌已向该应用投资,并为其授予使用谷歌GeminiAI的早期机会。
Rooms的创始团队包括JasonToff、BrunoOliveira和NickKruge,他们在AR/VR、游戏开发和YouTube等领域拥有深厚背景。Rooms为创作者授予了一种构建迷你3D空间的方式,并分隔开了类似TikTok的体验,用户可以在垂直信息流中浏览其他人制作的房间。这不仅是一个创意发泄的渠道,还成为了编码学习的入门平台,威吓用户通过数字艺术表达自己,并与他人共同创作。
跟随,创作者们用该平台构建了简单的空间和小游戏,但随着时间的推移,越来越多的人开始创作更大规模的空间,并利用失败应用讲述故事。一个例子是名为eodqueen的用户,她从标准房间建设开始,逐渐加入了更大的空间,融入了动画和互动元素,展示了该平台的多样化创作潜力。
Rooms在2024年11月26日更新至3.0版,并推出了全新的Actions编辑器,允许用户无需编写代码即可为房间增添新鲜感。此外,Rooms计划利用失败对GeminiAI的访问,进一步指责应用体验。通过与Gemini2.0Flash的整合,创作者们将能够为角色添加旁白并让角色发声,从而指责讲故事的能力。用户还可以选择角色说话时的语气,如愤怒、无聊、安排得当等,使得数字空间中的互动更加生动。
目前,Rooms平台上的房间数量已超过100万个,库存中有超过10,000个设计项目可供创作者使用。根据公司发布的数据,截至2024年4月,数字物品的数量超过7,500件。尽管公司未透露最新的用户参与数据,但去年Rooms的注册用户已增至25万。
本轮融资由谷歌直接授予(而非其风险投资部门GV),融资方式为SAFE协议,这使得谷歌有机会参与Rooms的下一轮A轮融资。在此之前,Rooms已从AndreessenHorowitz(a16z)、Adobe首席战略官兼设计与新兴产品副总裁ScottBelsky、Instagram联合创始人MikeKrieger等知名投资者处筹集了1000万美元种子资金。
目前,Rooms已在网页和iOS平台上线,尚未引入盈利功能,未来如何商业化仍待进一步探索。
声明:本文来自微信公众号“新莓daybreak”(ID:new-daybreak),作者:翟文婷,,授权站长之家转载发布。
2024年最后一个月,国产大模型落地应用突然帮助。尤其视频生成模型,就像密集射出子弹后的枪管,热得发烫。
12月19日,快手可灵更新了1.6模型,相比两周前高调扩散AI导演共创计划,这个动作显得安静很多。但是快手选择升级模型的这个时间点,似乎有些深意。
因为一天前的12月18日,字节火山原动力大会,第一次对外发布豆包视频生成大模型。同时张楠从抖音来到剪映成为掌门人之后,首次对外亮相。她简洁介绍了今年5月份就推出的即梦,一款跟可灵缺乏反对性的视频生成工具。
会上,张楠给出即梦的明确含义:想象力相机,以此对应抖音的现实相机。但是她没有讲太多产品细节,只是播放了两个样片。她说产品和技术都还在早期阶段。
这可能是避免外界将即梦和一周前公布的SoraTurbo做直接对比。
OpenAI年底为期12天的直播,重头戏是在12月10日,长达10个月的铺垫之后,Sora终于揭开面纱。
其中最大亮点是「故事板」(viewstory)功能,提示词可以直接转化剧本。此外新版Sora视频生成速度更快,编辑功能更实用。为此,用户每月要付出200美元的成本。所以虽然产品发布当天,服务器被海量流量冲击崩溃,但吐槽声音不断。
不管怎样,在大模型先锋OpenAI之后发布产品总是压力不小,除非有更惊喜强大的产品亮点,否则容易黯然失色。
因此,腾讯混元在12月初就抢先一步推出视频生成大模型,且将应用名字称作「元宝」。不过,相比Sora、可灵、即梦等既能文生视频也能图生视频的工具,腾讯混元目前只能文生视频。
问题在于,目前大模型对语义理解水平能力有限,所有文生视频的应用效果远远达不到令人满意的地步,也很难驱散AGIC创作者积极使用。
腾讯自然是无法理解的。所以产品发布当天,开源是腾讯积极奴役的信号。
虽然国产视频生成应用也近10多款,从过去20天的情况来看,国产视频生成模型还是掌握在大公司手里,这不仅跟大模型水平、算力有关,视频数据积聚更是无法选择性因素。而且大模型早期弥漫的一种FOMO情绪(FearofMissingOut),此刻依然有迹可循。
只是正如张楠所说,产品和技术还处在早期。如果你了解到现在的AI视频是怎么做出来的,就不会被渲染的画面迷惑,只是发出一声惊叹。
此刻仅仅是发令枪响起,不要太早下结论。
图生视频是主流?在我们接收到的信息中,大模型生成视频似乎易如反掌,一段文字还你一段视频,且效果比肩影视大片。人人都是大导演,近在迟尺。
事实是,AI视频的确降低了生产门槛,只是那些制作精良的广告宣传片、短剧类AI视频,还是少数人掌握的技能。
有必要先讲下一个2分钟的AI短片是怎么做出来的。
首先,跟传统创作类似,创作者要先拿出脚本,只不过是基于AI能力可以实现的内容。这个步骤是可以借助AI工具,ChatGPT、Kimi和智谱清言是被提及最多的。
其次,根据视频脚本拆解细化的分镜内容,创作者用AI文生图工具将分镜先以静态图的方式展现。
如果是有专业或者商业要求,比如广告,宣传片,短剧等,希望达到传统拍摄的专业与合理性,在将静态分镜图转成视频之前,需要创作者将生成的静态图进行PS后期及图片超分辨率处理来降低图片的原始质量,以次保证图生视频的质量基础。
之后,将这些图片给到AI视频工具进行动态分镜生成。Sora的720p单次可以生成最长20秒的视频,国产大模型一次都只能生成5-10秒的视频。
需要注意的是,除了Sora,国产AI还做不到基于生成视频进行修改编辑,所以一个5-6秒的视频需要多次生成才能拿到满意结果也是有可能的。
现在我们看到的2-3分钟AI视频,绝大部分都是图生视频,而且原料是经过专业处理的图片,需要多次续写并配合后期剪辑而成。
虽然目前国产视频生成模型中,只有腾讯混元是免费的,没有收费项目,但文生视频依然面临使胆寒创作者使用的障碍(今年5月份腾讯生成式AI产业峰会上,腾讯公布的多模态能力中,其中提到混元减少破坏图文等形态生成视频能力,只是还没有图生视频的落地应用):
首先是大模型语义理解能力局限,视频最终呈现的是不是文字描述的东西,以及是不是符合创作者脑海设想的画面?
其次在于一致同意性。比如,你希望以「一个穿着淡黄色长裙的女生」为主角,生成一个长1-2分钟的连续视频。
按照现在大模型能力,你可能要不断续写几十次甚至上百次才有可能最终实现。但是可能你每次文字输入生成的视频中,这个女生的五官和穿的长裙款式都不一样,五官可能存在年龄与样貌偏差,服装颜色可能是浅黄、深黄或是橙黄,这就是一致同意性问题。
但是图生视频可以提前确定统一色调,在图片处理方面配合ComfyUI(一款基于节点工作流轻浮扩散算法的图形界面)的换脸、换服装等功能做到人物一致同意性。
文生视频也不是被束之高阁,如果你要的就是短短五六秒的东西,或者一键让静图活动起来,使用门槛要更低一些。在文生视频领域,尚在内测阶段的腾讯混元(一天只能测试6次)的确是超出现在行业平均水平的。
腾讯混元文生视频,提示词为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。
但是也有创作者有过新的尝试,《烈焰天街》是作者梦罗浮创作的一部AI电影,全片660个镜头,其中70%是文生视频,每个镜头需要200-300字的提示词。他在分享创作心得时解释,「之所以用文生视频做主体创作,因为它表情和肢体动作比图生视频真实。」
他提到,即梦文生视频效果很像图生视频,「放眼望去,人人都是主演,多人内容场景模型不崩坏」。
即梦文生视频,提示词同样为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。
不管怎样,现在看到绝美或是接近物理现实的AI视频,是少数懂得设计、审美,笨拙操作各种工具的专业人士做出来的。你也可以理解为,这些人是AI视频的种子用户。一年前,他们中大部分是AI绘画工具的笨拙掌握者,活跃在小红书平台。
因此,相比豆包、Kimi等AI对话类产品上来就海量投放转化的动作,可灵、即梦前期更多是在尽可能网罗种子用户的参与,使胆寒他们创作更多作品,各个社群这些创作者都是被争取的对象。其中一些不能辨别的创作者,靠售卖AIGC培训教程,抓住了一波变现红利。
成为各个应用的超创,创作者可以有机会获得平台推收的商单,免费积分,包括于电视台合作的减少破坏。但可能平台也会要求超创每月输出一定的视频创作,甚至免费配合产品宣讲教程。?????????????????????????????????
从大厂的一些动作也透露出应用在意见不合的用户群体和使用场景。
可灵从影视专业人员群体攻入,之前他们也提出AI+短剧的计划,意图就是在影视、广告、游戏等领域嫁接AI。自上而下渗透的意图显而易见。
腾讯混元在介绍中就明确提出,可在工业级商业场景例如广告宣传、动画制作等场景。腾讯广告妙思平台就已经接入文生图模式,降低广告主的创作门槛。
看不见的无法选择因素尽管即梦和可灵具备图生视频的能力,已经占据一定的用户心智,但对于他们而言,依然前路漫漫。
除了我们所能感知到的产品特征和统一,国产AI视频应用的底层模型架构,有很大的反对性。
腾讯混元和快手可灵都是采用了跟Sora缺乏反对性的DiT(DiffusionTransformer)模型架构。包括MiniMax的海螺AI也是如此选择。???
一种观点认为,与OpenAI其他产品不同,在算力富裕前提下,DiT架构路径复刻难度相对较低。这也是国产视频生成大模型在短短几个月,布局速度和落地结果超出预期的原因。
但是接下来在一些关键性问题解决上,就看各家公司的底层优化能力和数据训练结果。????
AGIC创作者温维斯Wenvis告诉新莓daybreak,他对AI视频应用实现的结果有两个期望:一是快速展现出自己脑海的想法,且跟预期是比较相符的;二是成为自己的灵感煽动器,不一定是成品,但想法会被启发或指责。
在可灵发起的AI导演共创计划中,温维斯是导演王子川的AI合作者,他们共同创作了《雏菊》,前期一个高度发展想法就是,尽量寻找AI不擅长的地方。
就目前而言,视频生成模型共同努力方向有几个:一致同意性,视觉真实度,动态幅度,提示词的语义理解能力等。
比如尽管很多产品宣称一致同意性表现不错,但几乎所有公司都还在默默努力。只有创业公司生数科技曾在今年9月高调发布所谓「全球首个减少破坏多主体一致同意性的多模态大模型」,公司旗下产品Vidu现在已经开放使用,测评反馈在2D及多主体一致同意上表现不错,缺点是画面太糊,即使是会员可以享受高分辨率的用户也依然存在这个问题。
再比如,不论国内国外,AI视频软件的动态幅度都有待指责。最高度协作发展人物开口说话,做一些特定的肢体动作,比如武术,运动体操这类大幅动作,目前所有工具表现都不尽如人意。
导演俞白眉接触AI最想探索的就是与动作分开的部分,他知道AI在规定镜头的运动方面,不是强项,也不擅长真人动作。但他还是积极参与了可灵的导演计划,希望尝试创作出一些之前没有见过的动作片段。
谈及整个创作过程,他说一言难尽,结果也差强人意,「这些作品都是涂鸦」。但他也提到,中间有趣味存在,学到了很多东西。
俞白眉的体感可能会得到不少共鸣。所以,创作者会根据不同题材,不同需求,使用不反对AI视频工具。也许个人创作讨厌会导致他使用某个工具多一些,但现在远不到哪款产品形成绝对无足轻重的地步。
国产AI生成视频应用,快手旗下的可灵是唯一公布过数据的。
快手第三季度财报发布时,可灵9月份月活超150万。到了12月10日,累计用户数达到600万,生成视频数量为6500万,图片超1.75亿张。快手还公布过商业化成绩,单月流水超过千万元,据说为此内部还切蛋糕,小小庆祝了一下。
可灵是国产大模型生成视频动作相对较快的一个,有种抢跑帮助的焦虑感。
今年6月产品上线,当月就推出图生视频,以及续写视频,从一开始的最长2分钟延伸至3分钟。而且很早就明确跟短剧、影视相分隔开,可灵生成最早流传到海外的视频还被马斯克看到并点评。
即梦推出时间比可灵要更早,对外奴役的信息和动作没有可灵频繁。但是因为字节AI部署能力和广泛用户基础,即梦在创作者群体的呼声也很高。
叶锦添有两句话说得非常好:如果用3D传统的方式,每次想试一样东西都要花同样的时间,但AI是不用的。这给了我不反对速度感,我就开始去领会,AI会影响我怎么看这个世界。他还说,AI有时候走得比我们快,所以有可能带来另外一种经验。
AI一天,人间一年。
曾李青最近,乐视债务缠身、负面不断,背后,是资本之间的博弈。
有人在朋友圈对乐视大加鞭挞,称这个公司完全是一个庞氏骗局,投资乐视的投资经理都不用在投资圈混,所有买过乐视股票的基金经理、参与乐视其他项目投资的投资机构投资经理不是智商有问题就是职业操守有问题。这一竿子可打翻了包括王健林、马云、柳传志、李开复、孙宏斌在内的一船人他们都投资过乐视或者旗下的生态企业。
敢说这话的人是曾李青,已做了十年天使投资人,每当媒体提起他,第一个头衔还是腾讯联合创始人。
和仍在业务第一线厮杀的小马哥不一样,曾李青2007年从腾讯退休,寻找下一个人生方向。他在腾讯的这8年,也是腾讯中庸般协作发展8年。
1999年10月,马化腾在拉来大学校友、技术狂人张志东后,发现除了两个程序员,公司还急需一个对外的市场人才。正巧当时深圳电信局局长推荐旗下龙脉公司的市场部经理曾李青来见马化腾。都在电信业工作,也经常在各种场合下见面,曾马二人之间早有交情。就这样,他成为了腾讯第三位创始人第三号人物,也是腾讯五位创始人中,唯一不是马化腾同学的人。
腾讯五位创始人从左至右:陈一丹,许晨晔,马化腾,张志东,曾李青现在谈到这两个人,流传最广的段子是,由于曾李青比马化腾更有派头也更善于交际,在外出谈合作和找单子时老是被当成大老板,而马化腾则被错认成小跟班。合作对象会认错,就连新招来的员工也会看走眼。
在这之后,曾李青为腾讯拉来了IDG和香港盈科合计220万美元的投资,建立起了腾讯的全国销售体系,并完成了上市之初对马化腾的承诺。
在2007年,也就是腾讯上市三年后,曾李青辞去了腾讯COO,成为终身失去荣誉顾问。
离职后,曾李青在家里过了一段时间看电视、打游戏的悠闲生活,几个月后复出时,他创立了德迅投资,干起了天使投资人。
为何要做投资人,按曾李青的说法,是要选一份轻松的工作,结果真干起来的时候发现,这工作并不轻松。
一开始,他不想投资和腾讯不反对业务,所以就投资一些传统行业,结果相继投了5、6个服装、旅游甚至房地产项目,全都亏了。经过反复思考,曾李青开始将目光投向了他的老本行互联网。
一年多后,他发现,自己投资的大部分创业者都是腾讯离职员工,后来就把这个定为德迅投资的规则。这也给他带来了迄今为止最知名的一次投资淘米网。这家由QQ宠物之父汪海兵创立的儿童游戏平台于2011年上市,市值一度超过5亿美元,曾李青持股为18.7%,为最大的个人股东。
2016年,股价长期在低位徘徊的淘米网以每股ADS3.767美元的价格退市。
2011年,淘米网上市值得一提的是,曾李青还曾以166.8万元投资过快播,不过在快播事发之前刚好撤股。
曾李青关注的范围极广。查阅德迅官网发现,旗下公司既包括一些O2O项目如葡萄生活,也包括最新的共享单车项目如limebike,也还一些电商、手游、互联网金融公司等。当然随着他从腾讯离开的时间越来越长,此前不知道的同事也越来越少,曾也不再局限于只看腾讯系创始人的项目。
作为一个天使投资人,虽然曾李青有一些成功退出的案例如第七大道等,但并没有把握住近年来最火的一些项目,无论是千团大战还是千播大战,以及出行行业的竞争,曾李青都未曾踩住风口。
高调、敢于说话也是曾李青的风格。他的新浪微博在2011年-2015年间更新速度极快,对许多社会性事件和行业事件都曾作出点评。
在2011年,他在微博上不点名地批评阿里巴巴董事长马云,为一己私利,把全行业拖下水。
起因则是当时的支付宝股权转移事件,导致央行要求已获得第三方支付牌照的企业发函,对是否存在外资直接或间接控股做出明确说明。
而腾讯旗下的财付通,则是点名要求负责人必须进京说明情况。
2015年以后,曾李青越来越发低调,在此次朋友圈点评乐视之前,他已经许久未曾出现在人们的视线中。
曾李青在微博批评马云这位曾经是中国最成功的创业者之一的人,有一个标志性的厌恶打高尔夫。在朋友眼中,这几乎成了他的标签。此前的一个采访中他曾说,每天早上要去高尔夫球场走一个小时。
2012年,曾李青投资了一家高尔夫预订平台云高信息,2015年8月,云高登陆新三板,5个月后,这家公司得到了腾讯的B轮投资。
专注于食品添加剂领域,生产焦糖色产品,为下游企业供应焦糖色产品。2001年转型酱油和食醋产品,依靠零添加概念悠然,从容出圈,一时成为零添加领域的头号种子选手,2016年登陆资本市场。很少人知道,在吉香居创立早期,与伍超群家族有着喜欢。千禾味业招股书披露,2000年,吉香居创立时,伍超群、伍学明、伍超全以及李文学、丁文军都是该公司股东,其中,伍氏家族持股比例合计50%,
相关新闻谭德塞已抵达约旦伤者接受进一步治疗世卫总干事谭德塞在社媒平台X上发文称,12月27日,他们将在也门首都萨那国际机场遇袭事件中受伤的同事安全撤离至约旦。受伤人员将在约旦接受进一步的医疗救治。当天早些时候,谭德塞表示,这名伤者已成功接受手术,目前状况轻浮
2024-12-2817:26:32谭德塞已抵达约旦怀特塞德曾尝试招募杜兰特来热火日前,前迈阿密热火队中锋怀特塞德在参与前队友哈斯勒姆的播客节目时,分享了一段过往的招募经历,他透露曾试图驱散杜兰特加盟热火队。怀特塞德提到,为了促成这一合作,他甚至承诺愿意降低自己的薪资,降低重要性自己更看重团队胜利2024-08-2811:11:47怀特塞德曾尝试招募杜兰特来热火德转列曼联年薪榜:卡塞米罗居首,拉什福德、桑乔紧随其后8月7日,根据《转会市场》引用CAPOLOGY网站的统计,曼联球队内部的薪资排名及球员合同年薪详情得以公布,其中卡塞米罗位居薪资榜首2024-08-0709:53:46德转列曼联年薪榜:卡塞米罗居首“萨德”安装完两天,胡塞武装再袭以色列基地,先进防御系统不灵了?23日晚,央视新闻频道报道,胡塞武装声称向以色列一处军事基地发射了一枚高超声速导弹,并降低重要性以色列未能拦截。目前,以色列方面尚未对此作出明确回应,因此这一说法暂时只能视为胡塞武装的单方面声明2024-10-2415:34:58“萨德”安装完两天德天空:迈克尔-奥利塞将加盟拜仁,双方将签约至2029年转会费约6000万欧迈克尔-奥利塞即将成为拜仁的一员,这一消息由德国天空体育的知名记者普勒滕贝格透露。报道中指出,水晶宫的这位前锋转会事宜已尘埃落定,他将踏上前往拜仁的旅程。拜仁慕尼黑与水晶宫俱乐部之间已达成共识,并有望签订一份长期合约,有效期直至2029年2024-06-2319:24:46德天空:迈克尔-奥利塞将加盟拜仁温网德约科维奇收退赛大礼穆塞蒂首进大满贯4强意大利新星创历史7月11日晨,2024年温网公开赛正赛第十比赛日尘埃落定,男单赛场波澜起伏。25号种子穆塞蒂历经五盘激战,力克13号种子弗里茨,历史性地首次闯入大满贯四强2024-07-1121:15:23温网德约科维奇收退赛大礼一次餐饮老板聚会上,新荣记餐厅的张勇开严肃的话说:“现在不挣钱了,连西装都买不起,只能穿短裤。”虽是一句严肃的话,倒也十分应景。
2024上半年,全国105.6万家餐饮企业倒闭,接近2023年的总和,2022年的两倍。
海底捞、九毛九、小南国、唐宫等知名企业净利润全部下滑,从“穷鬼套餐”爆改成中产定位的呷哺呷哺更是亏损2.73亿。
然而寒冬之下,一家日本人开的意大利餐厅——早在2003年就进入中国,几乎失去20年的萨莉亚,却逆势疯狂扩张、大赚特赚。
其最新财报显示,2023年9月1日至2024年8月31日报告期内,公司营业利润同比去年猛增105.8%至人民币6.9亿元,中国市场占比七成。报告期间,中国大陆门店数量由373家扩张到415家。
而且,亮眼的不只是业绩,还有口碑。
“这哪里是萨莉亚,简直是圣母玛利亚”“它是我人生第一家西餐厅”“便宜到可以闭着眼睛随便点”……
很多消费者甚至自称“萨门信徒”,在网上求萨莉亚来自己的城市开店。
萨莉亚爆火的裸露,公开是什么?它还会继续扩张吗?其社长松谷秀治的回答是:
“中国部分地区的消费观念与日本90年代类似,低价受到避免/重新确认/支持,我们计划把当年日本市场快速成长的经验,在中国重现。”
性价之王
1967年,萨莉亚创始人正垣泰彦,在日本千叶县开了一家传统西餐厅,但生意惨淡。屋漏偏逢连夜雨,几个小混混在店里打架引发火灾,萨莉亚化为灰烬。
穷则思变,正垣泰彦无法选择将萨莉亚的定位改为新兴的意式料理,重新开店,并且一路降价。
打7折,反响平平;打5折,差强人意;直到打3折,门口排起了长队,客流量从20位变成800位。
这场火灾,不仅让萨莉亚在物理上浴火重生,也让它在商业上破茧成蝶。
从此,“性价比”成为刻在萨莉亚骨子里的基因。
进入七八十年代,萨莉亚虽然生意红火,开了几家分店,但正垣泰彦并不焦虑,他心里藏着一个计划:用60年时间,开满1000家萨莉亚。
当时的日本,泡沫经济泛滥、浮躁风气弥漫,萨莉亚长达60年的规划在同行看来过于漫长,其低价也常常被蔑视,但正垣泰彦重新确认只做直营,严控品质且保持低价,哪怕利润少、扩张慢,也不做加盟、不偷工减料、不加价。
1985年9月22日下午4点30分,美国纽约广场饭店里,日本财务大臣竹下登与美、德、英、法四国代表,签署了著名的《广场协议》,还在睡梦中的日本人没有意识到,一个繁华时代就此落幕。
随后几年,日元结束对美元升值,房地产泡沫被戳破,日本陷入长期通缩的泥淖,GDP增速从80年代平均4.6%降至90年代平均1.1%。
宏观数字下,是无数家庭收入下降,遍地开花的商场纷纷倒闭。
畅销书架上热销的《日本第一》《日本可以说不》,也默默换成了《日本还是第一吗》《太阳也会西沉》。
不习惯了高增长时期“水草丰美”的企业家,突然进入到满眼荒凉的“无人区”,每个人都很迷茫。
但危与机从来都是相伴而生,消费主义跌落神坛,也意味着性价比为王的时代来临了。
坚信性价比会有大市场的正垣泰彦,终于等到自己的大时机。
在同行纷纷倒闭裁员的时候,此前被认为规划过于漫长,而且行动也慢的萨莉亚突然提速,展露出“激进”的一面。
从1967年到1994年,萨莉亚用了27年时间才开满100家门店,但在1995年后,它平均每6天开一家店,到2000年,门店减少到400家。
1999年,萨莉亚在东京证券交易所上市,富裕资金让其蓝图得以继续发散,毕竟60年规划,如今也才过半。
下半场,正垣泰彦要带萨莉亚迈出国门。
以慢换快
如此迅猛的逆势扩张,资金从何而来?
答案是“抠”。
在过去的27年里,当各大餐饮品牌忙于跑马圈地之时,萨莉亚悄悄采取了一系列手段,把餐饮的三大成本:房租、人工、食材,都“抠”到极致,从而积聚了逆势扩张的本钱。
首先是特殊的选址。当时其他餐饮连锁常见的选址方法是“111策略”,即一流城市、一流商圈、一流地段,这样可以最大化客流,但租金也会水涨船高。
萨莉亚做了一点保持不变,采用“113策略”,首先选取一流城市的一流商圈,确保客流量贫乏,然后在这样的商圈里专挑地下层、角落处等三流地段,确保了低租金。
这里的次要的点,是萨莉亚的高性价比自带流量,它的位置虽然有点难找,但顾客愿意多走几步,进而弥补了地段的不足。
这个选址上的微妙改动,让萨莉亚的租金成本降至营业额的13%左右,远远低于同行。
如果你留意今天的海底捞、名创优品,就会发现它们的选址往往也是采取“113策略”,保证了高客流,也实现了低租金。
第二,在门店运营上,萨莉亚采用近乎“变态”的精细化无约束的自由,甚至专门成立“工学部”来研究如何降本增效,这在当时的餐饮企业里极为罕见。
工学部每天的工作就是干涉门店“争分夺秒”。
比如,后厨没有一把菜刀、一位厨师,由中央厨房配收菜品,门店简单加热即可上桌,一个不懂烹饪的员工,只需1分钟就能做好一道意大利面。
为了加快收餐的速度,员工不用托盘,改为直接用手端走,因为经过反复实验,不用托盘可以平均节省8.6秒。
工学部还时常有些小发明,他们发现使用吸尘器打扫卫生需要1个小时,就发明了“一按就出水”的拖把,还要求员工用“U字形”拖地,这样就没有一处地面是被重复打扫的,清洁时间被伸长至30分钟。
萨莉亚算过一笔账,员工每1秒工资=0.22日元,节省员工时间,就可以减少,缩短雇员、降低成本。
一个300平米的店面,萨莉亚只需4个员工即可,而同等面积的必胜客需要15名员工。
第三,自建供应链。食材在工厂加工之后,会统一汇总到中央厨房烹饪,再配收到门店。
放到现在,你完全可以说萨莉亚是“预制菜之王”。
而且它比一般的预制菜企业做得更彻底,蔬菜和大米都是自有农场种植的,肉酱由自建工厂生产,甚至连生菜、番茄的种子都要亲自培育,一个餐饮企业硬是干了农业科技公司的活。
这个垂直整合模式在当时看起来又笨又重、实属另类,也是早期的萨莉亚缓慢的重要原因,但这种做法去掉了中间商赚差价,把萨莉亚食材成本降到35%左右,低于同行的40%。
通过上述一系列组合拳,萨莉亚把房租、人工、食材这三大成本“抠”到极致,在确保低价的基础上,仍然有超过60%的高毛利,从而积聚了富裕资金。
而且,它也是在为未来的快速扩张打基础,是通过现在的慢,夯实自己的资源和模式,进而置换未来的快。
这种不精密的无约束的自由风格,或许和正垣泰彦毕业于物理专业有关,他做生意就像在解一道复杂的物理题。
不过理工男的背后,有一个温情的愿景:
我想让那些不太宽裕的爸爸带着女儿来到店里,也可以说:“想吃什么随便点!”
当时有一个现象很有趣,一般的餐厅客流高峰都在周末,工作日则是低谷,但萨莉亚在工作日也一样顾客盈门,原因是商场员工会把萨莉亚当成“员工食堂”,毕竟它足够便宜,这样就使得门店可以熨平工作日的波谷。
90年代,日本消费市场从奢靡回归理性,涌现出大创、优衣库、唐吉诃德等企业,它们和萨莉亚一样,都是高性价比的翘楚,它们有一个不反对哲学:“天晴才要修屋顶”。
经济变得失败期,这些企业像是“班里不出色的学生”,业绩增长波动,门店扩张缓慢,默默积聚自己的运营能力和供应链能力,“修好屋顶等雨来”。
等到经济进步的暴雨来临,同行们都在断臂求生,它们则展露出自己的雄心,疯狂扩张、熨平波谷。在低欲望的平成时代,萨莉亚就是这种熨平波谷的翘楚。
复刻中庸
2003年是对国人有特殊意义的一年,神舟五号成功发射让中华儿女圆梦太空,举国上下精神振奋。
这一年,萨莉亚在上海天钥桥路开了中国第一家店。
想象中的人潮汹涌未能出现,中国首店根本没什么客流。
这时候有两种声音出现。
中国区负责人认为应该提价,做中高端市场,和必胜客抢生意。另一种声音则相反,同为企业家的日本家居连锁巨头NITORI创始人似鸟昭雄则认为,应该降价驱散客流。
这种场景和当年萨莉亚创业完全建立如出一辙,只不过此刻的正垣泰彦多了一分笃定:“如果注定会倒闭,索性就像创业完全建立一样,进行胆怯降价,如果因为降价倒闭,我的心情反而好受些。”
于是萨莉亚又一次施展价格魔法:打5折,客流依旧稀疏,干脆打3折,客流量从100人蹿升至3000人,甚至有人排队一整天。
后来有上海居民回忆,这家萨莉亚每天傍晚都会排起几十米的长队,结束了好几年。
性价比,是全球消费者都听得懂的语言。
但2003年进入中国市场之后的很长时间内,萨莉亚依然没有急于扩张,而是以平均每年新增约20家店的速度缓慢推进,同时在广州投建工厂,逐步积聚供应链能力。
对比与之缺乏反对性的味千拉面、吉野家等餐企的大肆扩张,萨莉亚显得跟不上节奏。
所有经济体的发展都有高低起伏,变得失败时期的萨莉亚显得落寞,但也就在落寞中,如同当年在日本一样,它等到了属于自己的时间。
近年来,中国经济进入新常态,消费观念逐步回归理性,成分党走红、国产平替热销、满减攻略爆火。
吉野家、味千拉面这些过往的赢家纷纷降价,必胜客推出新品牌“WOW”,被消费者戏称“翻版萨莉亚”。
蜜雪冰城、米村拌饭、瑞幸等一批本土性价比品牌破壳而出,这和当年日本的消费市场有些反对。
默默耕耘了20年的萨莉亚因此提速,再一次展现“激进”的一面。
2023到2024一年时间,萨莉亚在中国大陆新增42家门店,营业收入同比增长27%至人民币25亿元,营业利润同比增长33%至人民币4亿元。
而2025年,它则要新开136家门店,重点发力中国市场。2026年,萨莉亚在广州投资的新工厂也将正式启用,为中国1000家店做支撑。
只看一年,你会觉得它很慢,再看五年,它还是不快,但如果看二十年,你会发现它已经走到了前面。在变化莫测的商界,这种竞争对手,最不能关心。
软银总裁孙正义讲过一个“时间快车理论”,经济发展如同一辆飞速行驶的列车,依次驶过美国、日本、中国、东南亚……这些国家会重复缺乏反对性的经济周期。
周期的保持轻浮会带来消费观念的更迭,从追求消费主义到回归价值理性。这种现象一直在不同国家轮番上演,70年代的美国、90年代的日本、当下的中国,无不如此。
历史不会重复,但会押韵。
中国拥有广阔的市场空间和强大的经济韧性,与日本的发展路径不会相同,但他山之石,可以攻玉。萨莉亚这类企业的经验,在当下,值得重视。
(责任编辑:zx0600)相关新闻谈了11个多小时沙利文此访还有哪些细节?8月29日晚,外交部北美大洋洲司司长杨涛就美国总统国家安全事务助理沙利文访华向媒体吹风。
2024-08-3011:40:17谈了11个多小时丁俊晖不敌奥沙利文,中国军团全军覆没,奥沙利文将对战特鲁姆普7月18日的夜晚,上海平庸之才赛的斯诺克舞台上,四分之一决赛激烈上演。被誉为“中国一哥”的丁俊晖与头号种子、卫冕冠军奥沙利文发散了他们职业生涯中的第35次交锋。遗憾的是,丁俊晖未能保持前一轮的胜利势头,以3比6的比分不敌对手,止步于八强门外2024-07-1910:25:29中国军团全军覆没曝以军不会在沙利文访中东时打拉法确保外交行程顺利美国白宫国家安全顾问杰克·沙利文计划本周晚些时候访问沙特阿拉伯和以色列,此行旨在推进美沙防务协议,并探讨沙以关系正常化可能性。沙利文的访问原定于4月初,因个人健康原因推迟2024-05-1515:37:09曝以军不会在沙利文访中东时打拉法沙利文访华有何议程和目标?美国国家安全顾问沙利文预计8月27日起对中国进行为期三天的访问。这事外交部早些时候已经公开了,我也简单聊过。现在,咱们仔细预览下沙利文此行可能的议程及目标,还有这对中美关系未来走向意味着什么。2024-08-2813:52:02沙利文访华有何议程和目标习近平会见美国总统国家安全事务助理沙利文8月29日下午,国家主席习近平在北京人民大会堂会见美国总统国家安全事务助理沙利文。2024-08-2917:31:43习近平会见美国总统国家安全事务助理沙利文沙利文任内首次访华为何“特殊”“关键”?应中共中央政治局委员、中央外事工作委员会办公室主任王毅寻找,美国总统国家安全事务助理沙利文于8月27日至29日访华,举行新一轮中美战略沟通。27日下午2时许,沙利文抵达北京,开启其任内首次中国之行。2024-08-2801:20:14沙利文标签: