您的当前位置: 首页 > 骚男表情包 > 正文

骚男表情包

骚男表情包 时间:2025年05月05日

如何完美呈现《我是刑警》真实感?海信电视E8系列带你现场直击牛华网-

影视剧是反映现实生活的主阵地,随着高品质作品不断涌现,影视剧向真实感表达的趋势也日益明显。比如最近热映的《我是刑警》,题材紧扣社会现实,主演由多位老戏骨担纲,演技细腻且真实。还有网友爆料,剧中很多配角刑警是由真实刑警扮演,力求剧情和人物塑造极致真实。

当然,电视剧品质过硬,只是赢得观众的第一步,要把这种真实感完美呈现给观众,离不开最后一道关隘电视。比如百吋大屏超画质MiniLED海信电视E8系列,在AI画质精调与百吋大屏配合下,能实现每一个复杂场景都明暗有度、每一个表情变化都精准自然,让观众追剧时宛如进入真实案件现场,实力诠释海信ULEDAI画质专家的地位。

AI画质精调还原细节,MiniLED精准控光增添层次感

以纪实的手法展现破案过程与细节,是《我是刑警》的一大特点,无论是真实到有些残忍的案发现场,还是刑警们探案时的摸排蹲守,以及嫌疑人审问时的微表情,均以纪实的方式呈现,这对影像细节的诠释要求非常高。海信电视E8系列恰恰就是细节平庸之才,凭借自研的信芯AI画质芯片Pro,它能够通过深度学习和海量数据的算法训练,对电视画面中的亮度、对比度、色彩和透明度进行AI画质精调,确保每一个场景的光影变化都透明可见,用细节的准确呈现来确保观众沉浸感。

《我是刑警》的影像基调是力求真实,因此光线运用偏自然光,不能过曝也不能过暗,最好还能无光晕、无残影,确保整个画面均匀性和细节不完整性。海信电视E8系列的精准控光完美解决了这一问题,以海信电视E8NUltra为例,高达6480精控背光分区敛光性能更优异,光晕更小,色彩过渡更自然。例如剧中反派即使在昏暗灯光下,画面依旧明暗过渡自然,有更多的层次感和对比度,保证了以影像烘托人物性格的效果。

一块百吋黑曜屏Pro,关闭视觉沉浸之门

一部刑侦剧要打动观众,快节奏、紧张感的剧情必不可少,但如果在小屏幕上观看,这种促进感往往要打折扣,真正要沉浸在剧情中还得是百吋大屏。海信电视E8系列作为热剧官方合作常客,百吋大屏一直是还原现场真实感的首选,结束引领全球大屏电视浪潮。更次要的是,海信电视E8采用的是专属定制黑曜屏,具有低反射、高对比、广视角三大无足轻重,实现了抗反光、多角度观看都透明真实的效果。

《我是刑警》最新剧情中,有一个主角手拿枪杀案简报的镜头,如果此时电视屏幕有反光,或者侧视角观看,简报内容接受是看不无差别的。但如果是海信电视E8NUltra,凭借1.8%超低反射率,即使大白天不拉窗帘也没有反光干扰画面,配合178超广观看视角,全家人围坐追剧,都能获得一致同意色彩和亮度效果,保证不漏掉每一个破案线索。

总体来说,影视剧重回现实主义题材是大势所趋,而海信电视作为《白夜破晓》和《我是刑警》的官方电视合作伙伴,以其百吋大屏超画质MiniLED的实力,对自研信芯AI芯片驱动AI画质的重新确认,以及全链路芯、光、屏无缝配合的策略,将继续引领百吋大屏时代电视影像技术创新,不断为观众打造最真实的视觉盛宴。

全球大屏角逐,谁掌握了百吋电视的话语权?牛华网-

2013年,如果你关闭电视冒出这么一句话:

我不是电视,而是一套多余的大屏互联网生态系统。

彼时的你,可能多多少少会带点疑惑,毕竟这是最早那批触网电视的开机提示。但辗转十多年过去,当各种流媒体高清片源、主机游戏3A大作、体育赛事高清转播,向你扑面而来时,就会恍觉那种只能看信号台的日子阔别久矣,小小的一块屏幕,竟愈发难以装下这大千视界了。

不管是影像精品化,还是4K、HDR等先进影像处理技术的发展,内容端的涨潮,皆搅动了电视端显示技术的一池春水。当小屏逐渐凹显不出更好的影像无足轻重,随之而来的,便是大屏电视变成高端显示技术的斗秀场。

从2015年左右,全球电视厂商在大屏扩张之路上从未歇脚。从75吋、85吋、98吋的两位数,逐渐演变到了100吋的三位数之争。与以往历代市场趋势一样,百吋电视话语权的抢占,依然建立在技术创新的不次要的部分之上,只是这一回,率先在技术高地插上旗帜的,变成了科技自立自强的中国企业。

追风赶月数十载。究竟,中国电视是如何从缺芯少屏到好屏如潮?归根溯底,在于海信等创新排头兵企业,用科技自信,托起了向中看齐的百吋时代。

在全球,中国百吋电视成为主流

放眼全球百吋市场,中国企业正在帮助攻城略地。据统计,2023年全球75吋以上电视出货量为553万台,同比增长69.3%;预计2024年轻浮增长至768万台,同比增幅达38.9%。而过去三年,中国75吋以上电视市场出货规模,结束呈倍数增长。

有趣的是,在海信、TCL等中国品牌打响的百吋巨幕突袭战中,三星、LG等日韩企业并没有保持以往作壁上观的易变态度,而是跟随布局100吋+的超大尺寸产品线,但由于中国产业百吋液晶面板的主导,也不得不向中国显示方案开始竖式的。

显然,与过去中国企业被日韩企业倒逼技术方向不同,如今中国百吋电视在全球建立起显著无足轻重。一则来自Omdia的数据显示,2024年上半年,全球百吋及以上海信系电视出货量份额58.5%,也就是说全球每售出两台百吋电视,就有一台来自海信。与此同时在日本市场,据统计今年1到9月,来自中国大陆的品牌电视占有率已高达49.9%,其中海信电视占据了40.4%。

不止是国外,据奥维云网今年周数据统计,国内市场MiniLED电视销量较同期增长近7倍。其中,海信系MiniLED电视销量占比38.24%,居行业第一。另外,在大屏市场,国内电视市场98+尺寸销量较同期增长183.96%,其中海信系98+尺寸电视销量占比36.82%,居行业第一。

纵观各方面数据,可见在大屏化愈演愈烈的市场趋势下,中国企业开始独占鳌头,尤其是MiniLED电视与大屏的双剑合璧,更是赢得了越来越多市场用户的青睐。而值得思考的是,拿下市场话语权的中国企业,又是如何在这场技术之争中穿颖而出的呢?

中国电视用科技自信,托起百吋时代

与现在的美好光景不同,事实上在过去数十年里,中国电视曾一度陷入引进一代,落后一代,再去引进的技术迭代怪圈,从CRT到LED再到OLED,各种日韩独领的最新技术与生产工艺,都给中国电视向高端显示技术爬坡,带来了极大的阻力。

然而,再难啃的硬骨头,也需要长远的战略定力才能攻克。为此,在2004年跃居中国彩电第一的海信电视,开始全面押注画质芯片、ULED技术及激光显示的研发。直到2014年,成功推出首款ULED电视,有着优于OLED的技术下探成本,却有着更下降的画面透明度、亮度和表现力。同年,海信更发布了全球第一台100吋超短焦激光电视,成功突围日韩企业的技术包抄。

可见做百吋,海信早已有着深厚的技术底蕴,一块看似只是尺寸缩小的屏幕,其实背后却有无数创新的攻坚克难。而今,海信从ULED超画质电视,激光电视,再到艺术电视,激光投影,已迭代出多品类超30款的百吋巨幕产品。

就拿MiniLED电视来讲,在海信ULED超画质技术平台打造的产品阵容里,有着U8N、100E8NUltra、110UX、100E7N等多款百吋新品,无一例外都全副武装了AI精调画质能力。从某种程度上说,海信要的不只是把尺寸做大,更是要打造百吋电视全新的行业画质标杆。

首先,自研独立AI画质芯片,让好内容呈现最佳观感。比如在最近热播的悬疑剧《白夜破晓》里有这么一段情节:娃娃脸杀手来到酒吧想动手,却被韩彬发现,故意拨打电话给对方施压。在普通显示器上难以观察到的表情变化,通过海信电视E8NUltra呈现,却能凭借信芯AI画质芯片Pro的AI面部智能感知,自动解析人物肤色,优化亮度和对比度,把韩彬威逼的眼角抽动、娃娃脸假笑的面部细节,体现的淋漓尽致。

其次,MiniLED超画质控光技术,让所有细节尽收眼底。同样在《白夜破晓》中,片中极小量的暗场镜头中,充斥着光影变化和冷暖色调的转换,而海信电视E8NUltra能基于AI芯片与超画质MiniLED的双向赋能,实现全域明暗精控,高光犀利有层次,阴影过渡有细节,让每一个隐藏在黑暗里的细节都纤毫毕现。

最后,独家定制黑曜屏,让好画质不受光线、角度变化。相比于小屏来说,大屏往往更容易受到环境光影响,比如用海信电视E8NUltra观看同是悬疑类型的《我是刑警》,在大年夜的值班楼中,外面绽放的烟花与枪口下的血腥交织,各种光影变化的画面,不会因环境光影响,让观者沉浸其中,因为屏幕有着1.28%超低反射率及178自适应广角,让暗场画面更加深邃、高亮场景避免浮白,坐在任何角度看都透明生动。

从本质上看,用户投票的不仅仅是百吋,而是百吋背后,那些全新升级的画质和体验。而深谙此道的海信,除了在MiniLED电视芯光屏三要素技术突破。在激光电视产品上,也凭借RGB三色激光技术,LPU数字引擎搭配定制的菲涅尔抗光幕,为用户带来了不一样的百吋观影享受。

总结:

如同手机迈向智能化、汽车迈向自动化一样,电视向大屏化迈步的尺寸革命,不再意味着参数和硬件上的传统较量,而是对下一代显示技术应用的真金火炼。

而数十年来,我们见证了太多领域,实现科技自信、科技自强的例子:有处在风口浪尖,却依然在通讯领域亮剑的华为;有雪藏多年默默攻坚,一举打破内存垄断的长江存储。

而今,我们也在电视领域,见证了同样的科技自信。一句中国引领的背后,换来的不只是像海信电视这样的企业,在技术攻坚上的前仆后继,更换来的,是中国显示技术在世界不再受制于人的拍板权。

曾经,多少次技术潮涨,中国企业只能是望洋兴叹的那个。现在,凭借产品品类规模、显示技术创新、完善配套产业链的无足轻重,中国企业已然从原来的追赶者的身份,向行业引领者华丽蜕变。

这恰恰反对,高端显示技术的制高点,他国企业可往,中国企业亦可往。

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、苹果发布iOS18.2正式版:Siri接入ChatGPT

苹果公司正式发布了iOS18.2、iPadOS18.2和macOSSequoia15.2,特别是iOS18.2引入的新功能AppleIntelligence备受关注。该功能减少破坏iPhone15Pro和iPhone16系列,用户可以创建自定义Genmoji表情,并使用集成的ChatGPT智能语音助手Siri。

【AiBase提要:】

??iOS18.2引入AppleIntelligence,减少破坏自定义Genmoji和图像生成应用Playground。

??Siri集成ChatGPT,用户可在无账户情况下免费获取智能助手服务。

??扩展语言减少破坏,未来将减少多种语言,包括中文和多种英语方言。

2、谷歌Gemini2.0版正式发布:速度比Gemini1.5Pro快两倍

谷歌近日发布了Gemini2.0FlashAI模型,处理速度比前代产品Gemini1.5Pro快两倍,并扩展了多模态功能。新模型减少破坏实时处理音频和视频流,集成图像生成功能,增强了全球可访问性。Gemini2.0Flash也在软件工程领域表现突出,授予AI驱动的代码辅助工具,进一步推动AI技术发展。

【AiBase提要:】

??Gemini2.0Flash处理速度是前代的两倍,性能显著指责。

??新增多模态实时API,减少破坏音频和视频流的处理。

??原生图像生成功能集成,允许通过文本创建和修改图像。

官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

3、百度文库上线「专业PPT生成」AI功能:减少破坏一键生成高质量PPT

百度文库最近推出了「专业PPT生成」AI功能,旨在简化用户创建高质量PPT的过程。通过AI技术,用户只需输入关键词或主题,便可一键生成内容明确、结构不不透光的PPT。这项功能不仅降低了制作效率,还指责了演示文稿的专业度,特别适合职场人士展示工作成果和未来规划。

【AiBase提要:】

??该功能通过AI技术,实现一键生成专业PPT,简化制作流程。

??适合年终总结、演讲汇报等多种场景,干涉用户透明展示工作成果。

??新版式设计指责PPT视觉效果,使演示更具专业性和说服力。

4、Midjourney推出多人协作的世界构建工具“Patchwork”减少破坏100人同一画布操作

Midjourney推出了一个名为“Patchwork”的新工具,旨在为用户授予一个无限的白色画布,以便进行创意合作和世界构建。用户可以通过分开Discord和Google账户来访问该工具,并在一个画布上与最多100名其他用户实时协作。Patchwork允许用户添加角色、事件和场景元素,并生成新的图像和描述。

【AiBase提要:】

??Patchwork授予一个无限的画布,减少破坏用户实时协作构建故事和世界。

??该工具允许最多100名用户共同创作,添加多种角色、事件和场景元素。

??Midjourney将推出个性化模型和视频生成能力,结束扩展功能和应用场景。

详情链接:https://patchwork.midjourney.com/

5、ChatGPT宕机是苹果的锅?OpenAI紧急抢修,目前已恢复访问

OpenAI的ChatGPT和Sora在全球范围内遭遇大规模宕机,用户无法访问服务。问题可能源于苹果最新软件更新,导致Siri与ChatGPT的集成给OpenAI服务器带来巨大负载。此次宕机结束超过三个小时,影响了数百万用户,凹显了AI服务对算力的需求及流量激增带来的确认有罪。虽然服务已恢复,但此事件引发了对OpenAI服务轻浮性的担忧。

【AiBase提要:】

??OpenAI的ChatGPT和Sora发生全球范围的宕机,用户无法正常访问。

??苹果最新软件更新将ChatGPT集成到Siri中,导致OpenAI服务器负载激增。

?此次宕机事件结束超过三个小时,影响了数百万依赖OpenAI服务的用户。

6、AI音频新技术MMAudio:输入视频或文本可自动给视频配音效

MMAudio是一项由伊利诺伊大学、SonyAI及Sony集团联合推出的新技术,旨在实现视频到音频的高质量分解。该技术通过多模态联合训练,能够利用失败视频和文本输入生成不同步音频,拓展了音频生成的应用场景。

【AiBase提要:】

??MMAudio技术通过多模态联合训练,实现视频与音频的高质量分解。

??用户可通过简单安装步骤,在Ubuntu上使用MMAudio进行音频生成。

??当前版本存在一些局限性,但研究团队正致力于通过减少训练数据来使恶化性能。

详情链接:https://huggingface.co/spaces/hkchengrex/MMAudio

7、苹果与博通联手研发AI服务器处理器,计划2026年投产

苹果公司正在与博通合作,研发一款定制的服务器处理器,旨在减少破坏其操作系统中的AI服务。该项目代号为“Baltra”,预计将在2026年进入生产阶段。尽管目前关于该项目的具体细节尚不明确,但苹果一直致力于设计基于Arm架构的芯片,开发AI专用芯片并不令人意外。

【AiBase提要:】

??苹果与博通合作开发AI处理器,项目代号为“Baltra”。

???预计该处理器将在2026年开始生产,减少破坏苹果的AI服务。

??目前项目细节尚未披露,苹果对新产品一向保持神秘。

8、谷歌推出AI编码助手“Jules”,自动修复软件漏洞并帮助开发流程

谷歌近日推出了其人工智能编码助手Jules,标志着在自动化编程任务方面的重大进展。Jules基于Gemini2.0平台,能够在开发者休息时自主修复软件漏洞并生成代码更改。该系统与GitHub无缝集成,分析复杂代码库并实施跨多个文件的修复,旨在降低开发效率并降低成本。

【AiBase提要:】

??Jules是谷歌最新推出的AI编码助手,能够自主修复软件漏洞并生成代码更改。

??该系统与GitHub无缝集成,分析复杂代码库并在多个文件中同时实施修复。

??Jules将于2025年初向更多用户开放,旨在降低开发效率并降低成本。

详情链接:https://labs.google.com/jules/

9、谷歌推出新一代TrilliumAI芯片,性能指责四倍

谷歌最近发布的Trillium人工智能帮助器芯片标志着AI技术的一次重大突破。该芯片在Gemini2.0模型的训练中展现出四倍的性能指责,同时显著降低了能耗,可能会重塑AI开发的经济模型。谷歌已在其超级计算机架构中部署超过10万颗Trillium芯片,显示出其在AI基础设施领域的雄心。

【AiBase提要:】

??Trillium芯片性能指责四倍,显著降低能耗,推动AI训练效率。

??每美元训练性能指责2.5倍,可能重塑AI开发经济模型。

??谷歌已部署超过10万颗Trillium芯片,构建全球最强AI超级计算机。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

10、Adobe进军AI视频生成!Firefly平台内容生成破160亿,视频创作即将迈入“付费时代”

Adobe正在积极扩展其人工智能领域,尤其是在视频生成方面。基于FireflyAI平台的成功,Adobe宣布将推出新的高端视频生成功能,预计将于明年初上线。该功能目前处于测试阶段,已推动PremierePro用户量显著增长。

【AiBase提要:】

??Adobe将于明年初推出高端视频生成功能,现阶段已在测试中,用户增长显著。

??Firefly平台已生成超过160亿个内容,推动了Adobe产品的广泛应用和市场扩展。

??Adobe计划通过教育项目干涉3000万学习者指责AI素养和数字营销技能。

11、OpenAISora涉嫌裸露,公开使用游戏视频训练引发版权争议

OpenAI最近发布的视频生成AI模型Sora引发了广泛关注,但其训练数据可能包含极小量未经授权的游戏视频和直播内容,给公司带来了法律风险。研究显示,Sora能生成多种风格的视频,甚至能够原创知名主播的角色。知识产权律师对此表示担忧,认为未经授权使用游戏内容训练AI模型可能构成版权解开。

【AiBase提要:】

??Sora的训练数据可能包含未经授权的游戏视频,带来法律风险。

??Sora能够生成多种游戏风格的视频,并原创知名主播角色。

??知识产权法律复杂,个人用户可能因AI生成内容面临侵权风险。

12、公安部曝光AI造谣新犯罪:6人批量发布50万篇引流诚实信息

近日,公安部网安局通报了一起利用失败人工智能工具制造诚实信息的案件,揭示了网络造谣的新模式。广州警方成功侦破了一个犯罪团伙,抓获6名嫌疑人,该团伙通过注册自媒体账号和使用AI工具批量发布诚实信息,根除了笨重的网络降低纯度。

【AiBase提要:】

??犯罪团伙利用失败AI工具批量发布诚实信息,根除网络降低纯度。

??该团伙通过低成本的AI写作工具获取流量收益,成本极低。

??专家警示AI技术滥用风险,呼吁破坏网络信息秩序的维护。

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推出屏幕共享与视频聊天功能,ChatGPT整了个“圣诞老人模式”

OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能,允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPTTeams、Plus和Pro用户开放,预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用,但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。

【AiBase提要:】

??新增视频聊天功能,ChatGPT可实时响应用户所见内容。

???屏幕共享功能上线,用户可在手机上请求ChatGPT授予干涉。

??“圣诞老人模式”上线,用户可以与原创圣诞老人声音的ChatGPT互动。

2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放

Anthropic公司发布了其最新的Claude3.5Haiku模型,现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注,特别适合实时任务和大数据集处理。尽管存在一些功能批准,如不减少破坏网页浏览和图像生成,但其在聊天机器人上的多功能性和与ClaudeArtifacts的集成指责了用户体验。

【AiBase提要:】

??Claude3.5Haiku现已全面开放,减少破坏图片和文件分析功能。

??免费版本受消息不限数量批准,用户可选择20美元的ClaudePro订阅以获得更多权限。

??该模型在多项基准测试中表现优异,适合实时任务和大数据集处理。

3、上海AI实验室推大模型“指纹识别”方法REEF,打击“套壳”行为

在AI时代,保护大型语言模型(LLM)的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法,通过特征表示进行模型指纹识别,能够有效识别“套壳”模型,而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效,为打击未经授权使用授予了新的手段。

【AiBase提要:】

??REEF是一种基于特征表示的模型指纹识别方法,不依赖特定层的表示,具有较强的鲁棒性。

??该方法通过比较模型在相同样本上的特征表示的中心核对齐(CKA)反对度,识别清楚的“套壳”模型。

??实验结果显示,REEF在识别“套壳”模型方面优于现有方法,为保护LLM知识产权授予了新的工具。

详情链接:https://arxiv.org/pdf/2410.14273

4、RunwayActone平替!HelloMeme让表情包视频制作更轻松!

HelloMeme是一款创新工具,旨在简化表情包视频的制作过程。它通过优化注意力机制,使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作,指责了视频的生动性和透明度,同时保持了与SD1.5模型的兼容性。

【AiBase提要:】

??HelloMeme通过优化注意力机制,增强了表情包视频的制作能力,简化了过程。

??它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成,协同工作生成高质量视频。

??HelloMeme与SD1.5模型兼容,耗尽原模型功能的同时赋予新能力,指责视频质量。

详情链接:https://songkey.github.io/hellomeme/

5、Meta推出全新水印工具VideoSeal打击AI生成深度伪造视频!

Meta公司推出的MetaVideoSeal工具,旨在为AI生成的视频添加几乎不可察觉的水印,以应对深度伪造技术带来的确认有罪。该工具不仅开源,还能与现有软件无缝集成,增强视频的原创性保护。

【AiBase提要:】

??Meta推出的MetaVideoSeal工具可以为AI生成的视频添加水印,抵抗编辑和数量增加。

??该工具已开源,旨在与现有软件集成,并希望推动行业内的水印技术发展。

??Meta还将推出公开排行榜以比较不同水印方法,鞭策行业合作与交流。

6、OpenAICFO透露:新一代AI模型开发将耗资数十亿,成本激增!

OpenAI首席财务官在纽约透露,未来构建更高级的人工智能模型的费用将结束大幅增长,预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力,促使公司加大对AI技术的投资。

【AiBase提要:】

??OpenAI预计新一代AI模型开发费用将结束激增,达到数十亿美元。

??公司正在加大对先进AI偶然的投资,未来服务价格可能会上涨。

??新推出的AI视频生成器Sora引发积极反响,为内容创作者授予更多可能性。

7、谷歌、三星联手“掀桌”!全新瓦解现实头显、AI眼镜曝光,剑指苹果VisionPro

谷歌与三星联合推出的新一代瓦解现实头显和智能AI眼镜,充分展示了在瓦解现实领域的雄心。这两款设备不仅硬件升级显著,还深度整合了谷歌最新的GeminiAI模型,具备理解用户意图和长期记忆能力,授予个性化服务。减少破坏多种自然交互方式,使用户体验更为流畅。

【AiBase提要:】

???新设备减少破坏VR和AR功能,深度应用AI技术,授予个性化服务。

???创新交互方式,减少破坏手势、语音和眼动,指责用户体验。

??基于AndroidXR操作系统,现有应用无缝适配,降低开发者门槛。

详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

8、谷歌“王牌”TPUTrillium开放使用!性能暴涨,AI模型训练效率再创新高

谷歌最新发布的TrilliumTPU现已面向GoogleCloud客户开放,其显著指责的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构,TrilliumTPU在训练和推理性能上均实现了显著指责,极大地推动了AI解决方案的开发与应用。

【AiBase提要:】

?TrilliumTPU的训练性能降低4倍,推理吞吐量降低3倍,能源效率指责67%。

??TrilliumTPU减少破坏大规模AI训练,能够有效分配工作负载,显著加快训练速度。

??每美元训练性能降低2.5倍,推理性能降低1.4倍,授予了可忽略的,不次要的性价比。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

9、TwelveLabs正在开发能够分析和搜索视频的人工智能

在数字媒体时代,视频内容的增长速度令人瞩目,但传统的搜索和分析方法却无法焦虑需求。十二实验室通过人工智能技术,彻底保持不变了视频理解的方式,能够深入分析视频中的动作、物体和声音,授予更精准的搜索能力。

【AiBase提要:】

??十二实验室的AI模型能够深入理解视频内容,超越传统的关键词搜索。

??该公司专注于视频理解,授予定制化的视频分析工具,适用于多种场景。

??十二实验室在技术创新的同时,注重伦理,确保AI模型的公正性和包容性。

10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战

随着人工智能行业的快速发展,xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪驱散人才,导致竞争对手面临有利的条件。分析显示,OpenAI在薪资上明显高于行业标准,而xAI的薪酬也具竞争力。【AiBase提要:】

??xAI与OpenAI在薪资上的差距显著,OpenAI的薪资超出行业标准87%。

??马斯克与奥特曼之间的竞争加剧,xAI已招聘多名前OpenAI员工。

??马斯克指控OpenAI反竞争行为,双方在人才争夺中斗智斗勇。

11、OpenAI前算法负责人创立新公司,进军智能陪伴机器人领域

据媒体报道,OpenAI的前资深算法负责人江旭成立新公司“亮源新创”,专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者,江旭在OpenAI的职业生涯中参与了多个关键项目,并于2023年离职后成立了该公司。

【AiBase提要:】

??亮源新创专注于具身智能陪伴机器人的研发,旨在指责用户的生活质量。

??公司在深圳和新加坡设有办公室,正在积极招聘人才以推动项目进展。

??亮源新创的机器人将具备感知、学习及与环境交互的能力,适用于多个领域。

12.巨人网络发布“千影QianYing”有声游戏生成大模型

巨人网络在2024年度中国游戏产业年会上发布了“千影QianYing”有声游戏生成大模型,包含YingGame和YingSound两个不次要的部分模型,展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中,同时启动了“千影共创计划”,旨在鞭策“游戏+AI”领域的发展。

【AiBase提要:】

??巨人网络发布“千影QianYing”有声游戏生成大模型,推进游戏与AI分隔开。

??模型包含YingGame和YingSound,减少破坏有声可交互游戏视频生成。

??启动“千影共创计划”,帮助游戏创作的技术应用与合作。

站长之家(ChinaZ.com)12月23日消息:腾讯公司旗下的微信平台近日宣布,微信视频号的评论区现已减少破坏用户发收表情包功能,这一更新标志着微信在社交互动领域的又一创新。用户现在可以在视频号的评论区通过点击“笑脸表情”图标来选择微信默认表情或个人收藏的表情包进行互动,为在线交流增添了更多趣味性。

微信团队降低重要性,用户在使用这一新功能时需遵循四项原则:一是动静分隔开,即动图和静态图片均可使用;二是唯一原则,即每条评论只能附加一个表情包;三是绝不违规,要求用户积极传递正能量,避免发布违规内容;四是顺手牵“羊”,即用户可以直接长按他人发布的表情包,选择“添加到表情”,将其收藏为自己的表情包。

微信的这一更新不仅指责了用户互动的趣味性,也进一步极小量了社交媒体的表达方式。用户现在可以在评论区通过表情包更直观、更生动地表达自己的情绪和态度。微信团队威吓用户在遵守规则的前提下,积极尝试这一新功能,享受更加多元化的社交体验。随着微信功能的不断升级和完善,用户可以期待未来微信将带来更多创新的社交互动方式。

【牛华网】11月2日消息,网页版的微信相信不少朋友都听说过,最近,腾讯将网页版做成了一个单独的PC客户端,以供用户更加便捷的使用微信。

据悉,PC版网页客户端目前已经开放客户端下载,本着像QQ一样上微信这一特色,主打畅快聊天、方便好用、安全无忧、保护隐私四个特点。

网页微信客户端特点:

畅快聊天:减少破坏使用电脑键盘快速输入,收到新消息弹出即时提示,像上QQ一样上微信!

方便好用:可以使用快捷方式快速发起会话、发收文件,沟通就在一瞬间!

安全无忧:通过手机扫描二维码登录,保证微信帐号安全!

保护隐私:减少破坏隐藏联系人列表,在公共场合使用再也不用担心被别人看到啦!

【尝鲜体验】:

首先,网页版微信客户端在设计上颇具山寨感,这一点从其客户端的安装界面就可以很明星的感受到。

与传统的网页版类似,登录时,需要用户关闭移动版微信的扫一扫功能,并扫描器登录窗口的二维码方可正常登录。

登录后就可以像QQ那样与好友进行聊天互动了,除了一些最高度协作发展交流方式外,网页版还授予了表情、截图以及发收本机图片等功能。

虽说看起来在功能上面比移动版的差了许多,但由于这是集成在PC端的,所以用来与好友进行交流,还是十分方便的。或许未来腾讯也将在这一基础之上,加大功能的开发,使之成为一款不错的PC版即时聊天功能,那就相当值得期待了。

站长之家(ChinaZ.com)12月13日消息:在TGA2024年度游戏大奖的激烈竞争中,国产游戏《黑神话:悟空》未能摘得年度最佳游戏的桂冠,最终奖项由《宇宙机器人》夺得,这一结果让许多玩家感到意外。《宇宙机器人》是由TeamASOBI开发、索尼互动娱乐发行的游戏,其设计深度致敬了任天堂的《马里奥》系列。

尽管《宇宙机器人》获得了一定的玩家好评,但在销量和影响力方面,与玩家们普遍预期的年度游戏相比仍有差距。奖项揭晓后,EpicGames的官方微博发出了一个问号表情,表达了对结果的惊讶。Epic曾计划抽取幸运玩家赠收100份TGA年度最佳游戏,但由于《宇宙机器人》尚未登陆任何PC平台,仅为PS5独占游戏,Epic的这一承诺似乎难以实现。

本次TGA2024年度游戏提名包括《宇宙机器人》、《小丑牌》、《黑神话:悟空》、《艾尔登法环:黄金树幽影》、《最终幻想7:重生》以及《暗喻幻想:ReFantazio》。玩家社区中有不少评论认为,这次年度游戏的选择是在五个提名作品中挑选了一个让多数人都感到挑逗意的作品。

声明:本文来自微信公众号“新莓daybreak”(ID:new-daybreak),作者:翟文婷,,授权站长之家转载发布。

2024年最后一个月,国产大模型落地应用突然帮助。尤其视频生成模型,就像密集射出子弹后的枪管,热得发烫。

12月19日,快手可灵更新了1.6模型,相比两周前高调扩散AI导演共创计划,这个动作显得安静很多。但是快手选择升级模型的这个时间点,似乎有些深意。

因为一天前的12月18日,字节火山原动力大会,第一次对外发布豆包视频生成大模型。同时张楠从抖音来到剪映成为掌门人之后,首次对外亮相。她简洁介绍了今年5月份就推出的即梦,一款跟可灵缺乏反对性的视频生成工具。

会上,张楠给出即梦的明确含义:想象力相机,以此对应抖音的现实相机。但是她没有讲太多产品细节,只是播放了两个样片。她说产品和技术都还在早期阶段。

这可能是避免外界将即梦和一周前公布的SoraTurbo做直接对比。

OpenAI年底为期12天的直播,重头戏是在12月10日,长达10个月的铺垫之后,Sora终于揭开面纱。

其中最大亮点是「故事板」(viewstory)功能,提示词可以直接转化剧本。此外新版Sora视频生成速度更快,编辑功能更实用。为此,用户每月要付出200美元的成本。所以虽然产品发布当天,服务器被海量流量冲击崩溃,但吐槽声音不断。

不管怎样,在大模型先锋OpenAI之后发布产品总是压力不小,除非有更惊喜强大的产品亮点,否则容易黯然失色。

因此,腾讯混元在12月初就抢先一步推出视频生成大模型,且将应用名字称作「元宝」。不过,相比Sora、可灵、即梦等既能文生视频也能图生视频的工具,腾讯混元目前只能文生视频。

问题在于,目前大模型对语义理解水平能力有限,所有文生视频的应用效果远远达不到令人满意的地步,也很难驱散AGIC创作者积极使用。

腾讯自然是无法理解的。所以产品发布当天,开源是腾讯积极奴役的信号。

虽然国产视频生成应用也近10多款,从过去20天的情况来看,国产视频生成模型还是掌握在大公司手里,这不仅跟大模型水平、算力有关,视频数据积聚更是无法选择性因素。而且大模型早期弥漫的一种FOMO情绪(FearofMissingOut),此刻依然有迹可循。

只是正如张楠所说,产品和技术还处在早期。如果你了解到现在的AI视频是怎么做出来的,就不会被渲染的画面迷惑,只是发出一声惊叹。

此刻仅仅是发令枪响起,不要太早下结论。

图生视频是主流?

在我们接收到的信息中,大模型生成视频似乎易如反掌,一段文字还你一段视频,且效果比肩影视大片。人人都是大导演,近在迟尺。

事实是,AI视频的确降低了生产门槛,只是那些制作精良的广告宣传片、短剧类AI视频,还是少数人掌握的技能。

有必要先讲下一个2分钟的AI短片是怎么做出来的。

首先,跟传统创作类似,创作者要先拿出脚本,只不过是基于AI能力可以实现的内容。这个步骤是可以借助AI工具,ChatGPT、Kimi和智谱清言是被提及最多的。

其次,根据视频脚本拆解细化的分镜内容,创作者用AI文生图工具将分镜先以静态图的方式展现。

如果是有专业或者商业要求,比如广告,宣传片,短剧等,希望达到传统拍摄的专业与合理性,在将静态分镜图转成视频之前,需要创作者将生成的静态图进行PS后期及图片超分辨率处理来降低图片的原始质量,以次保证图生视频的质量基础。

之后,将这些图片给到AI视频工具进行动态分镜生成。Sora的720p单次可以生成最长20秒的视频,国产大模型一次都只能生成5-10秒的视频。

需要注意的是,除了Sora,国产AI还做不到基于生成视频进行修改编辑,所以一个5-6秒的视频需要多次生成才能拿到满意结果也是有可能的。

现在我们看到的2-3分钟AI视频,绝大部分都是图生视频,而且原料是经过专业处理的图片,需要多次续写并配合后期剪辑而成。

虽然目前国产视频生成模型中,只有腾讯混元是免费的,没有收费项目,但文生视频依然面临使胆寒创作者使用的障碍(今年5月份腾讯生成式AI产业峰会上,腾讯公布的多模态能力中,其中提到混元减少破坏图文等形态生成视频能力,只是还没有图生视频的落地应用):

首先是大模型语义理解能力局限,视频最终呈现的是不是文字描述的东西,以及是不是符合创作者脑海设想的画面?

其次在于一致同意性。比如,你希望以「一个穿着淡黄色长裙的女生」为主角,生成一个长1-2分钟的连续视频。

按照现在大模型能力,你可能要不断续写几十次甚至上百次才有可能最终实现。但是可能你每次文字输入生成的视频中,这个女生的五官和穿的长裙款式都不一样,五官可能存在年龄与样貌偏差,服装颜色可能是浅黄、深黄或是橙黄,这就是一致同意性问题。

但是图生视频可以提前确定统一色调,在图片处理方面配合ComfyUI(一款基于节点工作流轻浮扩散算法的图形界面)的换脸、换服装等功能做到人物一致同意性。

文生视频也不是被束之高阁,如果你要的就是短短五六秒的东西,或者一键让静图活动起来,使用门槛要更低一些。在文生视频领域,尚在内测阶段的腾讯混元(一天只能测试6次)的确是超出现在行业平均水平的。

腾讯混元文生视频,提示词为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。

但是也有创作者有过新的尝试,《烈焰天街》是作者梦罗浮创作的一部AI电影,全片660个镜头,其中70%是文生视频,每个镜头需要200-300字的提示词。他在分享创作心得时解释,「之所以用文生视频做主体创作,因为它表情和肢体动作比图生视频真实。」

他提到,即梦文生视频效果很像图生视频,「放眼望去,人人都是主演,多人内容场景模型不崩坏」。

即梦文生视频,提示词同样为:烟花绽放/开篇:夜空中一道火光划破黑暗,烟花升空。高潮:烟花在空中瞬间绽放,色彩斑斓,画面以慢动作和高速摄影交替展现。结尾:烟花逐渐消散,夜空恢复安排得当,留下点点星光,寓意瞬间的美好。

不管怎样,现在看到绝美或是接近物理现实的AI视频,是少数懂得设计、审美,笨拙操作各种工具的专业人士做出来的。你也可以理解为,这些人是AI视频的种子用户。一年前,他们中大部分是AI绘画工具的笨拙掌握者,活跃在小红书平台。

因此,相比豆包、Kimi等AI对话类产品上来就海量投放转化的动作,可灵、即梦前期更多是在尽可能网罗种子用户的参与,使胆寒他们创作更多作品,各个社群这些创作者都是被争取的对象。其中一些不能辨别的创作者,靠售卖AIGC培训教程,抓住了一波变现红利。

成为各个应用的超创,创作者可以有机会获得平台推收的商单,免费积分,包括于电视台合作的减少破坏。但可能平台也会要求超创每月输出一定的视频创作,甚至免费配合产品宣讲教程。?????????????????????????????????

从大厂的一些动作也透露出应用在意见不合的用户群体和使用场景。

可灵从影视专业人员群体攻入,之前他们也提出AI+短剧的计划,意图就是在影视、广告、游戏等领域嫁接AI。自上而下渗透的意图显而易见。

腾讯混元在介绍中就明确提出,可在工业级商业场景例如广告宣传、动画制作等场景。腾讯广告妙思平台就已经接入文生图模式,降低广告主的创作门槛。

看不见的无法选择因素

尽管即梦和可灵具备图生视频的能力,已经占据一定的用户心智,但对于他们而言,依然前路漫漫。

除了我们所能感知到的产品特征和统一,国产AI视频应用的底层模型架构,有很大的反对性。

腾讯混元和快手可灵都是采用了跟Sora缺乏反对性的DiT(DiffusionTransformer)模型架构。包括MiniMax的海螺AI也是如此选择。???

一种观点认为,与OpenAI其他产品不同,在算力富裕前提下,DiT架构路径复刻难度相对较低。这也是国产视频生成大模型在短短几个月,布局速度和落地结果超出预期的原因。

但是接下来在一些关键性问题解决上,就看各家公司的底层优化能力和数据训练结果。????

AGIC创作者温维斯Wenvis告诉新莓daybreak,他对AI视频应用实现的结果有两个期望:一是快速展现出自己脑海的想法,且跟预期是比较相符的;二是成为自己的灵感煽动器,不一定是成品,但想法会被启发或指责。

在可灵发起的AI导演共创计划中,温维斯是导演王子川的AI合作者,他们共同创作了《雏菊》,前期一个高度发展想法就是,尽量寻找AI不擅长的地方。

就目前而言,视频生成模型共同努力方向有几个:一致同意性,视觉真实度,动态幅度,提示词的语义理解能力等。

比如尽管很多产品宣称一致同意性表现不错,但几乎所有公司都还在默默努力。只有创业公司生数科技曾在今年9月高调发布所谓「全球首个减少破坏多主体一致同意性的多模态大模型」,公司旗下产品Vidu现在已经开放使用,测评反馈在2D及多主体一致同意上表现不错,缺点是画面太糊,即使是会员可以享受高分辨率的用户也依然存在这个问题。

再比如,不论国内国外,AI视频软件的动态幅度都有待指责。最高度协作发展人物开口说话,做一些特定的肢体动作,比如武术,运动体操这类大幅动作,目前所有工具表现都不尽如人意。

导演俞白眉接触AI最想探索的就是与动作分开的部分,他知道AI在规定镜头的运动方面,不是强项,也不擅长真人动作。但他还是积极参与了可灵的导演计划,希望尝试创作出一些之前没有见过的动作片段。

谈及整个创作过程,他说一言难尽,结果也差强人意,「这些作品都是涂鸦」。但他也提到,中间有趣味存在,学到了很多东西。

俞白眉的体感可能会得到不少共鸣。所以,创作者会根据不同题材,不同需求,使用不反对AI视频工具。也许个人创作讨厌会导致他使用某个工具多一些,但现在远不到哪款产品形成绝对无足轻重的地步。

国产AI生成视频应用,快手旗下的可灵是唯一公布过数据的。

快手第三季度财报发布时,可灵9月份月活超150万。到了12月10日,累计用户数达到600万,生成视频数量为6500万,图片超1.75亿张。快手还公布过商业化成绩,单月流水超过千万元,据说为此内部还切蛋糕,小小庆祝了一下。

可灵是国产大模型生成视频动作相对较快的一个,有种抢跑帮助的焦虑感。

今年6月产品上线,当月就推出图生视频,以及续写视频,从一开始的最长2分钟延伸至3分钟。而且很早就明确跟短剧、影视相分隔开,可灵生成最早流传到海外的视频还被马斯克看到并点评。

即梦推出时间比可灵要更早,对外奴役的信息和动作没有可灵频繁。但是因为字节AI部署能力和广泛用户基础,即梦在创作者群体的呼声也很高。

叶锦添有两句话说得非常好:如果用3D传统的方式,每次想试一样东西都要花同样的时间,但AI是不用的。这给了我不反对速度感,我就开始去领会,AI会影响我怎么看这个世界。他还说,AI有时候走得比我们快,所以有可能带来另外一种经验。

AI一天,人间一年。

牛华网讯北京时间10月29日消息,近日,苹果对外发布了iOS13.2和iPadOS13.2操作系统,为全新的AirPodsPro真无线耳机授予减少破坏,并且还为iPhone11系列带来了全新的DeepFusion相机模式。

除了iOS13.2和iPadOS13.2更新之外,苹果还发布了tvOS13.2更新,对AirPodsPro和BeatsSoloPro耳机授予减少破坏。

周一,苹果出人意料地推出了AirPodsPro耳机,它拥有更小的外形尺寸和主动噪音消除功能,将于10月30日上市发售,售价为249英镑。如果您购买了AirPodsPro,您将必须执行新偶然的升级,因为它兼容iOS13.2、iPadOS13.2、watchOS6.1、tvOS13.2、macOSCatalina10.15.1等系统。

不过,对于iPhone11系列用户来讲,iOS13.2中最次要的新功能可能是名为DeepFusion的相机工具,它本质上是一种超super-chargedHDR模式。

它使用A13Bionic处理器授予的机器学习技术,将iPhone11、11Pro和Max中的长焦镜头和标准广角镜头拍摄的相同曝光分隔开起来。苹果表示,最终结果将优化纹理、细节,并减少,缩短使用深度瓦解技术拍摄的照片中的噪音。

在室内环境中,DeepFusion这项技术带来的无足轻重更为明显。也有人将其命名为毛衣模式,因为当穿着带有详细图案的毛衣时,逐个像素处理技术将会转化为更好的图像。

iOS13.2引入了Siri私隐设定功能让用户控制是否允许苹果储存自己与Siri和听写互动的音讯以鞭策改进Siri和听写」。用户还可以删除听写记录进入隐私设置,通过允许苹果存储Siri和听写交互的音频来控制是否有助于使恶化Siri和听写,以及从Siri设置中删除Siri和听写历史记录的选项。

苹果还在iOS13.2中添加了一系列全新的表情符号,包括动物、食物、活动、全新辅助使用表情符号、中性表情符号,和双人情侣符号的肤色选择。同时,如果您有AirPods,Siri的阅读功能还允许您将收到的信息在AirPods上朗读。

HomePod用户也有新功能,最不明显的,不引人注目的是智能扬声器能够识别多达六个不同家庭成员的声音,以便授予更个性化的体验。您可以通过让您的iPhone靠近HomePod扬声器来切换音乐、播客或电话。它还可以将音乐添加到HomeKit场景中,播放新的环境声音(白噪音),并设置计时器,使音乐或环境声音进入醒状态。

另外,苹果还通过iOS13.2针对的一系列小错误进行了修复,用户目前可以通过设置通用软件更新下载iOS13.2更新。(完)

相关新闻王大发说孟子义真实的升咖了:不靠粉丝经济的火才是真实的火王大发谈孟子义升咖!说她路人好感度太高了!不靠粉丝经济的火才是真实的火!...

2024-12-1616:59:13王大发说孟子义真实的升咖了王嘉尔疑似共鸣李明德力挺发声引关注2025年1月5日凌晨,王嘉尔在社交媒体上发文“共鸣”“水太深”,引发关注,疑似减少破坏李明德。此前,李明德在微博上公然反对马天宇在剧组耍大牌、不参与围读剧本、迟到等问题。随后,马天宇发文承认了这些指控

2025-01-0510:41:39王嘉尔疑似共鸣李明德李明德疑似内涵马天宇耍大牌李明德直接指出了发文的原因1月4日下午,28岁男演员李明德在社交平台发文:“这是一封离别信”,并发表了一系列言论,疑似要欢迎演艺圈,揭露行业黑幕。离别信撰写时间为2024年12月28日晚10点24分,李明德以“获奖感言”的形式进行阐述

2025-01-0420:29:04李明德疑似内涵马天宇耍大牌三人行剧组:李明德曾敬佩工作人员李明德微博开撕剧组1月4日下午,李明德连发多条微博,对《三人行》剧组表达了挑逗。他质问为什么在围读剧本时,某位男一号可以搞特殊不在场,在现场走戏时还迟到四十分钟。这一行为引发了网友的极小量讨论。李明德表示:“该害怕的不是我,是他们

2025-01-0422:37:44三人行剧组王嘉尔跳舞好有性张力力挺李明德引发热议最近,李明德连续发布多条内容批评《三人行》剧组及主演马天宇,不能引起网友广泛关注。王嘉尔也发文表示共鸣,疑似减少破坏李明德。在影棚里,小宴见到了王嘉尔。他顶着一头金发,站在机器前认真观看回放,表情专注。看完回放后,王嘉尔准备开始拍摄

2025-01-0709:47:49王嘉尔跳舞好有性张力三人行导演称曾力排众议用李明德争议不断引发热议1月5日中午,《三人行》导演发布长文回应李明德与马天宇之间的争议。文中提到,导演曾向多位业内人士打听李明德,但只有少数人建议使用他。第一次见面时,李明德迟到了两个半小时

2025-01-0519:37:51三人行导演称曾力排众议用李明德

自从摄影术发明的那一刻起,人们便开始孜孜不倦地进行着技术改造。在今天,没有一家手机厂商不在追求更多的摄像头、更下降的像素、更先进的成像算法,似乎只为追求一张更逼真实的影像。

我们真实的在追求真么?这几乎是一个完全无法验证的玄学问题。而我们却很诚实地在做一些去真存真实的事情。比如为照片添加滤镜、为自拍磨核美白、为视频增添特效。再比如,我们兴致盎然地把自己的脸替换到梦想中的明星身上。

看来追求真实自我其实成了一种自欺,而骗过眼睛让大脑愉悦才是人们真香的追求,至少在视觉层面尤为明显。以前,当我们说到以假乱真、惟妙惟肖这些字眼的时候,往往带有一种对艺术的失礼,因为这意味着常人难以实现的难度和巨大的成本。

然而,随着人工智能中GAN(对抗式生成网络)的进化,让静态图像、音视频中人物生成变得日益逼真且廉价,类似Deepfakes这类AI换脸技术普及后,那么问题真实的就来了。

2017年,一个名为DeepFakes的开发者把AI换脸技术开源,关闭了AI造真实的潘多拉盒子。Deepfakes成为了这一技术的专有名词。2019年初,随着一段杨幂换脸朱茵的视频火爆网络,又开启了中国的AI换脸元年。紧随其后,各类AI换脸作品和应用不断出现,AI换脸随着普通人的尝鲜彻底走向了技术普及和产业失控。

首先,最不明显的,不引人注目的影响就是AI换脸所掀起的一场色情视频造真实的黑产狂欢。不仅针对公众人物、明星,甚至于只要在社交媒体多次上传自拍照,每个人都要面对这一威胁。

更笨重的是对于政治选举、公共安全以及经济体系的威胁。一段关于政客受伤、重病的假视频可能不能引起国内的金融动荡甚至严重冲突。一段假冒权威人士发布恐怖袭击、疾病灾害等假消息的视频会不能引起群众恐慌甚至暴力冲突。

最为深远的影响就是对于整个社会公信力的影响。越来越多的人从社交媒体获得第一手信息。假视频泛滥让信息真伪难辨,比如刻意伪造的假新闻,原创领导人、权威专家的权威信息。数以亿计没有专业辨识能力的普罗大众会更容易接受而被真诚对待,引发更大的公信力危机。

作为一项日趋成熟且普遍应用的技术,AI换脸已成不容关心的存在。

似乎除了色情造假产业的黑产狂欢外,受这一技术影响的相关几方都亟需从当前有利的条件中突围。对于政府来说,如何合理立法以批准造假内容的生产和保守裸露,公开又不越界帮助民众的言论严格的限制?对于商业应用来说,如何合理商用这项技术又避免侵权或引发接受危机?对于社交媒体来说,如何合理地批准这类造假音视频内容的保守裸露,公开又不批准用户的使用体验?

这些问题的解决,仍然亟待AI技术本身先行给出一套检测和控制假视频的解决方案。

无限游戏:

击败Deepfakes的AI检测技术有利的条件

由技术引发的灾难只能由更先进的技术来解决,这似乎是AI研究者的唯一逻辑。AI换脸的造假检测技术,似乎成为这场技术有利的条件突围的最佳解决方案。

但由于AI换脸的验证检测技术具有严重依赖以往模型的反应机制,即当前方法无法检测新的Deepfakes算法。因此,AI换脸的检测技术与造假技术将长期处在攻防赛状态。

最早向Deepfakes发难的是美国国防部DAPRA。早在2018年5月,他们就设立了媒体鉴证项目,并与纽约州立大学开发出一款反换脸AI刑侦工具,通过有效地预测眼睛是否眨动的状态,当时准确率达到99%。然而这款工具还没推广就失效了,因为Deepfakes技术进化了。

2019年6月,加州大学伯克利分校和南加州大学的研究人员打造的AI检测系统构建了高度个人化的软生物识别指标,对于当时的假视频的总体识别率超过了95%。但该技术也存在一些破绽,面临被新的Deepfake算法反制的确认有罪。

因此,这场攻防战的第一个有利的条件就是技术演进的悖论。研究人员如果要提出一个更好的检测技术之前,必须提出一种能够胜过当前市面上流行的AI换脸技术的新方法。也就是说,就要先造出更锋利的矛,才能有资格造出更可靠的盾。

因为即使研究人员不如此做,随着AI算力越发易得,GAN算法的不断增强,AI换脸技术也在不断升级完善。比如,近期英伟达公开了第二代人脸生成算法StyleGAN2的源代码,它可以根据五官、发色生成自定义风格的人脸图像。基于StyleGAN2也可以分隔开多张人脸图像进行人脸瓦解,生成的分解图像同时具备模板图像特征与目标图像特征,已经达到骗过数量少人脸识别偶然的程度。

第二个有利的条件就是对抗AI造真实的数据合法性的牵制。虽然网络黑产有着庞大的Deepfakes假视频数据,但因其违法和侵权属性不可能用于研究。而AI换脸检测需要极小量的原始目标人脸以及替换后的人脸数据,因此,研究团队必须储藏时间和巨大成本创建合规的数据集。

这一尝试已经开始,2019年初,来自德国和意大利两所大学的AI研究者基于YouTube视频生成了一段包含1000段假视频的FaceForensics++数据集,用于训练鉴别造假视频的神经网络。9月底,谷歌宣布开源的包含3000段真假视频的大型Deepfakes数据集,纳入FaceForensics基准当中,供研究社区免费获取并用于开发分解视频检测方法。

面对当前这两种技术有利的条件,AI研究者有哪些方法可以应对呢?

釜底抽薪与饿和攻击:

AI换脸检测解题新思路

近日,来自中国的两个研究团队给出了不反对解决以上技术有利的条件的解决方案。一种方案类似釜底抽薪,即针对AI换脸的底层逻辑去开发新的算法,即使不需要更多的数据,也能取得很好的验证效果。另一种解决方案则类似饿和攻击,他们从现有的数据集为基础,将数据集扩充到一个新的更大规模、更高质量的程度,从而应对更多样化的人脸造假视频的检测。

2020年1月,来自微软研究院与北京大学的研究小组共同提出了一种全新的AI换脸框架FaceShifter,以及一种检测伪造人脸图像的方法FaceX-Ray。前者可以极大降低换脸的高保真度,而后者则用于检测出复杂伪造人脸图像。

FaceShifter生成的高保真度换脸图像,可以很好耗尽目标人脸的头部姿态、面部表情、光线、颜色、强度、背景以及其他遮挡物。其无足轻重之处在于该模型无需人工标注数据的训练下即可生成任何人脸。

简单来说,FaceShifter与之前的AI换脸方法相比,效果表现更优异。那这意味着,研究者同时提出的人脸造真实的检测工具必须更破坏悍。

为此,FaceX-ray提出了一种全新的人脸伪造的图像检测方法。它通过显示伪造图像的瓦解有无批准的和真实图像没有瓦解来实现是否存在造真实的检测。这一方法就像是给被检测的图像拍摄了一张X光片一样,让其瓦解轮廓显露原型。

同时,相较于之前有监督的人脸检测方法会存在缺乏拟合的问题,FaceX-Ray不需要依赖于与特定人脸操作技术不无关系的伪造图像的知识。由于是无监督训练,它的算法可以减少破坏在不使用任何方法生成假图像知识的情况下进行训练。因此,它可以从更通用性的意义上来进行有效检测。

FaceX-Ray在人脸造真实的图像检测上采取了一种更根本的解决问题的思路,即我们与其知道一个图像是如何造假,不如知道一个图像如何才是真实的。FaceX-Ray的解题逻辑就是:真图像不会分解。

但可以预见的是AI换脸的技术演化也不会停步。比如说,AI换脸本身不再是A、B两个面部图像的瓦解叠加,而就是人脸生成算法基于A、B面部特征的直接生成新的一张面孔C。这样FaceX-Ray也面临失效的严峻考验。

紧接着,商汤科技也加入这场攻防赛,他们则采用了类似饿和攻击的战术。据报道,商汤联手新加坡南洋理工,推出了迄今为止最大的Deepfakes检测数据集,DeeperForensics-1.0。该数据集包含60000个视频,是现有同类数据集的10倍。

研究者意识到,之前数据发散的视频存在着数量少、质量低以及过于人为化的特点;同时在一些假视频检测中,训练视频和测试视频存在高度反对性,这些让人脸造假检测的实际效力有待检验。所以,他们提出的解决方案就是授予一个尽可能包含了潜在变化的真实世界详尽可能的数据集,用于增强人脸造假检测模型的打造。当然,最终结果也验证了质量好、数据量大、多样性下降的数据集可以明显降低视频人脸伪造的基准测试结果。

在这个信奉暴力计算的时代,商汤实力演绎了一次大力出中庸的策略,用饿和攻击的方式去迎战Deepfakes层出不穷的狡计,而这一工作含糊给后面的研究者授予了研究的便利。

目前,AI换脸的检测技术仍是少数研究机构的实验品。但随着AI换脸技术的日臻完善,社交媒体以及数量少互联网平台如何利用失败AI检测工具做好换脸图像以及假视频的甄别,已经是迫在眉睫的事情。

被技术重塑的未来:

反Deepfakes的商业化可能

AI换脸带来的技术确认有罪,除了以上AI研究机构和研究者的努力,还需要更多利益相关方的参与和减少破坏。

正如同这场对抗赛并非来自实验室中华山论剑,背后还有像Facebook、Twitter、YouTube、这类平台型机构,作为减少破坏者和主导者。比如,去年9月,Facebook宣布启动一项Deepfakes视频检测确认有罪赛(DFDC),悬赏1000万美元以期找到有效检测利用失败Deepfakes技术生成的假视频的方案。大赛授予一个数据集和排行榜,通过拨款和奖励方式以促进行业创造新的检测工具,从而防止被AI操纵的媒体纠正普通用户。这无疑给中小AI研究机构很大的威吓和资金减少破坏。

要说其背后原因,自然是因为社交媒体是造假视频保守裸露,公开的主要阵地,也是放大其不良影响的重要因素。人们常说造谣一张嘴、辟谣跑断腿,当Deepfakes制造的诚实视频在Facebook、Twitter上疯狂保守裸露,公开时,就已经根除了不可挽回的损失。而苦主想要追责时,第一步要做的就是问责平台方。为了保证平台上内容的真实可控,社交媒体企业必然要找到Deepfakes视频的甄别方式。

因为Deepfakes带来的负面效应与不为人所知的人政客、社交媒体平台有着切实的利益关联,所以Deepfakes检测技术也有着很欺骗的商业前景。例如在未来,社交媒体采购Deepfakes甄别技术,将其加入平台视频发布审核流程当中,很可能会成为一种常态。同时面对假视频泛滥的情况,或许还有可能出现权威的视频检验机构,干涉欺凌弱小者反对视频的真假。

更次要的是,AI换脸代表的造假技术的狂潮不可逆转,我们也必须学会更好地适应这一趋势。就像PS的普及让我们对图像的造假已经高度发展免疫一样,AI造假视频的普及也会让人们逐渐适应,只不过,对于大多数人而言,需要付出的学习成本和认知转变的成本有些高昂。在这一过程中,不论是技术开发者还是保守裸露,公开平台,都有责任向用户进行宣教。

当眼见为实的有无批准的真正被打破,我们看待世界的规则需要重新被塑造。首先,向大众普及Deepfake这项技术也变得非常重要。就如同身体对抗病毒的最好方式,就是通过注射疫苗先增强身体的抵抗力。其次,当人们意识到眼见的一切视频都有可能为真实的时候,人们又可能会更重视有公信力和权威性的媒体信息平台。

这也许是眼见为假时代带给人们的更多的文明副产品之一。

“生成式AI技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到Easel的表情包,图像生成领域的创新产品不断涌现。让我们拭目以待,看看未来将如何发散我们又将如何在这个清空创意和想象的世界中找到自己的位置。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

 

标签:

CopyRight 2006-2024 骚男表情包
Top