2025年PC端AI大突破,2026年生成式AI将全面走向大众
游戏日报
13 人阅读
|
0 人回复
|
2026-01-07
|
|
ComfyUI迎来全面RTX加速,LTX - 2迎来全面RTX加速,Llama.cpp迎来全面RTX加速,Ollama迎来全面RTX加速,Hyperlink迎来全面RTX加速,这些操作解锁AI PC上的视频生成应用场景,这些操作解锁AI PC上的图像生成应用场景,这些操作解锁AI PC上的文本生成应用场景。
2025 年是 PC 端 AI 发展的突破之年。
相比于二零二四年,PC级小语言模型也就是SLM的准确率提高了将近两倍,显著地缩小了和前沿云端大语言模型也就是LLM之间的差距。像Ollama、ComfyUI、llama.cpp、Unsloth等这样的AI PC开发工具日趋成熟,受欢迎程度同比翻倍,下载PC级模型的用户数量相比二零二四年也增长了十倍。
以下进展,将会促使生成式人工智能,在二零二六年,全面地面向大众个人计算机创作者,以及游戏玩家还有生产力用户。
在CES上, NVIDIA宣称要给GeForce RTX、NVIDIA RTX PRO及NVIDIA DGX Spark设备推出一系列AI升级,以此为PC上部署生成式AI解锁性能,并且降低显存需求,其中涵盖:
经过 PyTorch - CUDA 优化,并且在 ComfyUI 里原生支持 NVFP4 / FP8 精度,视频和图像生成式 AI 的性能能够提升至最高 3 倍,显存占用最多可降低 60%。
要在ComfyUI里进行RTX视频超分辨率也就是RTX VSR的集成,以此来加快4K视频的生成速度,没错吧?
针对Lightricks业界处于领先地位的,名为LTX - 2的音视频生成模型,将其开源权重版本予以优化,进而推出NVIDIA NVFP8量化模型, ? 。
针对利用Blender里的3D场景进行4K AI视频生成,提供了一个AI Blueprint,以此达成对输出结果的精准控制。
借助对 Ollama以及llama.cpp进行加速,将小型语言模型也就是SLM的推理性能提升至最高达35% ,。
给 Nexa.ai 的 Hyperlink 全新视频搜索功能,予以 RTX 加速支持,。
这些改进,使得用户可以享受本地RTX AI PC彰显出来的隐私性、安全性以及低延迟优势,与此同时,还能够在对先进的视频、图像及语言AI工作流持续进行无缝运行的状态下 。
在 RTX PC 上实现 3 倍加速的 4K 视频生成
AI生成式能够制作出令人感到惊艳的视频内容,然而仅仅依靠提示词的在线工具常常难以精准地控制其生成的效果。并且尝试去生成4K视频基本上是不可能的,这是由于大多数模型 的体量过于庞大,以至于难以载入个人PC的显存之中,导致的啊!
1月6日,NVIDIA推出了一套视频生成工作流,这套工作流由RTX加速,它能让创作者更精准地控制生成结果,并且还能以3倍速度生成视频,同时将视频提升至4K分辨率,而这仅需占用一小部分显存。
此套视频工作流,助力现代创作者,从分镜脚本着手,生成具备照片级写实画面的关键帧,且最后得以生成高质量的 4K 视频。整个流程由三大不同的 AI Blueprint 模块所构成,艺术家能够依据自身需求,灵活地进行组合以及调整,。
? 3D 物体生成器:用于创建场景所需的资产。
一种借助 3D 作为引导的图像生成器,用户能够专门在名为 Blender 的软件里,去匠心独运地搭建出特定样式的景象环境,并且依据所搭建的特定样式的景象环境,从而生成具备照片级写实水准的关键帧 。
视频制作工具:依据用户所设定的起始关键帧,还有结束关键帧,进而生成动画视频,并且倚仗 NVIDIA RTX Video 技术,把视频提升到 4K 画质。
这一视频生成工作流,是由Lightricks的全新LTX - 2模型来实现的,这个模型在1月6日正式发布,并且开放了下载 。
本地AI视频创作领域中,LTX - 2达成了关键里程碑目标,它生成效果能和领先云端模型抗衡,可产出最高长达20秒的4K视频,视觉保真度相当高,模型内部设有音频功能,支持多关键帧,凭借经过增强有可控低秩适配特性的的高级条件控制功能,创作者不用依靠云端,就能获得具备精细控制同时也有电影级画质的成果。
由ComfyUI在底层驱动的这套工作流,在过去的几个月时间里,NVIDIA同ComfyUI团队进行了紧密无间的合作,让其在NVIDIA GPU上的性能获得了40%的提升,而最新版本添加了对NVFP4以及NVFP8的支持,在RTX 50系列GPU上运用NVFP4格式能够达成3倍的性能提升,并且显存占用量降低60%,采用NVFP8格式的话,则能够实现2倍的性能提升,同时显存占用降低40%。
当下,NVFP4 和 NVFP8 Checkpoints 如今已在 ComfyUI 里直接向部分热门模型开放,这其中涵盖 Lightricks 的 LTX - 2、Black Forest Labs 的 FLUX.1以及 FLUX.2,还有阿里巴巴的 Qwen - Image和 Z - Image。使用者能够在 ComfyUI 里直接进行下载,往后还会支持更多模型。
视频生成一完成, 用户就能借助ComfyUI里全新的RTX Video节点,把视频在数秒内放大到4K分辨率。图像放大这个功能呀,它可以实时运行,能锐化画面边缘,还能消除压缩伪影,进而输出清晰的画面。RTX Video下个月会正式在ComfyUI上线。
为助力用户冲破 GPU 显存限制,NVIDIA 跟 ComfyUI 团队协作,进一步优化其 weight streaming 功能,启用此功能后,一旦显存出现不足情况,ComfyUI 能够调用系统内存,进而在主流 RTX GPU 上运行规模更大的模型以及更为复杂的多阶段节点图。
下个月,这套提供视频的生成工作流到时候会开放供人下载,至于 LTX - 2 视频模型的开源权重,还有 ComfyUI 的 RTX 相关更新,现在已经上线了。
全新的 PC 文件与视频搜索方式
几十年来在PC上,文件搜索方式基本没什么发生改变,依旧是主要依靠文件名以及零散的元数据,这样的方式致使想要找到一年前某一个特定文档的用户变得极其困难。
Nexa.ai推出的本地搜索智能体是Hyperlink,它能把RTX PC变成可搜索知识库,支持用自然语言提问,结果中还会提供可追溯引用来源,它可扫描索引文档、PPT、PDF及图像,让搜索不依赖文件名猜测,仅凭内容和需求,所有数据在本地处理并保存在用户PC上,以此确保隐私与安全。此外,Hyperlink具备RTX加速支持能力,于RTX 5090 GPU环境下,索引文本以及图像文件的速度大概是每GB 30秒,查询响应时间仅仅3秒。与之形成对比的是,运用CPU索引文件时每GB大约需要1小时,查询响应时间竟长达90秒。
于 CES 2026 之时,Nexa.ai 推出了 Hyperlink 的全新测试版本,增添了对视频内容的支持,借此用户能够在本地视频里搜寻物体、动作以及语音内容。此功能能够助力视频创作者迅速寻得所需的 B-roll 素材,或者让游戏玩家找出自己赢得比赛的精彩瞬间以与好友分享。
进行 Hyperlink 的私有测试版本体验,需前往 Nexa.ai 官网注册,访问权限本月起将陆续予以开放。
小语言模型 (SLM) 性能提升高达 35%
NVIDIA与开源社区携手,基于llama.cpp以及Ollama,给RTX GPU和NVIDIA DGX Spark桌面级超级计算机上的小语言模型带来了显著的性能提升,最新优化对混合专家模型(MoE)尤为有利,其中涵盖了NVIDIA近期发布的Nemotron 3系列开放模型。
在过去的四个月里,弱小语言模型的推理性能,于llama.cpp上,提升了百分之三十五,在Ollama上,提升了百分之三十。Ollama的相关更新,目前已经发布,而llama.cpp,已然提供了用户体验的升级,能够显著加快大语言模型的加载速度。
这些,性能提升,会在,LM Studio 的,下一次更新里,得以实现,并且将于,很快,应用到,各种,智能体应用之上,比如,全新的,MSI AI Robot 应用。MSI AI Robot呀,同样,受益于,llama.cpp 的,优化,使得,用户,得以更便捷地,控制,MSI 设备设置,而且将于;即将发布的版本中,整合,最新性能的、升级,。
NVIDIA Broadcast 2.1,把虚拟补光这个功能,给更多的PC用户带来了 。
NVIDIA Broadcast运用AI特效,来提升麦克风质量,还提升摄像头质量,进而成为直播的理想之选,也成为视频会议的理想之选。
2.1版本针对虚拟补光效果开展了性能优化工作,它不但支持RTX 3060及更高标准的GPU,而且能够适应更多种光照环境情形,提供更为广泛的色温调节范围,并且运用更新后的HDRi基础贴图,达成常见于专业直播领域里的双主灯效果,查看相关链接以下载NVIDIA Broadcast的更新版本。
知名热门直播平台Bilibili,马上就要集成那款更新过后的、虚拟补光的效果。这一回的更新,会让更多使用GeForce RTX的用户,在直播期间能够获取到更为优质的、面部补光的效果。那些对NVIDIA Broadcast特效感兴趣的开发者,要去查看最新版本的、软件开发工具包 (SDK) 。
DGX Spark,它能够把家居之中的创意工作室予以升级,使其成为 AI 超级工作站 。
每个月,愈来愈多更具强大能力的AI模型持续不断地登陆PC端,在此情形下,开发者对于具备更高性能、更为灵活的本地AI环境的需求一直在持续增长 。DGX Spark是一款紧凑型的AI超级计算机 ,它能够被放置在桌面上 ,可以与主力台式机或者笔记本电脑进行无缝配合 ,进而使用户能够跟现有PC共同去进行实验 ,开展原型设计 ,还能运行高级的AI工作负载 。
就开发者而言,其希望测试大语言模型、旨在进行原型化智能体工作流,对于艺术家来讲,他们期望在工作流里能够并行生成创作素材,而 Spark恰好特别适宜于他们,如此一来,他们的主力PC就能够按照原来一样持续开展编辑工作了。
在 CES 2026 这个时间点, NVIDIA 进行了 Spark 的发布动作, 发布的内容是关于 AI 性能的重大更新, 此次更新让 Spark 在和不到三个月前首次发布时相比较的情况下, 能够获得性能提升, 提升幅度最高可达高达 2.6 倍。
NVIDIA推出了全新的DGX Spark Playbooks,其中有用于推测解码的示例方案,还有使用两个DGX Spark模块微调模型的示例方案。
若是想了解NVIDIA RTX AI PC的相关信息,需要关注微博官方账号,还要关注抖音官方账号,并且要关注哔哩哔哩官方账号。
软件产品信息请查看声明。
关于NVIDIA
NVIDIA,其股票在纳斯达克的代码为NVDA,它在加速计算这一范畴之内,于全球范围之中,属于处在领先位置的那一方。
# # #
媒体咨询:
Jade Li
NVIDIA GeForce, Studio PR
邮箱: |
|
|
|
|
|
|
|
|