切换到宽版
  • 7阅读
  • 1回复

[数码讨论]一觉醒来,国产显卡开始追着老黄的4060打了?[15P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
172324
金币
308916
道行
2004
原创
2406
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39027(小时)
注册时间: 2008-10-01
最后登录: 2025-07-28
只看楼主 倒序阅读 使用道具 楼主  发表于: 6小时前

照理说,新产品发布一类的文章托尼都是在工作日给大家写的,因为厂商们通常选择在工作日开发布会。

但是这家名叫 “砺算科技” 的厂商很神奇,他们周末加了个班( 被迫着我也加了个班 ),但是发布的东西却堪称非常重磅了 ——

首款国产自研 6nm 工艺显卡!

没错,是能插在电脑上打游戏的那种显卡,而且按照砺算在发布会上的说法,这款显卡的光栅性能赶超了英伟达的 RTX 4060,甚至还能稳玩 1080P 的黑猴?看完昨天咱们国内企业 “砺算科技” 的新品发布会,说实话托尼到现在人还是懵的。

因为根据相关报道,砺算科技截至 2024 年仅仅募资 6.28 亿,但是作为对比,我们每天都在骂贵的英伟达、骂不争气的英特尔和 AMD,他们哥仨的研发投入动辄就是几百亿。国内芯片创业公司用着十几分之一的资源“手搓”出了 4060 级别的显卡???

假如事情是真的,那这真的妥妥是一个 “显卡圈子” 的 DeepSeek 故事了。

不过着急看这两款产品详细测试的小伙伴估计要再等一等了,昨天发布的消费级显卡 7G106,及专业级显卡 7G105,不出意外应该是 8 月份产品送样,9 月份才开始量产。

所以真正的上手实测大家还得再等等,但是如果你还好奇昨天的发布会还公布了哪些细节,托尼这里可以带着大家再盘一下这两款国产自研显卡昨天公开的信息。

首先是这两款显卡核心的 GPU 部分,基于台积电 N6 工艺,并且采用了 “ 砺算科技 ” 自研的 TrueGPU 图形架构。这也意味着从计算核心到指令集完全由自主设计,而不是市场上常见的 “ 公版 IP 授权 + 自主优化 ” 的形式。

这样做有啥好处呢?举几个发布会录播提到的例子吧 ——

我们都知道,GPU 的 3D 渲染,也就是我们看到的图形,是根据无数的三角形像积木一样拼凑出来的。GPU 的渲染过程,就是三角形的拆分、拼凑和后续计算的过程。

根据砺算科技官方的说法,砺算 7G106 的三角形渲染,重构了图形管线的执行逻辑,智能乱序渲染,而且能根据负载情况动态分配计算单元。不用像传统的 GPU 图形一样,按照既定的步骤,低效地一步步执行,所以砺算 7G106 能够在适配场景下直接提升 50% 的渲染效率。

此外,砺算 7G106 还支持 FP32 或 INT32 的指令双发射,以方块形式存储矩阵数据等特性,可以优化 40% 的显存使用效率。

从这些支持特性上来看,砺算显卡的设计思路还是比较先进的 ——

就拿 FP32/INT32 双发射这点来说,我查了一下,NVIDIA 也是从 20 系显卡才开始支持,AMD 则是从前两年的 RX7000 系显卡才开始支持,英特尔则是从 A700 系列的独显才开始支持。

说完 GPU,接下来再来看下两款显卡的硬件规格:

根据发布会录播,消费级显卡砺算 7G106 搭载 12GB GDDR6 显存,但是功耗频率这样的基础硬件信息并未公布;参考同行爆料的信息,砺算 7G106 位宽 192bit拥有 192 个纹理单元(TMU)和 96 个光栅单元(ROP)

假设这个爆料属实,那么砺算 7G106 就是拥有 4060 两倍规模的纹理单元和光栅单元,那么它在跑分上超过 4060,好像就说得过去了。除此之外,砺算 7G106 支持 DirectX 12、Vulkan 1.3、OpenGL 4.6 和 OpenCL 3.0 等主流 API,大概是个够用但并不算进阶的水平。

因为目前 DX 12 API 最新的版本是 DX12 Ultimate,Vulkan 最新版本是 1.4。缺乏这两个 API 最新版本的支持,就意味着砺算 7G106 有可能不支持光追和可变速率着色(VRS),影响游戏时画面效果和帧率,并且在渲染能力上存在一定的劣势。

可变速率着色(VRS)示意,从左到右着色率变低

反观砺算想要挑战的行业霸主英伟达这边,先是在 2014 年发布的 GTX 900 系列显卡上支持了瓦片式渲染和改进的调度器,这两样技术其实也属于砺算这次宣传的 “ 智能乱序渲染 ” 的类似物。

但是英伟达直到 4 年后的 RTX20 系列才支持可变速率着色(VRS),然后才支持了完整的 DX12 Ultimate API,砺算 7G106 的后续产品,明显还有一些需要提升的地方。

其他方面,砺算 7G106 采用 PCIe 4.0 x16 标准,提供 4 个 DisplayPort 1.4 接口,公版卡没有 HDMI 接口

顺带说一下专业卡 7G105 的规格,整体来看处于中高端的水平 ——

配备 24GB GDDR6 ECC 显存、最大纹理填充率 384GT / s,最大像素填充率 192GP / s,支持 FP32 和 INT8 计算,FP32 最大吞吐量为 24 TFLOPS,也适合高像素渲染以及大模型训练。

前面架构和规格的部分,目前能公开找到的资料其实不多,但我相信参数啥的大家也就随便看看,游戏党们更关心的还是具体的实测 ——

之前也提到了,砺算 7G106 的部分光栅性能是强于 RTX 4060 的。。。

更贴近游戏性能的 3DMark Fire Strike( 1080p )测试,砺算 7G106 的跑分成绩为 26800 分,作为对比 4060 大约是2w7 到 2w8 的成绩,也几乎快追上 4060 了。

在更考验显卡性能的 4K 分辨率测试项目 Steel Nomad 里,砺算 7G106 的跑分也能有 2256 分,参考公开的测试数据,RTX 4060 这项测试的数据在 2302 左右。

总结下来,砺算 7G106 显卡的整体表现,虽然说不至于完全对标英伟达 RTX 4060,但光栅化性能是妥妥的赶上了,然后在一些小项目上体现出了自己的优势。

但是我们都知道,老黄除了硬件还有软件,就拿游戏来说,DLSS 是老黄的招牌。

根据发布会录播的来看,砺算也做了个名叫 NRSS 的 DLSS 类似物,但是没有实机演示;我在录播里看到,最后发布会现场是拿黑神话内置的游戏科学 NXSR 做了个超分的演示,也就是通过原生低画质 + 超采样实现 4K 分辨率运行黑神话悟空,但是对一款甜品卡来说,咱们直接看 1080P 的表现就好了。

《黑神话:悟空》在 1080P 分辨率、高画质设置下,砺算 7G106 平均帧数能过 70 帧,而且在打斗过程中,遇到野怪、释放技能和特效,也没有明显的掉帧情况。这个表现,其实跟 4060 关掉 DLSS “裸玩” 黑猴的帧数也差不多了(虽然没这个必要)。。。

更让托尼感觉到意外的是,明末:渊虚之羽在1080P 分辨率、高画质设置下,依旧能跑到 70 帧以上。参考同行针对这个游戏做的实测,RTX 5060 显卡在 DLSS4 多帧生成的条件下,可以达到 149 帧,但会感觉到明显卡顿。

考虑到这是个上线还没有两天的游戏,这么短的时间,砺算 7G106 肯定来不及针对游戏做适配,就能达到这种可玩的水平,那只能理解为砺算 7G106 核心规模更大,以及大显存、高位宽,带来的力大砖飞的提升了。

至于老牌的 3A 游戏古墓丽影:暗影,砺算 7G106 在游戏时只有平均 80 帧以上,表现就要差一些了。在同样的画质设置下,4060 对这款游戏有适配优化,可以跑到 147 帧。这其实也是摆在国产 GPU 面前的最大的问题,硬件追赶只是第一步,后续的驱动适配和游戏优化,路还长着呢。。。

如果托尼后续能够拿到这款显卡,到时候也会给大家来个全面测试。

感觉砺算 7G106 未来随着驱动的优化,整体达到 4060 的水平应该没有什么问题,而且游戏玩家们其实很包容国产显卡的,哪怕最后的实际表现不如 4060,或者说用着真有 bug,只要价格别割韭菜,愿意和国内玩家们交朋友,那我相信,大家都是陪着你一起成长的。

我们不妨对比另外一个国产显卡摩尔线程 S80——

一开始大家也吐槽摩尔线程的 S80 显卡很多游戏都玩不了,缺乏优化,但是后来它就降价了,有一阵的优惠价格甚至掉到了 1000 块钱左右,之后各路评论区对摩尔线程的评价一下子就反转了,变成了 “只有中国人真心对中国人好”。。。

所以问题来了,大家觉得这次砺算的显卡会卖多少钱呢?

撰文:Levi

编辑:米罗 & 洛洛

美编:阳光

图片、资料来源

砺算科技发布会

b站@憨色的手脚

游民星空@MadaoKing

知乎@Wallcae

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
172324
金币
308916
道行
2004
原创
2406
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39027(小时)
注册时间: 2008-10-01
最后登录: 2025-07-28
只看该作者 沙发  发表于: 6小时前
砺算科技首款国产6nm显卡深度解析:性能对标RTX 4060,但挑战才刚刚开始  
(2025年7月28日 09:25 农历闰六月初四)  

---

一、核心亮点:国产GPU的“手搓”奇迹  
1. 技术突破  
   - 6nm工艺+自研TrueGPU架构:完全自主设计计算核心与指令集,非公版IP授权,突破“卡脖子”风险。  
   - 性能对标RTX 4060:  
     - 光栅性能接近,3DMark Fire Strike(1080P)跑分26800(RTX 4060约2.7万-2.8万)。  
     - 《黑神话:悟空》1080P高画质70帧,接近4060关闭DLSS的表现。  
   - 创新设计:  
     - 智能乱序渲染提升50%效率,FP32/INT32双发射(英伟达20系后才支持)。  
     - 12GB GDDR6显存+192bit位宽,显存利用率优化40%。  

2. 低投入高产出  
   - 砺算科技仅募资6.28亿(2024年数据),研发投入不足英伟达/AMD/Intel的1/10,却实现4060级性能,堪称“显卡界的DeepSeek”。  

---

二、产品细节与实测表现  
| 型号       | 消费级7G106               | 专业级7G105                |  
|----------------|-------------------------------|--------------------------------|  
| 工艺       | 台积电6nm                    | 台积电6nm                     |  
| 显存       | 12GB GDDR6                   | 24GB GDDR6 ECC                |  
| 计算性能   | 未公布                       | FP32 24 TFLOPS                |  
| 接口       | 4×DP 1.4(无HDMI)           | 未公布                        |  
| 适用场景   | 游戏、主流图形任务            | 高像素渲染、大模型训练        |  

- 游戏实测:  
  - 优势:新游戏《明末:渊虚之羽》未优化下70帧,显存与位宽“力大砖飞”。  
  - 短板:老牌3A《古墓丽影:暗影》仅80帧(4060优化后147帧),驱动适配待提升。  
- 技术局限:  
  - 不支持DX12 Ultimate/Vulkan 1.4,缺失光追、可变速率着色(VRS)等进阶功能。  

---

三、挑战与市场前景  
1. 核心问题  
   - 软件生态薄弱:缺乏DLSS级超分技术(NRSS未实装),游戏厂商优化适配不足。  
   - 量产与成本:9月量产,定价成关键(参考摩尔线程S80降价后口碑反转)。  

2. 机遇  
   - 国产替代窗口:美国芯片禁令下,国产GPU需求激增,玩家对“性价比”容忍度高。  
   - 政策支持:国家大基金、地方补贴或助力后续研发。  

> 用户期待:若定价亲民(如2000元内),即使性能稍逊,市场仍愿支持“国产交朋友”。  

---

四、横向对比与行业意义  
| 维度       | 砺算7G106          | RTX 4060           | 摩尔线程S80        |  
|----------------|------------------------|------------------------|------------------------|  
| 工艺       | 6nm                   | 5nm                   | 12nm                  |  
| 显存       | 12GB GDDR6            | 8GB GDDR6             | 16GB GDDR6            |  
| 光追支持   | 否                    | 是                    | 否                    |  
| 价格(预估)| 未公布(期待<2000元) | 2499元起              | 曾降价至1000元        |  

历史启示:摩尔线程S80通过降价赢得用户宽容,砺算若复制此策略,或加速国产GPU生态建设。  

---

五、总结  
砺算7G106的发布标志着国产GPU从“有无问题”迈向“可用问题”,但需警惕:  
- 短期:驱动优化与游戏适配是生死线。  
- 长期:构建自主软件生态(如NRSS超分)才能对抗英伟达“CUDA霸权”。  
玩家心声:“只要价格够香,bug我们一起修!”
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个