比特币矿机油冷系统
一、矿机油冷系统概述及核心竞争力
区块链技术是面向未来的关键技术,推动互联网从信息传输阶段发展到价值传输阶段,实现价值的无国界传输,并且于2016年12月列入《“十三五”国家信息化规划》,同时习近平总书记提出要把区块链作为核心技术自主创新的重要突破口,加大投入力度,加快推动区块链技术和产业创新发展。目前区块链应用的代表技术为价值传输、元宇宙、web3, NFT等,这些区块链技术应用是建立在以工作量证明(Proof of Work)为核心的高性能计算机(矿机)计算能力上的,而如何低成本解决矿机的散热和噪声问题是目前面临的关键技术问题。
丰大云计算于2020年所自主研发的龙矿油冷系统能够低成本解决区块链ASIC(Application Specific Integrated Circuit,专用集成电路程序芯片)矿机的散热问题,油冷系统硬件成本可控制在2500元/台矿机。矿机由于其芯片排列密集、芯片热流密度高(通常20-30w/cm2),对其芯片和电源等冷却的传统方法是风冷法,这类传统的风冷系统具有湿度大及沙尘环境适应性差,噪音大、能耗高等问题,同时冷却性能经常达不到预期,导致超级计算机芯片温度过高(大于100℃)而引发算力不足。
龙矿油冷系统采用油冷的方式来克服传统风冷系统的缺点,其基本原理为:使用绝缘油对矿机芯片等电子元器件产生的热量进行热传导,利用换热器将绝缘油热量传递给冷却水塔进行散热,实现矿机的静音、稳定超频运行。

龙矿油冷系统是矿机油冷方向的开创者,2020年开始研发,在2021年5月前已经完成设计、制造、技术验证、客户项目试用等工作,推出了40kw/120kw两种区块链高性能计算机冷却系统,目前已经销售至阿根廷、巴拉圭、美国、法国、加拿大、哈萨克斯坦、格鲁吉亚、俄罗斯、安哥拉、马来西亚、澳大利亚、埃塞俄比亚、阿联酋、沙特阿拉伯、伊朗、中国台湾、中国等十七个国家和地区的20+大规模矿场及50+国际客户,最长使用时间为连续运行2.5年,龙矿油冷系统目标为连续无故障运行15年以上,有望占据矿机油冷系统的大部分市场份额。
龙矿油冷系统的核心竞争力体现在技术和市场两个层面。从技术层面看,首次实现了36kw高性能计算机的散热需求,目前每层油冷系统可以对8台高性能计算机进行降温,降温后芯片温度小于80摄氏度,优于风冷系统的90-100摄氏度,同时可以超频运行,计算能力提升30%-70%;从市场落地层面看,龙矿油冷系统在研发阶段就与高性能计算机电源厂家进行配合,提供油冷系统以帮助他们测试优化超频电源,从而占据了矿机油冷市场的主导权,目前客户一致反馈油冷系统性能可靠,积累了大型矿场的运行经验。
二、龙矿油冷系统的主要特点及关键技术
龙矿油冷系统的主要特点是解决传统风冷散热的缺点,低成本解决矿机的散热问题,提高了矿机的运算效率,并能安全稳定长周期运行。传统风冷矿机的缺点为:
1、静电:高速散热风扇扰动空气中的灰尘产生静电击穿芯片导致故障。
2、氧化:高温运行的芯片暴露在空气中被氧化,导致散热界面接触不良,加剧芯片温度上升。
3、湿度:不可预测的雨水天气和水帘的使用,使得设备环境湿度过高(湿度大于70%),导致线路板结露,介电常数改变,高频阻抗改变,设备无法稳定运行,尤其对电源的损害很大,限制了矿机在热带地区的使用,例如安哥拉尼日利亚刚果巴拉圭东南亚各国。
4、震动:老化的风扇轴承使得设备运行在高频震动的状态下,加速散热片脱落。
5、高温:过高的天气温度和不合理的厂房散热导致机器高温宕机甚至损坏。
6、灰尘:空气中的粉尘、花粉、絮状物等进入机器散热片中沉积下来,导致通风不畅,机器易发高温,阿联酋沙特伊朗及美国德州戈壁属于这类灰尘较大地区,风冷矿机易损坏。
7、噪音:单台机器噪音达到80-90分贝以上,噪音大。
油冷系统由于密闭性好等原因,能有效克服传统风冷的缺点,具体特点为:
1、将矿机运行的噪音降至环境背景噪音(~60db)以下,只有油流动的声音;
2、实现了矿机的超频功能,矿机算力可提升30%-70%,超频后芯片温度控制在80℃以下,优于传统风冷系统的90-95℃;
3、在较小的机柜尺寸空间内实现大功率散热,在1190mm*1140mm*715mm空间内实现最大40kw的散热能力,满足8台矿机同时运行的需求;在1070mm*1300mm*2160mm空间内实现最大120kw的散热能力,满足24台矿机同时平稳运行的需求。
4、故障率低:采用矿机浸入式油冷方式,隔绝了空气、杜绝了水汽侵蚀、芯片氧化、风扇震动、静电灰尘等带来的高性能计算机损伤,降低了90%故障出现的可能。
5、易部署:油冷系统对机房设施要求不高,房间可以全封闭,不需要额外通风设备,通过户外部署冷却水塔循环管路来实现散热。
综上所述,油冷系统的刚需用户为降低噪声需求用户和特殊地域限制用户(湿度过大地区和沙尘严重地区);当比特币币价大于30000u时,选择油冷系统进行超频的经济性远大于传统风冷矿机,这个时候油冷系统会普及全世界大部分矿场。

龙矿油冷系统的关键技术为:
1、高温保护功能,能够在油超温情况下(例如>50℃,注:温度的阈值可按需自行设定)自动断电,保证系统运行的安全性;
2、满足大功率换热需求的非标换热器设计;
3、大流量且静音运行的油屏蔽泵选型与设计;
4、远程控制的物联网模块及其配电系统;
5、箱体结构的整体喷塑以保证系统的绝缘性,杜绝触电风险;
6、配套冷却水系统的选项与设计,如降温水塔、水泵、阀门管道等选型及整体系统搭配,保证水冷却系统的稳定运行,而水冷却系统可以在冬季用来进行后续的供暖应用;
三、龙矿油冷系统的商业模式及产业化进展
本项目商业模式是给客户提供油冷全套解决方案,其中丰大云计算公司提供油冷柜,对于整套油冷系统来说,还需要对1、绝缘油;2、冷却水塔;3、循环水泵;4、冷却水管路;5、超频电源;6、超频控制板;7、拟速器;8、外电线等进行选型配置,对于1-8的配套,丰大云计算提供总体工程咨询及技术指导服务,帮助客户完成整套油冷系统的搭建。以美国德州100台S19j pro高性能计算机油冷系统方案为例进行说明。
条目 | 价格 | 说明 |
1、机箱组件 | 25.5 | 100台S19j pro需要100÷6=17台油冷组件, 17*15000=25.5万元。机箱组件设计规格为6台 S19/S19pro超频版; 设计功率为40kw。 |
2、低硫绝缘 阻燃油 | 4.89 | 230L/机箱组件,12.5元/L,17个机箱组件,油成本为 17*230L*12.5元/L=4.89万元。浸泡用油可以选择硅油、矿物油、 10/25/45号变压器油、低硫绝缘阻燃油,目前推荐使用低硫绝缘阻燃油, 已经安全运行5年无故障率;其他油品含硫量偏高,容易腐蚀电源线及算力板; 而低硫绝缘阻燃油在25号变压器油的基础上进行了脱硫处理, 加入了抗氧化剂,保证稳定长周期运行。 |
3、水冷却塔 | 1.20 | 冷却塔的循环量与客户总运行功率换算关系为:循环量=(0.23t/h/kw)*运行功率。 S19j pro超频后功率为5400w,150T,36w/T;总运行功率为100*5.4=540kw, 则需要(0.23t/h/kw)*540kw=124t/h循环量的塔; 塔参考价格:10T:1000元;50T:2900元;100T:7000元; 150T:12000元,250T:15000元。1T≈0.85t/h循环量。 选择1个150T的塔,1.2万元。 |
4、水泵 | 1.12 | 根据塔的循环量1:1配置相应的水泵,需要配置的水泵流量为120t/h。 水泵参考价格:10t/h:630元;90t/h:2500元;160t/h:5600元; 200t/h:7000元;选择2个160t/h的泵,(备件1个), 一共2*5600=1.12万元 |
5、冷却水管路 | 5.00 | 根据现场布置环境确定所需管路长度, 需要在当地找到专业管工进行装配,人工费参考当地价格。 主管道:6 inches,材料:PE;接管:2 inches,材料:PPR; 连接油冷柜管道:1.5 inches,材料:金属波纹管,长度为1米左右。 |
6、超频电源 | 14.00 | 可选择深圳谷欧6000W电源:~1400元/台;共需要100*1400=140000; |
7、超频控制板 | 13.00 | 谷欧S19j pro超频控制板~1300元/台,共100*1300=130000元; 也可选择超频固件:Braiin OS,vnish等。 |
8、拟速器 | 0.71 | 每台矿机配四个,16元/个。共需要400个,备件40个,440*16=7040元 |
9、外电线 | 1.00 | 矿场主电缆线到每台机箱组件的电缆航空插头距离根据实际情况而定, 使用16方的电缆线,当地购买。 |
总费用 | 以上9项费用相加,共需:25.50+4.89+1.20+1.12+5.00+14.00+13.00+0.71+1.00=66.42万元。 |
在产业化进展方面,丰大云计算开发的龙矿油冷系统已经完成前期的市场调研、技术验证、意向客户试用、大规模运行等工作,是矿机油冷系统的开拓者,所推出的40kw/120kw两种矿机油冷系统,配合冷却水塔、水循环泵、超频电源等设备,已经能够对整套油冷系统提供总体工程承包服务。该项目开始于2020年5月,经过近3年的发展,目前已经广泛应用于世界主流矿场,最长已经连续运行2.5年零故障,设计寿命为15年,有望占据矿机油冷系统的大部分市场份额。
丰大云计算可以针对客户需求开发多功能的油冷系统,例如高性能计算机油冷暖风一体机、矿机干冷散热机、电化学储能装置的油冷系统、超算中心油冷系统等。

四、潜在市场前景分析
矿机是维持去中心化网络稳定性的关键,随着价值传输、元宇宙、web3, NFT等区块链技术的应用,矿机的需求量会越来越大。就目前存量来说,以比特币ASIC高性能计算机为例,根据剑桥大学替代金融研究中心的研究,截至 2021 年 5 月 10 日,全球比特币挖矿的年耗电量大约是 149.37 太瓦时。这一数字已经超过马来西亚、乌克兰、瑞典的耗电量,已十分接近耗电排名第 25 名的越南。2022年9-10月比特币网络平均算力为256EH/s,以比特币网络功耗比均值50w/T计算,所消耗的电力为50w/T*256 000 000T=12 800 000 000w=1280万千瓦,即每小时有1280万kw·h的散热需求。这只是比特币区块链网络所需要的散热量,随着区块链技术的发展,未来的散热需求量约为现在的3-10倍,而且这些热能还有被广泛再利用的场景;从比特币高性能计算机存量来看,全世界目前有300-500万台每秒100亿次哈希碰撞以上能力的计算机,如果有50%的客户使用本项目所开发的8/24台机器两种油冷系统进行冷却,则需要25万套/8.3万套设备,以1.2万元/3.6万元进行售价,目前市场容量为30亿元。考虑到未来区块链技术的突飞猛进,对高性能计算机的散热需求会更多,预计油冷散热系统远景市场估计为100-300亿元。

五、矿机油冷VS水冷板冷却,谁是未来?
在矿机液冷市场,丰大云计算判断未来油冷系统会占据80%的市场,水冷板冷却会占据20%。油冷和水冷板冷却系统的共同点是终端热量都需要通过水冷塔系统或散热器系统进行散热,区别是油冷采用:算力板产热——热油——冷水对热油降温, 水冷版采用:算力板产热——热水——散热后变回冷水。
从自然环境的适应性来看,水冷板冷却和油冷相比,水冷板冷却存在一个天然的缺陷:水冷板无法创造一个脱离当地自然环境的运行环境。对于湿度大于80%的潮湿环境(尼日利亚和刚果热带雨林,安哥拉雨季,东南亚雨季,巴拉圭雨季),水冷板和电源都会覆盖一层水膜,机器连续运行时间很难超过1个月,就短路烧坏电源或者算力板控制板等,如果遇到停机再开机,电源和矿机启动时候损坏率非常高,可以用“放鞭炮”来形容。而对于极度干旱的沙漠戈壁地区(伊朗,沙特,阿联酋,美国德州戈壁,新疆大部分地区),由于当地空气中浮尘和沙尘含量高,这些沙子会沉积到算力板上,造成局部过热烧蚀。
从技术缺陷上来看,相比于油冷系统,目前水冷板技术上的主要缺陷有两条:
1、水冷板持续产生气泡且无法排出,导致芯片产热无法被带走,进而直接烧坏算力板或者烧穿水冷板漏水使算力板短路。目前水冷板采用直流道设计,芯片在工作时温度可达70-100℃,直流道中的水会被部分气化,直接产生大气泡,而由于水冷板的水循环系统压力很低(<0.2MPa,压力过大就会导致硅胶软管损坏,且高压无法传递给1-2分管的),所以积累的气泡就无法通过在主管路安装排气阀及时排出,当气泡越来越多,水与气泡的混合物就无法及时均匀地带走芯片所产生的热量,导致芯片过热损坏或者烧穿铝合金水冷板。这个问题的解决思路有两个:第一为开发水冷板分形微结构流道,使芯片在加热时不能直接产生大气泡,分形结构能够刺穿底部产生的大气泡而变成小气泡,避免水冷板局部过热;第二为设计低压水流动系统的排气装置。目前这两个问题之所以没有机构愿意解决,是因为国内知识产权保护措施很少,研发机构做好实验,投入重金开发好之后,相关竞争厂家能够轻易拆解得到结构设计图,从而进行仿造。

2、硅胶塑料管的质量问题而破裂漏水导致矿机烧坏。目前国内生产的硅胶塑料管,在硫化、成型、脱模等环节均存在工艺问题,产品质量低,很难适应矿机长时间连续运行的要求。解决方法是加大投入采购大厂成熟产品,且保证使用水质硬度比较低(钙、镁、铁、铝、锌等离子的含量小于8度)。
从投入成本上来看,油冷系统和目前水冷板系统的市场价均在2000-2500元/台矿机,基本持平,考虑到水冷板系统未来还要克服气泡排放和硅胶塑料管质量改进两个问题,价格可能略高于油冷。
从降噪上来看,目前油冷系统只有屏蔽泵轻微声音和油流动声音,小于环境背景音;而水冷板系统只能覆盖矿机,矿机电源仍然采用风冷方式,噪音偏大,未来需要开发水冷矿机电源才能完全消除噪声,目前已经生产出来的500-800万台矿机电源很难进行水冷改造,只能留给油冷系统使用。
从矿机适用性上来看,油冷系统适用所有已经出产的矿机,只要拆掉风扇,插上拟速器即可;而水冷板冷却需要给每种矿机匹配专用的水冷板,通用性较差。
从市场推广来看,目前水冷板冷却的推广优于油冷系统,因为矿机生产巨头蚂蚁在力推他们的水冷箱,近两年来,尽管遇到了很大的挫折(烧蚀,漏水,烧板),但是仍然在全力推广水冷,蚂蚁的逻辑很简单,水冷系统更简洁,不需要油作为中间传热介质,对于实际的两个技术缺陷和自然环境适应性暂时搁置,这也是丰大云计算认为未来水冷板冷却会占据矿机液冷市场的20%的主要原因,就是蚂蚁的影响力所能占据的份额,推算能够说服30%的客户采用水冷板,蚂蚁市场占有率65%左右,65%*30%≈20%。
龙矿油冷系统自从2020年被丰大云计算开发出来之后,一直被各路“捞快钱”的同行仿造,仿造中存在以下隐患:1、换热效果差导致油温过高烧坏机器及失火;2、使用劣质电器原件和不满足大电流的电线导致过载引发火灾;3、直接使用10/25/45号变压器油导致算力板与电源线腐蚀;4、使用来路不明的各种纯度不够的环烷基油(绝缘性能差,易分解)使矿机短路和过热爆燃。这些无良仿造商的各种事故,也是油冷推广产生的阻力之一,目前丰大云计算作为此市场的开拓者和领导者,保持2.5年20+矿场零事故的记录,我们能够对每一套销售出去的油冷系统质保2年,并且终身提供维护维修等技术服务,在未来3-5年,有望占领油冷市场的绝大部分。
六、其他常见问题解答
问题一、矿机油冷之后,会不会被腐蚀,相比较于传统风冷系统,矿机寿命是否会降低?
回答: 使用油冷系统运行矿机,矿机的算力板、芯片、电源不会被矿机专用绝缘阻燃油腐蚀,油冷系统矿机的寿命长于传统风冷系统,目前使用龙矿油冷系统的美国、中国、俄罗斯等矿场已经连续使用油冷系统3年以上,稳定运行。
从油的角度分析,矿机专用绝缘阻燃油是在25号变压器油的基础上,对25号油进行了脱硫处理,使油不会腐蚀电源线等线的外皮,然后加入抗氧化剂,不腐蚀算力板等硅基集成电路及芯片。特点:绝缘,阻燃,热传导好,不易挥发。可以一次加油,稳定运行5年以上。壳牌公司也推出了无硫变压器油,硫含量小于0.08%,国外客户也可直接采购符合iso-5662要求的变压器油,在中东地区售价约为国内的40-60%,在欧美约为国内价格的3-8倍不等。
如果直接使用矿物油、硅油、10/25/45号变压器油,会腐蚀电源线及算力板和芯片,矿机使用寿命降低。主要腐蚀原因有两个,油中的硫含量过高腐蚀电源线和算力板及芯片;油有一定的溶解性,少量的空气中的氧气会对高温的芯片和算力板有氧化作用,造成芯片和算力板失效。
目前矿机专用油首先进行了脱硫处理,去除掉了硫的腐蚀作用;加入的抗氧化剂,使油的溶氧量下降,造成无氧环境,保证矿机算力板等部件不会被氧化。
从风冷矿机及油冷矿机运行环境的角度分析,有以下两个特点:
I: 矿机风冷时芯片温度过高(80-100℃),芯片温度过高减少矿机使用寿命;油冷情况下,芯片温度控制在79℃以下,大部分芯片温度在55-65℃之间,能够保证芯片更稳定工作,延长使用寿命。
II: 风冷矿场四季变换,冬天积灰夏天潮湿,灰尘和潮湿的天气(空气中的水蒸气)都会腐蚀算力板等,寿命变短。油冷是无氧环境,温度持续稳定,不存在环境腐蚀问题。
问题二、油冷矿机能再改回风冷矿机吗?
回答: 随时可以改回风冷矿机。把矿机去除风扇,加上风扇拟速器,即可放到油冷环境工作。从油冷环境取出来后,可以用超声清洗机配合PCB洗板液清洗矿机算力板及电源,装上风扇后即可继续风冷环境运行。
问题三、矿机放油里面之后,如果有故障,会不会烧矿机?
回答: 矿机有双重保护,不会烧矿机。龙矿油冷系统的主油箱内有温度传感器,该传感器在油温达到50℃时会切断电源,保护矿机;另外矿机自身有温度控制系统,如果芯片温度或者算力板温度过高,也会切断矿机电源,防止烧机。
问题四、循环水冷却系统需要消耗多少水,循环水塔重量多少,能否放到楼顶?
回答: 龙矿油冷系统的热油-冷水换热子系统,确保热油及时降温为冷油,循环水系统的循环量=(0.23t/h)/kw*总功率,例如6台S19超频版功率为33kw,水塔需要循环水量为0.23*33=7.5t/h;循环量消耗水量≈0.3%*循环水系统循环量,一套1000负荷的油冷系统,每天需要通过自来水系统/井水/河水向冷却水塔补水量=24h*(0.23t/h)/kw*总功率1000kw*0.3%=24h*230t/h*0.3%=16.6t。
循环水塔自身重量参考值为10t/h循环量塔:50kg;24t/h:100kg;80t/h:200kg;160t/h:350kg;冷却塔的结构为:塔顶风扇、塔中喷淋装置及填料、塔底冷却水存储循环,冷却水存储重量10t/h循环量塔:200kg;24t/h:400kg;80t/h:1000kg;160t/h:2000kg;可以看出,冷却塔重量很轻,可以放在楼顶区域。
五、油冷系统中,最适合的机器是哪些?
回答: 龙矿油冷系统提供了让芯片高效散热的冷却环境,对于不改装超频电源及超频固件/硬件的所有矿机,均可拆除风扇后放置到油冷系统中长周期使用,放入油冷系统后,功耗可以降低约10%;
为了发挥油冷系统的芯片高效散热的冷却环境优势,目前最优选项是S19系机型(S19, S19j, S19jpro, S19pro, S19jpro+),可以稳定超频30%-60%;以S19/S19pro两种机型为例,S19可以由95T超频到126T,36W/T;S19pro可以由110T超频到168T,36W/T;回本周期相比较于风冷可以加快25%-40%不等(算上油冷设备、超频电源及超频控制板等投入成本)。

蚂蚁系列机器中T17、T17+、S17、S17e、S17pro五种机器的良品率约为10%-15%,即大约有10%-15%的机器超频20%-50%,具体数据为T17可以由42T超频到60T,T17+可以由58T超频到75T,S17可以由53T超频到70T,S17e可以由60T超频到80T,S17pro可以由56T超频到78T,S17+良品率为20%+,可超频到93T。
对于神马、阿瓦隆矿机,风冷中所跑出的最高超频数据即为油冷最低数据。