一机四显卡工作站编程环境搭建


办公室写代码,我发现我需要一个一机四卡的编程环境。首先我需要有一个可以科学上网的环境,安装依赖包比较方便,因此一般的公有云服务器直接就忽略了,安装环境太费劲;自己搭建一个云服务器,购买一个VPN也不是不可以,但我需要本地查看图像合成的效果,因此云服务写代码不方便;另外的话,单卡的编程环境在AGI大模型时代不够友好。

开始着手搭建工作站,才发现市面上已经没有支持4显卡的主板了。有也只有超微这种服务器主板支持,华硕的一机四显卡只能支持三显卡。其中两个插槽隔得很近。找来找去还是我2016年花几万块钱购置的deeplp老婆机比较管用。技嘉X99是一个经典大主板,支持一机4卡。但大半年没用他写代码,开机时发现电脑已经点不亮了。

问题现象:开机,所有一切组件全部正常运转。CPU发热,内存显卡风扇均正常。但外设都不能点亮。键盘鼠标和屏幕都不亮。

拳不离手,曲不离口。看paper写代码需要像吃饭睡觉一样熟悉,对于朝夕相处的工作站,我也决定动手再玩一把。

解决方案:

1、显示器连接线问题。首先觉得是不是连接线不对。买了新的连接线,然后买了新的鼠标键盘,没有解决问题。

2、找美团维修。找了美团的维修师傅上门。折腾一番,他用他自带的主板,插上电源线,点亮屏幕,因此确定核心问题是主板的问题。

3、找技嘉官方维修,确定主板纽扣电池没电。这一块给了我启示。技嘉的技术断定是进不去BIOS。是主板上的纽扣电池已经8年了,应该是没电了。需要更换。立即就买了新的纽扣电池更换。

4、CLR_CMOS跳线短接。更换纽扣电池后仍然不亮。技嘉技术给出一个解决方案:CLR_CMOS跳线短接。把电源开关打开,这个跳线就在电源跳线PW- PW+的上面。短接了一下、两下、三下,都没有反应。技术说一般短接会自动重启的。发现貌似没有起效果。

5、更换内存条插槽。由于技嘉X99是一个有8个内存条插槽的主板,左右各四个插槽。官方说明上,人脸正对主板,CPU在中间,显卡在下面,单根内存条需要点亮机器,一般建议插在最右边的插槽上。这里需要说明,三星的内存条和光威的内存条好像有不一致性。试了好几个插槽,有的主板插槽上有灰尘,也阻碍了表现。

最后,得出结论,光威的内存条应该左边第三个插槽,如图所示:然后点亮了屏幕。点亮后,屏幕提示:BIOS已经重置,请重新设置时间,我看了下,时间确实变成了2000年1月1日00:00。这个时间点也很有纪念意义,他是跨世纪的最开始时间,也是当时计算机时间表示的一个挑战点:如何从19**表示法跨越到20**。

里面的逻辑东西不多,纯属计算机手工手艺活,随手纪念一下。

电源买了长城的1300w的电源。显卡没有用4090,因为它功耗太大,近500w,用的是250w左右的显卡,显存也是20+G。其他就不啰嗦了。
多看paper,勤敲代码,干有意义的事!人生总归要给世界创造一点新东西的。否则如何证明自己让世界变好了一点呢?


请使用浏览器的分享功能分享到微信等