EKS部署显卡集群 背景部署共享GPU集群,加速AI应用计算。 步骤1 创建还GPU的node-groupAMI选择AL2_x86_64_GPU,自带显卡需要,省去手动安装步骤。建议选择nvidia显卡机器。节点打上tag: eks-node=gpu,后面安装驱动用。 2 helm安装 nvidia-device-plugin123456789helm repo add nvdp https://nvidia.git 2024-04-09 #tech #k8s
使用Win作为开发环境 使用macos/linux作为开发环境已经有近10年了。最近换电脑,看着新款macbook pro m3有点反向升级。考虑到,一方面最近大公司发力AI,据说2024年即将发布win12对AI整合不错,另一方面如果win实在使用不习惯,可以装linux或黑苹果,所以索性换成win x86笔记本。下面记录使用win11作为开发环境,遇到的问题和解决方案。 2024-02-07 #dev #note
K8s日志收集Loki 主流的K8s日志收集方案ELK需要部署es集群,很重,需要的机器资源比我们运行服务的机器还多。调研发现轻量级日志方案loki,正好满足我们需求。 2024-01-30 #tech #k8s
Go配置热更——动态绑定 当我们使用配置中心时,我们希望配置热更。一般的实现方式是,读取配置初始化并增加变更监听。这种方式可以实现,但需要我们维护配置变更逻辑,不友好。 在大多数场景下,我们想要的其实是一个func(),每次调用返回最新的结构化配置。Go 1.18增加了泛型,可以很优雅地解决配置热更问题。 我以nacos为例,写了一个动态绑定库bind_nacos_cfg。 接口如下 12345678// Supplier 2022-11-15 #编程