【7266XLa122】小乙运维杂货铺-【持续更新在线离线混部潮汐调度开发k8s大集群资源利用率提升默认班级-7360284802190153999】-209900圆-220节_220
课程目录:
01-1_1_先梳理一些关键词.mp4 (22.14MB)
02-1_2_k8s集群提供的资源有哪些.mp4 (85.68MB)
03-1_3_Prometheus计算k8s集群利用率公式.mp4 (163.37MB)
04-1_4_cpu-mem申请率使用率差距问题.mp4 (25.04MB)
05-1_5_在线集群利用率低的问题.mp4 (76.15MB)
06-1_6_在线离线业务的特点.mp4 (91.82MB)
07-1_7_在离线混部的成本价值.mp4 (68.47MB)
08-1_8_在离线混部3种决策方式.mp4 (55.71MB)
09-1_9_在离线混部技术门槛.mp4 (32.22MB)
10-1_10_业界在离线混部方案解析.mp4 (69.9MB)
100-17_3_追查containerd作为cri时监控指标的问题.mp4 (121.45MB)
101-17_4_windows安装docker-registry私.mp4 (195.82MB)
102-17_5_试试特定版本的cadvisor-ds.mp4 (213.52MB)
103-17_6_通过sm采集到Prometheus查看.mp4 (315.94MB)
104-17_7_继续排查这个issue追踪summary上游.mp4 (87.55MB)
105-17_8_用token直接请求kubelet接口.mp4 (86.86MB)
106-17_9_追查源码之handlerSummary的syste.mp4 (131.53MB)
107-17_10_podStats如何获取到的.mp4 (74.85MB)
108-18_1_完成非onlyCPUMemory的全量sta.mp4 (121.26MB)
109-18_2_继续追踪podStats.mp4 (130.41MB)
11-2_1_学习小红书的方案.mp4 (107.26MB)
110-18_3_Partially就是一部分cad一部分cri.mp4 (186.51MB)
111-18_4_Strictly就是全部cri.mp4 (154.14MB)
112-18_5_cadvisor的ListPodStats代码追踪.mp4 (122.46MB)
113-18_6_kubelet中的csp到底是哪种.mp4 (86.41MB)
114-18_7_画kubelet中的stat-summary调用链.mp4 (84.24MB)
115-18_8_画kubelet中的stat-summary调用链.mp4 (151.01MB)
116-18_9_介绍一个好用的工具.mp4 (90.66MB)
117-18_10_研究源码之工具如何做到disk的stats.mp4 (82.55MB)
118-12_1_解析对比的promql和预聚合规则.mp4 (84.27MB)
119-12_2_计算空闲资源的逻辑.mp4 (29.36MB)
12-2_2_学习百度的方案.mp4 (119.64MB)
120-12_3_完成取整逻辑的代码并测试.mp4 (71.71MB)
121-12_4_计算可混部资源的代码.mp4 (77.15MB)
122-12_5_设计平均值的队列.mp4 (100.85MB)
123-12_6_把代码进行备份.mp4 (109.39MB)
124-12_7_添加平均值逻辑后的测试.mp4 (73.07MB)
125-12_8_描述现在更新周期的问题.mp4 (35.7MB)
126-12_9_通过chan协同即可.mp4 (133.41MB)
127-12_10_按照mem的模式去改造cpu.mp4 (50.85MB)
128-13_1_现在的问题和解法.mp4 (41.92MB)
129-13_2_获取kubelet-pods的数据接口.mp4 (134.39MB)
13-2_3_学习网易的方案.mp4 (109.87MB)
130-13_3_根据Uid设计匹配map.mp4 (84.02MB)
131-13_4_打上离线pod标签进行测试.mp4 (106.17MB)
132-13_5_让离线标签的kv可以配置.mp4 (85.25MB)
133-14_1_我们在cgroup上的目标是什么.mp4 (59.23MB)
134-14_2_开启cgroupv2的软件和系统要求.mp4 (94.99MB)
135-14_3_cgroupV2的各种控制器.mp4 (117.85MB)
136-14_4_cgroupV2如何设置cpu资源limit.mp4 (124.26MB)
137-14_5_cgroupV2如何设置Memory资源limit.mp4 (181.02MB)
138-14_6_验证k8s给几种qos的pod设置的cgroupv.mp4 (125.55MB)
139-14_7_继续解读guarantee的pod.mp4 (100.11MB)
14-2_4_学习B站的方案.mp4 (132.35MB)
140-14_8_开启kubelet绑核的逻辑.mp4 (203.71MB)
141-14_9_实验gpod的绑核的逻辑.mp4 (127.69MB)
142-14_10_burstStable和besteffort.mp4 (79.84MB)
143-15_1_测试besteffort的总的资源限制.mp4 (99.31MB)
144-15_2_设置bt的cgroup的cpu上限.mp4 (129.77MB)
145-15_3_父级会被重置那么bt单个pod呢.mp4 (78.81MB)
146-15_4_如果父级和子级都设置了-那么看谁的.mp4 (18.08MB)
147-15_5_kt项目中v2的cg是怎么设置的.mp4 (93.87MB)
148-15_6_项目代码中去设计cgManager.mp4 (55.88MB)
149-15_7_设置混部大框的逻辑.mp4 (82.51MB)
15-2_5_我们这个课程需要做什么.mp4 (65.29MB)
150-15_8_编译测试.mp4 (60.87MB)
151-15_9_设置内存.mp4 (43.16MB)
152-16_1_整理一下思路.mp4 (27.94MB)
153-16_2_动态的rr需要提供podMap.mp4 (146.92MB)
154-16_3_rr接口中暴露这个map.mp4 (90.1MB)
155-16_4_拼接单一podCgV2的路径.mp4 (85.65MB)
156-16_5_设置单一pod代码.mp4 (89.49MB)
157-16_6_进行测试.mp4 (111.45MB)
158-16_7_构造申请扩展资源的pod测试发现cpu的bug.mp4 (96.94MB)
159-16_8_压测cpu测试限制.mp4 (100.46MB)
16-2_6_调研市面上的开源组件.mp4 (85.43MB)
160-16_9_压测Memory发现mount和shm64Mb的问.mp4 (129.45MB)
161-16_10_添加高权限后测试.mp4 (88.44MB)
162-17_1_用go写mem-use复制到容器中进程测试.mp4 (77.77MB)
163-17_2_修改代码缓慢的增加内存.mp4 (107.8MB)
164-17_3_再进行测试.mp4 (132.44MB)
165-17_4_进行驱逐管理器的调研.mp4 (53.99MB)
166-17_5_监控查询外部metrics的弊端.mp4 (36.71MB)
167-17_6_调研node-exporter是否支持localQ.mp4 (100.74MB)
168-17_7_负载阈值的判定的维度整机or在线.mp4 (78.91MB)
169-17_8_node-exporter进行交互并调研prom2.mp4 (109.61MB)
17-2_7_部署katalyst.mp4 (109.02MB)
170-17_9_prom2json项目源码解读.mp4 (77.33MB)
171-17_10_封装请求exporter的函数.mp4 (130.36MB)
172-18_1_整机cpu利用查询条件.mp4 (54.12MB)
173-18_2_设计rate的计算队列.mp4 (84.35MB)
174-18_3_驱逐管理器的初始化.mp4 (75.08MB)
175-18_4_从ne中获取总cpuIdle数据.mp4 (105.3MB)
176-18_5_cpuRate判定的框架.mp4 (59.41MB)
177-18_6_传参并初始化驱逐管理器.mp4 (125.35MB)
178-18_7_在linux上进行测试发现cpuCounter值时.mp4 (71.79MB)
179-18_8_推理这个问题过程.mp4 (104.18MB)
18-2_8_根据webhook日志研究代码.mp4 (168.3MB)
180-18_9_总结这个问题.mp4 (54.01MB)
181-18_10_更换proc解决方式.mp4 (72.84MB)
182-19_1_再linux上测试切换到proc方式.mp4 (76.47MB)
183-19_2_发现数据问题.mp4 (232.21MB)
184-19_3_如何利用proc计算cpu利用率.mp4 (96.76MB)
185-19_4_处理刚启动队列点数不到的情况.mp4 (72.47MB)
186-19_5_驱逐动作是同步做还是异步做.mp4 (108.31MB)
187-19_6_学习kubelet源码是如何驱逐pod的.mp4 (76.85MB)
188-19_7_结合kt代码决定单一pod的驱逐动作.mp4 (96.1MB)
189-19_8_研究直接criStopC是否会被kubelet拉起.mp4 (178.82MB)
19-2_9_查看hook对象的逻辑.mp4 (132.93MB)
190-19_9_回归Eviction对象吧.mp4 (131.96MB)
191-19_10_整合evict代码.mp4 (149.63MB)
192-20_1_进行测试.mp4 (155.5MB)
193-20_2_避免重复evict.mp4 (116.27MB)
194-20_3_准备混部的Deployment多副本进行测试.mp4 (92.61MB)
195-20_4_设计添加混部资源上报冷静期.mp4 (124.54MB)
196-20_5_在注释中梳理逻辑并设计数据结构.mp4 (57.27MB)
197-20_6_dy策略计算关闭时间添加动态map判定.mp4 (59.16MB)
198-20_7_节点压力检测增加冷静期.mp4 (95.62MB)
199-20_8_发现解决inotify-error重复打印的问题.mp4 (77.92MB)
20-2_10_需要额外安装的k8s插件.mp4 (122.55MB)
200-20_9_解决Watcher报的文件打开数过多.mp4 (177.51MB)
201-20_10_进行测试发现夯住问题.mp4 (128.96MB)
202-21_1_引入pprof去排查死锁问题.mp4 (203.11MB)
203-21_2_修复不停setSingle的问题.mp4 (63.3MB)
204-21_3_统一判断pod是混部的标准.mp4 (99.26MB)
205-21_4_准备dockerFile打镜像.mp4 (38.27MB)
206-21_5_准备daemonSetYaml文件发现proc挂载.mp4 (167.45MB)
207-21_6_解决sysfsPath挂载的问题.mp4 (161.65MB)
208-21_7_部署到k8s集群进行测试.mp4 (204.77MB)
209-21_8_修复node的proxy子权限问题.mp4 (120.67MB)
21-3_1_研究enhanced-k8s项目.mp4 (116.81MB)
210-21_9_校验容器中的目录和sysfs的问题.mp4 (115.23MB)
211-21_10_精简一下日志-针对周期性执行的.mp4 (158.54MB)
212-22_1_klog日志参数暴露.mp4 (75.3MB)
213-22_2_退出inotify错误编译的问题.mp4 (52.67MB)
214-22_3_调整一些参数.mp4 (87.41MB)
215-22_4_若要暴露metrics第一需要定好哪些指标.mp4 (34.12MB)
216-22_5_选择一个模块去实现collector接口.mp4 (133.68MB)
217-22_6_验证总的cpu和mem的资源.mp4 (71.95MB)
218-22_7_当前pod数量统计.mp4 (126.35MB)
219-22_8_cpu使用情况.mp4 (88.38MB)
22-3_2_研究给k8s项目打patch.mp4 (125.43MB)
220-22_9_grafana的大盘图.mp4 (179.32MB)
23-3_3_研究metrics代码的主流程.mp4 (129.17MB)
24-3_4_处理agent指标的逻辑.mp4 (165.55MB)
25-3_5_研究调度器代码的主流程.mp4 (170.96MB)
26-3_6_浏览几个调度插件的代码.mp4 (130.1MB)
27-3_7_查看控制器的代码.mp4 (166.19MB)
28-3_8_agent启动流程01.mp4 (168.76MB)
29-3_9_qrm_cpu_plugin解析01.mp4 (207.41MB)
30-3_10_驱逐管理器.mp4 (163.8MB)
31-4_1_阅读qrm的设计动机.mp4 (90.42MB)
32-4_2_SysAdvisor资源推荐模块.mp4 (97.47MB)
33-4_3_ResourceReporte模块的逻辑设计.mp4 (79.14MB)
34-4_4_总结kt项目中的组件的作用.mp4 (66.98MB)
35-4_5_我们要实现的组件和逻辑.mp4 (72.64MB)
36-5_1_为什么要使用扩展资源.mp4 (38MB)
37-5_2_扩展资源在pod的使用.mp4 (38.05MB)
38-5_3_kubectl-proxy的使用和原理.mp4 (43.8MB)
39-5_4_为节点发布扩展资源.mp4 (56.77MB)
40-5_5_清理资源并总结上报链路.mp4 (80.46MB)
41-6_1_画上报的puml图.mp4 (101.03MB)
42-6_2_学习设备插件的基础知识.mp4 (72.84MB)
43-6_3_搜索demo样例.mp4 (43.39MB)
44-6_4_安装部署熟悉流程.mp4 (94.81MB)
45-6_5_根据日志和监控查看代码.mp4 (78.18MB)
46-6_6_查看dm库的注册和listAndWatch流程.mp4 (103.37MB)
47-6_7_根据日志查看Allocate分配的源码.mp4 (97.72MB)
48-6_8_查看metrics打点的逻辑.mp4 (86.19MB)
49-6_9_查看kubelet的grpc方法PRL.mp4 (138.18MB)
50-6_10_kubelet中保存device信息的3层map.mp4 (81.5MB)
51-7_1_kubelet中device分配流程.mp4 (112.82MB)
52-7_2_完成这个puml图.mp4 (135.49MB)
53-7_3_Allocate的时候request中的device.mp4 (102.94MB)
54-7_4_Allocate的时候request中的device.mp4 (169.79MB)
55-7_5_根据kubelet本地device缓存查看代码.mp4 (80.32MB)
56-7_6_allocateFunc中的mount和env是干嘛.mp4 (146.42MB)
57-7_7_k8s主项目中的设备插件样例.mp4 (105.13MB)
58-8_1_做一些准备工作.mp4 (44.72MB)
59-8_2_agent解析命令行和启动退出.mp4 (71.85MB)
60-8_3_设备插件模块初始化报错.mp4 (49.69MB)
61-8_4_解决这个问题.mp4 (80.21MB)
62-8_5_修改脚本后测试.mp4 (73.33MB)
63-8_6_dp初始化并且启动grpcServer.mp4 (88.88MB)
64-8_7_打通初始化的逻辑后进行测试.mp4 (80.03MB)
65-8_8_prom-comm库依赖报错的问题.mp4 (98.41MB)
66-8_9_部署到K8s节点进行测试.mp4 (118.39MB)
67-8_10_设备如何更新数量.mp4 (85.24MB)
68-9_1_在updated中全量更新.mp4 (74.11MB)
69-9_2_讨论内存是否要考虑一下.mp4 (26.06MB)
70-9_3_改造代码拆分manager.mp4 (79.99MB)
71-9_4_支持内存扩展资源.mp4 (124.4MB)
72-9_5_3种感知混部资源的策略.mp4 (61.37MB)
73-9_6_定义接口和策略.mp4 (43.72MB)
74-9_7_根据策略配置进行初始化.mp4 (41.74MB)
75-9_8_调研proc库.mp4 (98.15MB)
76-9_9_获取总cpu和总内存的逻辑.mp4 (92.76MB)
77-9_10_进行测试.mp4 (88.29MB)
78-10_1_静态策略的上报.mp4 (77.7MB)
79-10_2_进行测试.mp4 (67.76MB)
80-10_3_将资源管理器传递给dp.mp4 (91.34MB)
81-10_4_适配代码后进行测试.mp4 (61.03MB)
82-10_5_改造内存的代码并测试.mp4 (88.57MB)
83-10_6_设计分时策略的思路.mp4 (27.32MB)
84-10_7_封装分时判断的前置方法.mp4 (60.04MB)
85-10_8_准备时间判断边界函数.mp4 (135.61MB)
86-10_9_封装judge函数.mp4 (57.72MB)
87-10_10_完成到时间后重置清零的逻辑.mp4 (69.84MB)
88-11_1_添加分时参数校验.mp4 (132.12MB)
89-11_2_测试分时关闭混部的逻辑.mp4 (96.76MB)
90-11_3_梳理动态策略的逻辑.mp4 (52.82MB)
91-11_4_借用k8s新源码课程中的fs分析2个章节.mp4 (38.26MB)
92-11_5_换成kubelet-summary链路并封装鉴权c.mp4 (111.29MB)
93-11_6_先获取podStats.mp4 (144MB)
94-11_7_获取bearerToken文件并进行测试.mp4 (61.59MB)
95-11_8_计算所有pod的cpu和.mp4 (121.5MB)
96-11_9_处理使用率小数的问题.mp4 (145.76MB)
97-11_10_先验证cpu数据的正确性.mp4 (143.79MB)
98-17_1_总结容器中的文件读写的场景.mp4 (141.08MB)
99-17_2_回顾一下容器临时存储的问题.mp4 (63.72MB)