Wsgbxx
  • Home
  • Archives
  • Categories
  • Tags
  • About

北邮生活month6|家人、朋友、学习

北邮生活 month6 | 家人、朋友、学习最佳格式请移步个人博客:www.wsgbxx.com 回来的时候还觉得很漫长,但是渐渐形成规律之后,几乎就是眨眼之间过去了。不过如今以一个大学生的角度来看,还是与之前有些不同的,在此记录下来,以供以后品味。 一、除夕其实回家之后还有一些remote的工作,只能是抽空看看CS336,跑跑步,直到除夕前两天才有了自己的时间。看过了AI界的精彩之后,回到农村里
2026-02-26
月记
#月记

Unet

U-net的结构还是容易理解的,比传统的卷积多了上采样的部分,以及类似残差连接的部分。最后用Unet简单训了一个 32 到 96 的 超分网络,但是code删了hh,详见DDPM一节
2026-02-11
项目 > 生成模型之旅
#生成模型

DDPM

DDPM是diffusion的开山之作,diffusion也是当下主流的生图基础结构。在cifar 10上训练了200个epoch就很获得了很好的效果。 图三为第5个epoch,可以看到只有一点色彩和纹理 图四为25个epoch,更加有区分度 图五为最终结果,可以说已经有了很明显的动物和汽车形态,只是受限于32×32的分辨率已经没办法再进一步了。 最后用Unet简单训了一个32到96的超分
2026-02-11
项目 > 生成模型之旅
#生成模型

MAKE MAE GREAT AGAIN

实际上我没有看过MAE的paper,本次用的是比较新的pixio模型,当然基本架构都差不多,pixio的效果也更好。pixio repo:https://github.com/facebookresearch/pixio 模型性能在monodepth和semantic任务上测试结果超过或与dinov3持平,但是结构更加简单,只是对MAE进行了简单但暴力的改进。 abstract 更大的mask 更
2026-02-11
项目 > 生成模型之旅
#生成模型

VAE

title: VAEdate: 2026-02-11 00:15:46categories: - 项目 - 生成模型之旅tags: - 生成模型VAE (变分自编码器) 探索理解VAE 用 encoder 学近似后验 $q(z|x)$,用 decoder 学生成分布 $p(x|z)$。训练时最大化 ELBO:要能从 $z$ 重建 $x$,又用 KL 把 $q(z|x)$ 拉向标准正态先验,
2026-02-11
项目 > 生成模型之旅
#生成模型

26/2/9 RUN

回家一周跑步复健小结训练内容 8×200 2×200 2×400 2×600 12km L 跑 总里程:50km 跑姿不协调,核心不稳定,高配速下容易变形。 训练突破周六心血来潮想模仿会长,进行了顶风 20 组 1+1 训练(法特莱克40min): 前 10 组就已耗尽大腿前侧肌肉力量,但解锁了更经济的跑姿 最后几组心跳不太正常,临时降速,持续保持在190bpm确实比较危险 下次减量减速,ma
2026-02-09
跑步
#跑步

MIT18.06

心得这是我第一次完整学习的在线课程。虽然初次观看时差点被20年前的画面质量劝退,但Gilbert Strang教授的授课质量确实经得起时间考验。从暑假到期末,学习周期超过了最初的预期,期间因各种事务耽搁不少,也曾想过放弃,不过最终还是因为大模型方向的数学基础需要,坚持完成了整个课程。以下是我的一些感悟和经验总结。 学习背景 B站网课 《线性代数导论》第五版中文版 3Blue1Brown视频教程 北
2026-02-09
数学 > 线性代数
#线性代数 #数学

自动驾驶之旅1

杂记11. 生成世界模型中的P=NP问题可验证的问题可生成,自动驾驶Reward Model难以设计 2. CV大模型的目标CV大模型的目标是理解物理世界常识,与世界进行互动,因此单帧的Web数据不足以支撑(联系具身智能的数据难题) 3. L4驾驶的算法冗余L4驾驶需要存在所谓的算法冗余,在模型中除了深度学习部分还需要包含传统算法等非深度学习部分 4. PhD科研实习的优势我认为科研实习
2026-02-09
自动驾驶

如果我的人生可以重开✗ 对别人的人生指手画脚✓ 其实都在打着指导别人的名义,偷偷列自己的后悔清单

2026-02-09
句子

平庸的代价从未如此残忍,而卓越的回报从未如此丰厚。

2026-02-09
句子
12

Search

Hexo Fluid
Views: Visitors: