Page 2 - Showing 8 of 94 posts
View all posts by years →
- Stable Diffusion 模型微调技术探究
<p class="note note-warning">本文均仅作学习、交流使用。</p>
17 min 中文 - Semantic Contrastive Bootstrapping for Single-positive Mu...
- 作者单位:北京航空航天大学,北京大学 - 论文出处:International Journal of Computer Vision (IJCV) - 链接:Springer, arxiv - 代码:Github
17 min 中文 - Handle Solver(成语 Wordle 解题器)
Wordle 游戏应该广为人知了,具体形式是通过有限轮猜测来确定一个事先准备的单词,每次猜测都会反馈字母是否存在于答案中,以及字母位置的正误。Handle 是这个游戏传入中国的变种,形式几乎没有变化,只是猜的东西从单词变为了四字成语。如果你想实际体验一下,可以点击这个链接。
2 min 中文 - 如何正确地锁住一个 Normalization Layer?
在之前的一篇文章中我们介绍过关于 BN 和 LN 的一些小细节,在那里提到了这类 Layer 一般会在训练阶段统计输入数据的分布信息,并将该信息使用在推理阶段。随着近期 CV 侧深度学习也从 fine-tune 逐渐走向了直接 freeze backbone,我觉得是时候进一步明确 Norm...
4 min 中文 - [CF 1828] Codeforces Round 873 (Div. 2)
第一题是简单的构造。第 个数字是 的时候总和是 ,为了凑个条件三,我们给所有数再乘 就可以了。
11 min 中文 - 用 Rust 玩一玩 WASM
> 更新于 2024-03-01。主要是 wasm-pack-cli 被弃用。
9 min 中文 - 一次面向股价预测的深度学习方法尝试
我不是干这个的,既不研究量化,也不研究这种类型的序列预测模型。所以我只是本着玩玩的心态训了个模型,甚至可以说我就没指望能得到积极结果,这篇文章也仅仅是记录一下我瞎折腾的经过。我在其中获得的乐趣大于它的世俗意义。
7 min 中文 - Chinopie 轻量深度学习框架
> 在搞研究的过程中,我逐渐把一些代码抽出来并写为了这样一个较为简单的框架。
7 min 中文