Page 1 - Showing 8 of 94 posts
View all posts by years →
- AgentEvolver
AgentEvolver 是一个试验性的智能体自动进化框架。
1 min 中文 - AI海龟汤
突发奇想,光速写出来的 AI 海龟汤小游戏。没什么特别的技术,希望你玩得开心。
1 min 中文 - 从强化学习到 RFT
谈 RL,一个肯定绕不过去的话题就是 PPO,后续很多强化学习算法都是在 PPO 之上的改进,况且 PPO 本身的确也是介绍 RL 的良好例子。所以我们先讲 PPO。
16 min 中文 - MoE 与 LLM
深度学习时代,尤其是在 NLP 大模型大行其道的今天,MoE(Mixture-of-Experts)是指这样一种结构:
25 min 中文 - async fn,impl 返回值,以及其他
在去年 12 月 21 日,Rust 宣布 trait 中的 async fn 和 impl 作为返回值两个特性稳定。
11 min 中文 - 用 maimai b50 展示你的 GPA
> 这其实算不上一个项目,只是玩一玩 Rust 和 wasm。
1 min 中文 - Moonset 图片标签式管理工具
这个工具起源于我 Naive 的本科毕设,当然现在已经完全是新东西了。当时只是作为自己视觉识别模型的效果展示 demo。现在引入多模态和各种新技术后,我觉得这个工具有了一些实用价值,所以放了出来。
11 min 中文 - 又一篇研究如何游玩音击的文章
<p class="note note-warning">本文仅供学习交流使用。本文不提供涉及软件的下载方式。</p>
9 min 中文