GRPO Trainer(深入了解GRPO)
本文章将接着前一篇关于DeepSeek-R1来更近一步说明其中的关键算法GRPO。本文将大量参考(CV大法)DeepSeek团队在Hungging Face上的GRPO介绍【GRPO 培训师 --- …
|
163
|
|
1367 字
|
8 分钟
DeepSeek-R1学习笔记
DeepSeek-R1是在DeepSeek V3的基础上进行的,在实际效果上有了深度思考的能力,大大提高了模型的性能(对标OpenAI的O1模型),也就是对应官网上面的这个按钮👇 下面来简单概述一下本…
|
114
|
|
4747 字
|
19 分钟
PyTorch:线性代数
PyTorch:线性代数 线性代数¶ 标量由只有一个元素的张量表示 In [1]: import torch x = torch.tensor([3.0]) y = torch.tensor([2.0…
|
111
|
|
1861 字
|
9 分钟
PyTorch:基础数据操作
PyTorch:基础数据操作 数据操作¶ 首先导入torch,注意是torch而不是pytorch。 In [1]: import torch 张量表示一个数值组成的数组,这个数组可能有多个维度。 I…
|
84
|
|
1285 字
|
7 分钟
SAM 2在伪装对象分割任务中的性能评估
【Evaluating SAM2’s Role in Camouflaged Object Detection: From SAM to SAM2】 本篇文章是个人看文献的一些总结和个人的想法,都是个…
|
588
|
|
257 字
|
2 分钟
BioSAM 2的个人理解
【Biomedical SAM 2: Segment Anything in Biomedical Images and Videos】 本篇文章是个人看文献的一些总结和个人的想法,都是个人看过文章之…
|
260
|
|
680 字
|
3 分钟
SAM 2的个人理解
【SAM 2: Segment Anything in Images and Videos】 本篇文章是个人看文献的一些总结和个人的想法,都是个人看过文章之后的理解,不保证一定是对的,如果我的理解有错…
|
7,089
|
|
1099 字
|
5 分钟
用生成式AI生成数据作为训练集训练迭代模型的问题
【AI models collapse when trained on recursively generated data】 本篇文章是个人看文献的一些总结和个人的想法,都是个人看过文章之后的理解,…
|
7,799
|
|
821 字
|
4 分钟
SAM-CP的个人理解
【SAM-CP: Marrying SAM with Composable Prompts for Versatile Segmentation】 本篇文章是个人看文献的一些总结和个人的想法,都是个人…
|
6,979
|
|
1140 字
|
5 分钟