CompassioninMachineLearning
/

PretrainingBasellama3kv3_plus3kcodingGRPO1epoch

Text Generation

text-generation-inference

Model card Files Files and versions

PretrainingBasellama3kv3_plus3kcodingGRPO1epoch

Commit History

Fix tokenizer: use Llama 3.1 8B Instruct tokenizer

92062e1
verified

sparrow8i8 commited on Mar 12

Upload GRPO-trained merged model

d41045c
verified

sparrow8i8 commited on Mar 11

(Trained with Unsloth)

8a68f16
verified

sparrow8i8 commited on Mar 11

(Trained with Unsloth)

40c49e5
verified

sparrow8i8 commited on Mar 11

Unsloth Model Card

7061bd8
verified

sparrow8i8 commited on Mar 11

initial commit

e3b984e
verified

sparrow8i8 commited on Mar 11