uavleeva
/

grpo_merged_math_sql_code_ties_001

Text Generation

Model card Files Files and versions

Uploaded model

Developed by: uavleeva
License: apache-2.0
Finetuned from model : unsloth/qwen2.5-coder-7b-instruct-bnb-4bit

This qwen2 model was trained 2x faster with Unsloth

Downloads last month: 7

Collection including uavleeva/grpo_merged_math_sql_code_ties_001

Multitask RLVR using GRPO (HSE Project)

15 items • Updated 7 days ago