ctrltokyo
/

Reason-Code-ModernColBERT

Sentence Similarity

sentence-transformers

late-interaction

text-embeddings-inference

Model card Files Files and versions

ctrltokyo commited on 6 days ago

Commit

b9a34e5

·

verified ·

1 Parent(s): 18981cb

Add CodeSearchNet MRR benchmark results

Files changed (1) hide show

README.md +16 -0

README.md CHANGED Viewed

@@ -87,6 +87,22 @@ Trained on a single NVIDIA DGX Spark (GB10 Blackwell, 128GB unified memory).
 - Stage 1: ~130 min (391 steps)
 - Stage 2: ~37 min (117 steps)
 ## Usage
 ```python

 - Stage 1: ~130 min (391 steps)
 - Stage 2: ~37 min (117 steps)
+## Benchmark Results
+### CodeSearchNet MRR (500 queries per language, 500 candidates)
+| Language   | GTE-ModernColBERT (base) | **Reason-Code-ModernColBERT (ours)** | Δ |
+|------------|:---:|:---:|:---:|
+| Python     | 0.991 | 0.989 | -0.002 |
+| Java       | 0.829 | **0.866** | +0.037 |
+| JavaScript | 0.802 | **0.839** | +0.037 |
+| PHP        | 0.841 | **0.862** | +0.021 |
+| Go         | 0.879 | **0.887** | +0.008 |
+| Ruby       | 0.773 | **0.831** | +0.058 |
+| **Average** | 0.853 | **0.879** | **+0.026** |
+Improves on the base model in 5 of 6 languages. Largest gains in Ruby (+5.8pp), Java (+3.7pp), and JavaScript (+3.7pp) — languages that benefited most from reasoning-enhanced training data. Python is near-ceiling at 0.99.
 ## Usage
 ```python