Add the SmolLM2 models. (#2595)

* Add the SmolLM2 models. * More SmolLM2 support.
author: Laurent Mazare <laurent.mazare@gmail.com> 2024-11-03 17:11:12 +0100
committer: GitHub <noreply@github.com> 2024-11-03 17:11:12 +0100
commit: 3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9 (patch)
tree: 06a4177864fca7ac60c79fae7643bb09258221d3 /candle-transformers
parent: 530ab96036604b125276433b67ebb840e841aede (diff)
download: candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.tar.gz
candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.tar.bz2
candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.zip
1 files changed, 6 insertions, 3 deletions
diff --git a/candle-transformers/src/models/quantized_llama.rs b/candle-transformers/src/models/quantized_llama.rs
index 6b326fbe..20363aea 100644
--- a/candle-transformers/src/models/quantized_llama.rs
+++ b/candle-transformers/src/models/quantized_llama.rs
@@ -351,13 +351,16 @@ impl ModelWeights {
         let (cos, sin) = precomput_freqs_cis(rope_dim, rope_freq_base, device)?;
         let neg_inf = Tensor::new(f32::NEG_INFINITY, device)?;
 
-        let tok_embeddings = ct.tensor(reader, "token_embd.weight", device)?;
-        let tok_embeddings = tok_embeddings.dequantize(device)?;
+        let tok_embeddings_q = ct.tensor(reader, "token_embd.weight", device)?;
+        let tok_embeddings = tok_embeddings_q.dequantize(device)?;
         let norm = RmsNorm::from_qtensor(
             ct.tensor(reader, "output_norm.weight", device)?,
             rms_norm_eps,
         )?;
-        let output = ct.tensor(reader, "output.weight", device)?;
+        let output = match ct.tensor(reader, "output.weight", device) {
+            Ok(tensor) => tensor,
+            Err(_) => tok_embeddings_q,
+        };
         let mut layers = Vec::with_capacity(block_count);
         for layer_idx in 0..block_count {
             let prefix = format!("blk.{layer_idx}");
author	Laurent Mazare <laurent.mazare@gmail.com>	2024-11-03 17:11:12 +0100
committer	GitHub <noreply@github.com>	2024-11-03 17:11:12 +0100
commit	3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9 (patch)
tree	06a4177864fca7ac60c79fae7643bb09258221d3 /candle-transformers
parent	530ab96036604b125276433b67ebb840e841aede (diff)
download	candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.tar.gz candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.tar.bz2 candle-3fba2b5fc44f5c4b1963b0088018a25dd74ab2e9.zip