zfec: reorder the inner loop to be more cache-friendly

author zooko <zooko@zooko.com>

Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)

committer zooko <zooko@zooko.com>

Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)
author zooko <zooko@zooko.com>
Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)
committer zooko <zooko@zooko.com>
Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)
diff --git a/zfec/zfec/fec.c b/zfec/zfec/fec.c

index 20546975d04d7bab3c2d1c940f17f9dd1a982759..84f4645d1263f95f0272db543912b922f5403244 100644 (file)
--- a/zfec/zfec/fec.c
+++ b/zfec/zfec/fec.c
@@ -482,15 +482,16 @@ fec_encode(const fec_t* code, const gf*restrict const*restrict const src, gf*res
      unsigned fecnum;
      const gf* p;
  
-    for (i=0; i<num_block_nums; i++) {
-        fecnum=block_nums[i];
-        assert (fecnum >= code->k);
-        memset(fecs[i], 0, sz);
-        p = &(code->enc_matrix[fecnum * code->k]);
-// DUFF ME
-        for (k = 0; k < sz; k += STRIDE)
+    for (k = 0; k < sz; k += STRIDE) {
+        size_t stride = ((sz-k) < STRIDE)?(sz-k):STRIDE;
+        for (i=0; i<num_block_nums; i++) {
+            fecnum=block_nums[i];
+            assert (fecnum >= code->k);
+            memset(fecs[i]+k, 0, stride);
+            p = &(code->enc_matrix[fecnum * code->k]);
              for (j = 0; j < code->k; j++)
-                addmul(fecs[i]+k, src[j]+k, p[j], ((sz-k) < STRIDE)?(sz-k):STRIDE);
+                addmul(fecs[i]+k, src[j]+k, p[j], stride);
+        }
      }
  }
author	zooko <zooko@zooko.com>
	Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)
committer	zooko <zooko@zooko.com>
	Mon, 12 Nov 2007 14:58:19 +0000 (20:28 +0530)