mpi-genesis~

raw
mpi-genesis~            1 /* mpihelp-mul.c  -  MPI helper functions
mpi-genesis~            2  * Copyright (C) 1994, 1996, 1998, 1999,
mpi-genesis~            3  *               2000 Free Software Foundation, Inc.
mpi-genesis~            4  *
mpi-genesis~            5  * This file is part of GnuPG.
mpi-genesis~            6  *
mpi-genesis~            7  * GnuPG is free software; you can redistribute it and/or modify
mpi-genesis~            8  * it under the terms of the GNU General Public License as published by
mpi-genesis~            9  * the Free Software Foundation; either version 3 of the License, or
mpi-genesis~           10  * (at your option) any later version.
mpi-genesis~           11  *
mpi-genesis~           12  * GnuPG is distributed in the hope that it will be useful,
mpi-genesis~           13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
mpi-genesis~           14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
mpi-genesis~           15  * GNU General Public License for more details.
mpi-genesis~           16  *
mpi-genesis~           17  * You should have received a copy of the GNU General Public License
mpi-genesis~           18  * along with this program; if not, see <http://www.gnu.org/licenses/>.
mpi-genesis~           19  *
mpi-genesis~           20  * Note: This code is heavily based on the GNU MP Library.
mpi-genesis~           21  *	 Actually it's the same code with only minor changes in the
mpi-genesis~           22  *	 way the data is stored; this is to support the abstraction
mpi-genesis~           23  *	 of an optional secure memory allocation which may be used
mpi-genesis~           24  *	 to avoid revealing of sensitive data due to paging etc.
mpi-genesis~           25  *	 The GNU MP Library itself is published under the LGPL;
mpi-genesis~           26  *	 however I decided to publish this code under the plain GPL.
mpi-genesis~           27  */
mpi-genesis~           28 
mpi-genesis~           29 #include <config.h>
mpi-genesis~           30 #include <stdio.h>
mpi-genesis~           31 #include <stdlib.h>
mpi-genesis~           32 #include <string.h>
mpi-genesis~           33 #include "mpi-internal.h"
mpi-genesis~           34 #include "longlong.h"
mpi-genesis~           35 
mpi-genesis~           36 
mpi-genesis~           37 
mpi-genesis~           38 #define MPN_MUL_N_RECURSE(prodp, up, vp, size, tspace) \
mpi-genesis~           39     do {						\
mpi-genesis~           40 	if( (size) < KARATSUBA_THRESHOLD )		\
mpi-genesis~           41 	    mul_n_basecase (prodp, up, vp, size);	\
mpi-genesis~           42 	else						\
mpi-genesis~           43 	    mul_n (prodp, up, vp, size, tspace);	\
mpi-genesis~           44     } while (0);
mpi-genesis~           45 
mpi-genesis~           46 #define MPN_SQR_N_RECURSE(prodp, up, size, tspace) \
mpi-genesis~           47     do {					    \
mpi-genesis~           48 	if ((size) < KARATSUBA_THRESHOLD)	    \
mpi-genesis~           49 	    mpih_sqr_n_basecase (prodp, up, size);	 \
mpi-genesis~           50 	else					    \
mpi-genesis~           51 	    mpih_sqr_n (prodp, up, size, tspace);	 \
mpi-genesis~           52     } while (0);
mpi-genesis~           53 
mpi-genesis~           54 
mpi-genesis~           55 
mpi-genesis~           56 
mpi-genesis~           57 /* Multiply the natural numbers u (pointed to by UP) and v (pointed to by VP),
mpi-genesis~           58  * both with SIZE limbs, and store the result at PRODP.  2 * SIZE limbs are
mpi-genesis~           59  * always stored.  Return the most significant limb.
mpi-genesis~           60  *
mpi-genesis~           61  * Argument constraints:
mpi-genesis~           62  * 1. PRODP != UP and PRODP != VP, i.e. the destination
mpi-genesis~           63  *    must be distinct from the multiplier and the multiplicand.
mpi-genesis~           64  *
mpi-genesis~           65  *
mpi-genesis~           66  * Handle simple cases with traditional multiplication.
mpi-genesis~           67  *
mpi-genesis~           68  * This is the most critical code of multiplication.  All multiplies rely
mpi-genesis~           69  * on this, both small and huge.  Small ones arrive here immediately.  Huge
mpi-genesis~           70  * ones arrive here as this is the base case for Karatsuba's recursive
mpi-genesis~           71  * algorithm below.
mpi-genesis~           72  */
mpi-genesis~           73 
mpi-genesis~           74 static mpi_limb_t
mpi-genesis~           75 mul_n_basecase( mpi_ptr_t prodp, mpi_ptr_t up,
mpi-genesis~           76 				 mpi_ptr_t vp, mpi_size_t size)
mpi-genesis~           77 {
mpi-genesis~           78     mpi_size_t i;
mpi-genesis~           79     mpi_limb_t cy;
mpi-genesis~           80     mpi_limb_t v_limb;
mpi-genesis~           81 
mpi-genesis~           82     /* Multiply by the first limb in V separately, as the result can be
mpi-genesis~           83      * stored (not added) to PROD.  We also avoid a loop for zeroing.  */
mpi-genesis~           84     v_limb = vp[0];
mpi-genesis~           85     if( v_limb <= 1 ) {
mpi-genesis~           86 	if( v_limb == 1 )
mpi-genesis~           87 	    MPN_COPY( prodp, up, size );
mpi-genesis~           88 	else
mpi-genesis~           89 	    MPN_ZERO( prodp, size );
mpi-genesis~           90 	cy = 0;
mpi-genesis~           91     }
mpi-genesis~           92     else
mpi-genesis~           93 	cy = mpihelp_mul_1( prodp, up, size, v_limb );
mpi-genesis~           94 
mpi-genesis~           95     prodp[size] = cy;
mpi-genesis~           96     prodp++;
mpi-genesis~           97 
mpi-genesis~           98     /* For each iteration in the outer loop, multiply one limb from
mpi-genesis~           99      * U with one limb from V, and add it to PROD.  */
mpi-genesis~          100     for( i = 1; i < size; i++ ) {
mpi-genesis~          101 	v_limb = vp[i];
mpi-genesis~          102 	if( v_limb <= 1 ) {
mpi-genesis~          103 	    cy = 0;
mpi-genesis~          104 	    if( v_limb == 1 )
mpi-genesis~          105 	       cy = mpihelp_add_n(prodp, prodp, up, size);
mpi-genesis~          106 	}
mpi-genesis~          107 	else
mpi-genesis~          108 	    cy = mpihelp_addmul_1(prodp, up, size, v_limb);
mpi-genesis~          109 
mpi-genesis~          110 	prodp[size] = cy;
mpi-genesis~          111 	prodp++;
mpi-genesis~          112     }
mpi-genesis~          113 
mpi-genesis~          114     return cy;
mpi-genesis~          115 }
mpi-genesis~          116 
mpi-genesis~          117 
mpi-genesis~          118 static void
mpi-genesis~          119 mul_n( mpi_ptr_t prodp, mpi_ptr_t up, mpi_ptr_t vp,
mpi-genesis~          120 			mpi_size_t size, mpi_ptr_t tspace )
mpi-genesis~          121 {
mpi-genesis~          122     if( size & 1 ) {
mpi-genesis~          123       /* The size is odd, and the code below doesn't handle that.
mpi-genesis~          124        * Multiply the least significant (size - 1) limbs with a recursive
mpi-genesis~          125        * call, and handle the most significant limb of S1 and S2
mpi-genesis~          126        * separately.
mpi-genesis~          127        * A slightly faster way to do this would be to make the Karatsuba
mpi-genesis~          128        * code below behave as if the size were even, and let it check for
mpi-genesis~          129        * odd size in the end.  I.e., in essence move this code to the end.
mpi-genesis~          130        * Doing so would save us a recursive call, and potentially make the
mpi-genesis~          131        * stack grow a lot less.
mpi-genesis~          132        */
mpi-genesis~          133       mpi_size_t esize = size - 1;	 /* even size */
mpi-genesis~          134       mpi_limb_t cy_limb;
mpi-genesis~          135 
mpi-genesis~          136       MPN_MUL_N_RECURSE( prodp, up, vp, esize, tspace );
mpi-genesis~          137       cy_limb = mpihelp_addmul_1( prodp + esize, up, esize, vp[esize] );
mpi-genesis~          138       prodp[esize + esize] = cy_limb;
mpi-genesis~          139       cy_limb = mpihelp_addmul_1( prodp + esize, vp, size, up[esize] );
mpi-genesis~          140       prodp[esize + size] = cy_limb;
mpi-genesis~          141     }
mpi-genesis~          142     else {
mpi-genesis~          143 	/* Anatolij Alekseevich Karatsuba's divide-and-conquer algorithm.
mpi-genesis~          144 	 *
mpi-genesis~          145 	 * Split U in two pieces, U1 and U0, such that
mpi-genesis~          146 	 * U = U0 + U1*(B**n),
mpi-genesis~          147 	 * and V in V1 and V0, such that
mpi-genesis~          148 	 * V = V0 + V1*(B**n).
mpi-genesis~          149 	 *
mpi-genesis~          150 	 * UV is then computed recursively using the identity
mpi-genesis~          151 	 *
mpi-genesis~          152 	 *	  2n   n	  n			n
mpi-genesis~          153 	 * UV = (B  + B )U V  +  B (U -U )(V -V )  +  (B + 1)U V
mpi-genesis~          154 	 *		  1 1	     1	0   0  1	      0 0
mpi-genesis~          155 	 *
mpi-genesis~          156 	 * Where B = 2**BITS_PER_MP_LIMB.
mpi-genesis~          157 	 */
mpi-genesis~          158 	mpi_size_t hsize = size >> 1;
mpi-genesis~          159 	mpi_limb_t cy;
mpi-genesis~          160 	int negflg;
mpi-genesis~          161 
mpi-genesis~          162 	/* Product H.	   ________________  ________________
mpi-genesis~          163 	 *		  |_____U1 x V1____||____U0 x V0_____|
mpi-genesis~          164 	 * Put result in upper part of PROD and pass low part of TSPACE
mpi-genesis~          165 	 * as new TSPACE.
mpi-genesis~          166 	 */
mpi-genesis~          167 	MPN_MUL_N_RECURSE(prodp + size, up + hsize, vp + hsize, hsize, tspace);
mpi-genesis~          168 
mpi-genesis~          169 	/* Product M.	   ________________
mpi-genesis~          170 	 *		  |_(U1-U0)(V0-V1)_|
mpi-genesis~          171 	 */
mpi-genesis~          172 	if( mpihelp_cmp(up + hsize, up, hsize) >= 0 ) {
mpi-genesis~          173 	    mpihelp_sub_n(prodp, up + hsize, up, hsize);
mpi-genesis~          174 	    negflg = 0;
mpi-genesis~          175 	}
mpi-genesis~          176 	else {
mpi-genesis~          177 	    mpihelp_sub_n(prodp, up, up + hsize, hsize);
mpi-genesis~          178 	    negflg = 1;
mpi-genesis~          179 	}
mpi-genesis~          180 	if( mpihelp_cmp(vp + hsize, vp, hsize) >= 0 ) {
mpi-genesis~          181 	    mpihelp_sub_n(prodp + hsize, vp + hsize, vp, hsize);
mpi-genesis~          182 	    negflg ^= 1;
mpi-genesis~          183 	}
mpi-genesis~          184 	else {
mpi-genesis~          185 	    mpihelp_sub_n(prodp + hsize, vp, vp + hsize, hsize);
mpi-genesis~          186 	    /* No change of NEGFLG.  */
mpi-genesis~          187 	}
mpi-genesis~          188 	/* Read temporary operands from low part of PROD.
mpi-genesis~          189 	 * Put result in low part of TSPACE using upper part of TSPACE
mpi-genesis~          190 	 * as new TSPACE.
mpi-genesis~          191 	 */
mpi-genesis~          192 	MPN_MUL_N_RECURSE(tspace, prodp, prodp + hsize, hsize, tspace + size);
mpi-genesis~          193 
mpi-genesis~          194 	/* Add/copy product H. */
mpi-genesis~          195 	MPN_COPY (prodp + hsize, prodp + size, hsize);
mpi-genesis~          196 	cy = mpihelp_add_n( prodp + size, prodp + size,
mpi-genesis~          197 			    prodp + size + hsize, hsize);
mpi-genesis~          198 
mpi-genesis~          199 	/* Add product M (if NEGFLG M is a negative number) */
mpi-genesis~          200 	if(negflg)
mpi-genesis~          201 	    cy -= mpihelp_sub_n(prodp + hsize, prodp + hsize, tspace, size);
mpi-genesis~          202 	else
mpi-genesis~          203 	    cy += mpihelp_add_n(prodp + hsize, prodp + hsize, tspace, size);
mpi-genesis~          204 
mpi-genesis~          205 	/* Product L.	   ________________  ________________
mpi-genesis~          206 	 *		  |________________||____U0 x V0_____|
mpi-genesis~          207 	 * Read temporary operands from low part of PROD.
mpi-genesis~          208 	 * Put result in low part of TSPACE using upper part of TSPACE
mpi-genesis~          209 	 * as new TSPACE.
mpi-genesis~          210 	 */
mpi-genesis~          211 	MPN_MUL_N_RECURSE(tspace, up, vp, hsize, tspace + size);
mpi-genesis~          212 
mpi-genesis~          213 	/* Add/copy Product L (twice) */
mpi-genesis~          214 
mpi-genesis~          215 	cy += mpihelp_add_n(prodp + hsize, prodp + hsize, tspace, size);
mpi-genesis~          216 	if( cy )
mpi-genesis~          217 	  mpihelp_add_1(prodp + hsize + size, prodp + hsize + size, hsize, cy);
mpi-genesis~          218 
mpi-genesis~          219 	MPN_COPY(prodp, tspace, hsize);
mpi-genesis~          220 	cy = mpihelp_add_n(prodp + hsize, prodp + hsize, tspace + hsize, hsize);
mpi-genesis~          221 	if( cy )
mpi-genesis~          222 	    mpihelp_add_1(prodp + size, prodp + size, size, 1);
mpi-genesis~          223     }
mpi-genesis~          224 }
mpi-genesis~          225 
mpi-genesis~          226 
mpi-genesis~          227 void
mpi-genesis~          228 mpih_sqr_n_basecase( mpi_ptr_t prodp, mpi_ptr_t up, mpi_size_t size )
mpi-genesis~          229 {
mpi-genesis~          230     mpi_size_t i;
mpi-genesis~          231     mpi_limb_t cy_limb;
mpi-genesis~          232     mpi_limb_t v_limb;
mpi-genesis~          233 
mpi-genesis~          234     /* Multiply by the first limb in V separately, as the result can be
mpi-genesis~          235      * stored (not added) to PROD.  We also avoid a loop for zeroing.  */
mpi-genesis~          236     v_limb = up[0];
mpi-genesis~          237     if( v_limb <= 1 ) {
mpi-genesis~          238 	if( v_limb == 1 )
mpi-genesis~          239 	    MPN_COPY( prodp, up, size );
mpi-genesis~          240 	else
mpi-genesis~          241 	    MPN_ZERO(prodp, size);
mpi-genesis~          242 	cy_limb = 0;
mpi-genesis~          243     }
mpi-genesis~          244     else
mpi-genesis~          245 	cy_limb = mpihelp_mul_1( prodp, up, size, v_limb );
mpi-genesis~          246 
mpi-genesis~          247     prodp[size] = cy_limb;
mpi-genesis~          248     prodp++;
mpi-genesis~          249 
mpi-genesis~          250     /* For each iteration in the outer loop, multiply one limb from
mpi-genesis~          251      * U with one limb from V, and add it to PROD.  */
mpi-genesis~          252     for( i=1; i < size; i++) {
mpi-genesis~          253 	v_limb = up[i];
mpi-genesis~          254 	if( v_limb <= 1 ) {
mpi-genesis~          255 	    cy_limb = 0;
mpi-genesis~          256 	    if( v_limb == 1 )
mpi-genesis~          257 		cy_limb = mpihelp_add_n(prodp, prodp, up, size);
mpi-genesis~          258 	}
mpi-genesis~          259 	else
mpi-genesis~          260 	    cy_limb = mpihelp_addmul_1(prodp, up, size, v_limb);
mpi-genesis~          261 
mpi-genesis~          262 	prodp[size] = cy_limb;
mpi-genesis~          263 	prodp++;
mpi-genesis~          264     }
mpi-genesis~          265 }
mpi-genesis~          266 
mpi-genesis~          267 
mpi-genesis~          268 void
mpi-genesis~          269 mpih_sqr_n( mpi_ptr_t prodp, mpi_ptr_t up, mpi_size_t size, mpi_ptr_t tspace)
mpi-genesis~          270 {
mpi-genesis~          271     if( size & 1 ) {
mpi-genesis~          272 	/* The size is odd, and the code below doesn't handle that.
mpi-genesis~          273 	 * Multiply the least significant (size - 1) limbs with a recursive
mpi-genesis~          274 	 * call, and handle the most significant limb of S1 and S2
mpi-genesis~          275 	 * separately.
mpi-genesis~          276 	 * A slightly faster way to do this would be to make the Karatsuba
mpi-genesis~          277 	 * code below behave as if the size were even, and let it check for
mpi-genesis~          278 	 * odd size in the end.  I.e., in essence move this code to the end.
mpi-genesis~          279 	 * Doing so would save us a recursive call, and potentially make the
mpi-genesis~          280 	 * stack grow a lot less.
mpi-genesis~          281 	 */
mpi-genesis~          282 	mpi_size_t esize = size - 1;	   /* even size */
mpi-genesis~          283 	mpi_limb_t cy_limb;
mpi-genesis~          284 
mpi-genesis~          285 	MPN_SQR_N_RECURSE( prodp, up, esize, tspace );
mpi-genesis~          286 	cy_limb = mpihelp_addmul_1( prodp + esize, up, esize, up[esize] );
mpi-genesis~          287 	prodp[esize + esize] = cy_limb;
mpi-genesis~          288 	cy_limb = mpihelp_addmul_1( prodp + esize, up, size, up[esize] );
mpi-genesis~          289 
mpi-genesis~          290 	prodp[esize + size] = cy_limb;
mpi-genesis~          291     }
mpi-genesis~          292     else {
mpi-genesis~          293 	mpi_size_t hsize = size >> 1;
mpi-genesis~          294 	mpi_limb_t cy;
mpi-genesis~          295 
mpi-genesis~          296 	/* Product H.	   ________________  ________________
mpi-genesis~          297 	 *		  |_____U1 x U1____||____U0 x U0_____|
mpi-genesis~          298 	 * Put result in upper part of PROD and pass low part of TSPACE
mpi-genesis~          299 	 * as new TSPACE.
mpi-genesis~          300 	 */
mpi-genesis~          301 	MPN_SQR_N_RECURSE(prodp + size, up + hsize, hsize, tspace);
mpi-genesis~          302 
mpi-genesis~          303 	/* Product M.	   ________________
mpi-genesis~          304 	 *		  |_(U1-U0)(U0-U1)_|
mpi-genesis~          305 	 */
mpi-genesis~          306 	if( mpihelp_cmp( up + hsize, up, hsize) >= 0 )
mpi-genesis~          307 	    mpihelp_sub_n( prodp, up + hsize, up, hsize);
mpi-genesis~          308 	else
mpi-genesis~          309 	    mpihelp_sub_n (prodp, up, up + hsize, hsize);
mpi-genesis~          310 
mpi-genesis~          311 	/* Read temporary operands from low part of PROD.
mpi-genesis~          312 	 * Put result in low part of TSPACE using upper part of TSPACE
mpi-genesis~          313 	 * as new TSPACE.  */
mpi-genesis~          314 	MPN_SQR_N_RECURSE(tspace, prodp, hsize, tspace + size);
mpi-genesis~          315 
mpi-genesis~          316 	/* Add/copy product H  */
mpi-genesis~          317 	MPN_COPY(prodp + hsize, prodp + size, hsize);
mpi-genesis~          318 	cy = mpihelp_add_n(prodp + size, prodp + size,
mpi-genesis~          319 			   prodp + size + hsize, hsize);
mpi-genesis~          320 
mpi-genesis~          321 	/* Add product M (if NEGFLG M is a negative number).  */
mpi-genesis~          322 	cy -= mpihelp_sub_n (prodp + hsize, prodp + hsize, tspace, size);
mpi-genesis~          323 
mpi-genesis~          324 	/* Product L.	   ________________  ________________
mpi-genesis~          325 	 *		  |________________||____U0 x U0_____|
mpi-genesis~          326 	 * Read temporary operands from low part of PROD.
mpi-genesis~          327 	 * Put result in low part of TSPACE using upper part of TSPACE
mpi-genesis~          328 	 * as new TSPACE.  */
mpi-genesis~          329 	MPN_SQR_N_RECURSE (tspace, up, hsize, tspace + size);
mpi-genesis~          330 
mpi-genesis~          331 	/* Add/copy Product L (twice).	*/
mpi-genesis~          332 	cy += mpihelp_add_n (prodp + hsize, prodp + hsize, tspace, size);
mpi-genesis~          333 	if( cy )
mpi-genesis~          334 	    mpihelp_add_1(prodp + hsize + size, prodp + hsize + size,
mpi-genesis~          335 							    hsize, cy);
mpi-genesis~          336 
mpi-genesis~          337 	MPN_COPY(prodp, tspace, hsize);
mpi-genesis~          338 	cy = mpihelp_add_n (prodp + hsize, prodp + hsize, tspace + hsize, hsize);
mpi-genesis~          339 	if( cy )
mpi-genesis~          340 	    mpihelp_add_1 (prodp + size, prodp + size, size, 1);
mpi-genesis~          341     }
mpi-genesis~          342 }
mpi-genesis~          343 
mpi-genesis~          344 
mpi-genesis~          345 /* This should be made into an inline function in gmp.h.  */
mpi-genesis~          346 void
mpi-genesis~          347 mpihelp_mul_n( mpi_ptr_t prodp, mpi_ptr_t up, mpi_ptr_t vp, mpi_size_t size)
mpi-genesis~          348 {
mpi-genesis~          349     int secure;
mpi-genesis~          350 
mpi-genesis~          351     if( up == vp ) {
mpi-genesis~          352 	if( size < KARATSUBA_THRESHOLD )
mpi-genesis~          353 	    mpih_sqr_n_basecase( prodp, up, size );
mpi-genesis~          354 	else {
mpi-genesis~          355 	    mpi_ptr_t tspace;
mpi-genesis~          356 	    secure = m_is_secure( up );
mpi-genesis~          357 	    tspace = mpi_alloc_limb_space( 2 * size, secure );
mpi-genesis~          358 	    mpih_sqr_n( prodp, up, size, tspace );
mpi-genesis~          359 	    mpi_free_limb_space( tspace );
mpi-genesis~          360 	}
mpi-genesis~          361     }
mpi-genesis~          362     else {
mpi-genesis~          363 	if( size < KARATSUBA_THRESHOLD )
mpi-genesis~          364 	    mul_n_basecase( prodp, up, vp, size );
mpi-genesis~          365 	else {
mpi-genesis~          366 	    mpi_ptr_t tspace;
mpi-genesis~          367 	    secure = m_is_secure( up ) || m_is_secure( vp );
mpi-genesis~          368 	    tspace = mpi_alloc_limb_space( 2 * size, secure );
mpi-genesis~          369 	    mul_n (prodp, up, vp, size, tspace);
mpi-genesis~          370 	    mpi_free_limb_space( tspace );
mpi-genesis~          371 	}
mpi-genesis~          372     }
mpi-genesis~          373 }
mpi-genesis~          374 
mpi-genesis~          375 
mpi-genesis~          376 
mpi-genesis~          377 void
mpi-genesis~          378 mpihelp_mul_karatsuba_case( mpi_ptr_t prodp,
mpi-genesis~          379 			    mpi_ptr_t up, mpi_size_t usize,
mpi-genesis~          380 			    mpi_ptr_t vp, mpi_size_t vsize,
mpi-genesis~          381 			    struct karatsuba_ctx *ctx )
mpi-genesis~          382 {
mpi-genesis~          383     mpi_limb_t cy;
mpi-genesis~          384 
mpi-genesis~          385     if( !ctx->tspace || ctx->tspace_size < vsize ) {
mpi-genesis~          386 	if( ctx->tspace )
mpi-genesis~          387 	    mpi_free_limb_space( ctx->tspace );
mpi-genesis~          388 	ctx->tspace = mpi_alloc_limb_space( 2 * vsize,
mpi-genesis~          389 				       m_is_secure( up ) || m_is_secure( vp ) );
mpi-genesis~          390 	ctx->tspace_size = vsize;
mpi-genesis~          391     }
mpi-genesis~          392 
mpi-genesis~          393     MPN_MUL_N_RECURSE( prodp, up, vp, vsize, ctx->tspace );
mpi-genesis~          394 
mpi-genesis~          395     prodp += vsize;
mpi-genesis~          396     up += vsize;
mpi-genesis~          397     usize -= vsize;
mpi-genesis~          398     if( usize >= vsize ) {
mpi-genesis~          399 	if( !ctx->tp || ctx->tp_size < vsize ) {
mpi-genesis~          400 	    if( ctx->tp )
mpi-genesis~          401 		mpi_free_limb_space( ctx->tp );
mpi-genesis~          402 	    ctx->tp = mpi_alloc_limb_space( 2 * vsize, m_is_secure( up )
mpi-genesis~          403 						      || m_is_secure( vp ) );
mpi-genesis~          404 	    ctx->tp_size = vsize;
mpi-genesis~          405 	}
mpi-genesis~          406 
mpi-genesis~          407 	do {
mpi-genesis~          408 	    MPN_MUL_N_RECURSE( ctx->tp, up, vp, vsize, ctx->tspace );
mpi-genesis~          409 	    cy = mpihelp_add_n( prodp, prodp, ctx->tp, vsize );
mpi-genesis~          410 	    mpihelp_add_1( prodp + vsize, ctx->tp + vsize, vsize, cy );
mpi-genesis~          411 	    prodp += vsize;
mpi-genesis~          412 	    up += vsize;
mpi-genesis~          413 	    usize -= vsize;
mpi-genesis~          414 	} while( usize >= vsize );
mpi-genesis~          415     }
mpi-genesis~          416 
mpi-genesis~          417     if( usize ) {
mpi-genesis~          418 	if( usize < KARATSUBA_THRESHOLD ) {
mpi-genesis~          419 	    mpihelp_mul( ctx->tspace, vp, vsize, up, usize );
mpi-genesis~          420 	}
mpi-genesis~          421 	else {
mpi-genesis~          422 	    if( !ctx->next ) {
mpi-genesis~          423 		ctx->next = xmalloc_clear( sizeof *ctx );
mpi-genesis~          424 	    }
mpi-genesis~          425 	    mpihelp_mul_karatsuba_case( ctx->tspace,
mpi-genesis~          426 					vp, vsize,
mpi-genesis~          427 					up, usize,
mpi-genesis~          428 					ctx->next );
mpi-genesis~          429 	}
mpi-genesis~          430 
mpi-genesis~          431 	cy = mpihelp_add_n( prodp, prodp, ctx->tspace, vsize);
mpi-genesis~          432 	mpihelp_add_1( prodp + vsize, ctx->tspace + vsize, usize, cy );
mpi-genesis~          433     }
mpi-genesis~          434 }
mpi-genesis~          435 
mpi-genesis~          436 
mpi-genesis~          437 void
mpi-genesis~          438 mpihelp_release_karatsuba_ctx( struct karatsuba_ctx *ctx )
mpi-genesis~          439 {
mpi-genesis~          440     struct karatsuba_ctx *ctx2;
mpi-genesis~          441 
mpi-genesis~          442     if( ctx->tp )
mpi-genesis~          443 	mpi_free_limb_space( ctx->tp );
mpi-genesis~          444     if( ctx->tspace )
mpi-genesis~          445 	mpi_free_limb_space( ctx->tspace );
mpi-genesis~          446     for( ctx=ctx->next; ctx; ctx = ctx2 ) {
mpi-genesis~          447 	ctx2 = ctx->next;
mpi-genesis~          448 	if( ctx->tp )
mpi-genesis~          449 	    mpi_free_limb_space( ctx->tp );
mpi-genesis~          450 	if( ctx->tspace )
mpi-genesis~          451 	    mpi_free_limb_space( ctx->tspace );
mpi-genesis~          452 	xfree( ctx );
mpi-genesis~          453     }
mpi-genesis~          454 }
mpi-genesis~          455 
mpi-genesis~          456 /* Multiply the natural numbers u (pointed to by UP, with USIZE limbs)
mpi-genesis~          457  * and v (pointed to by VP, with VSIZE limbs), and store the result at
mpi-genesis~          458  * PRODP.  USIZE + VSIZE limbs are always stored, but if the input
mpi-genesis~          459  * operands are normalized.  Return the most significant limb of the
mpi-genesis~          460  * result.
mpi-genesis~          461  *
mpi-genesis~          462  * NOTE: The space pointed to by PRODP is overwritten before finished
mpi-genesis~          463  * with U and V, so overlap is an error.
mpi-genesis~          464  *
mpi-genesis~          465  * Argument constraints:
mpi-genesis~          466  * 1. USIZE >= VSIZE.
mpi-genesis~          467  * 2. PRODP != UP and PRODP != VP, i.e. the destination
mpi-genesis~          468  *    must be distinct from the multiplier and the multiplicand.
mpi-genesis~          469  */
mpi-genesis~          470 
mpi-genesis~          471 mpi_limb_t
mpi-genesis~          472 mpihelp_mul( mpi_ptr_t prodp, mpi_ptr_t up, mpi_size_t usize,
mpi-genesis~          473 			      mpi_ptr_t vp, mpi_size_t vsize)
mpi-genesis~          474 {
mpi-genesis~          475     mpi_ptr_t prod_endp = prodp + usize + vsize - 1;
mpi-genesis~          476     mpi_limb_t cy;
mpi-genesis~          477     struct karatsuba_ctx ctx;
mpi-genesis~          478 
mpi-genesis~          479     if( vsize < KARATSUBA_THRESHOLD ) {
mpi-genesis~          480 	mpi_size_t i;
mpi-genesis~          481 	mpi_limb_t v_limb;
mpi-genesis~          482 
mpi-genesis~          483 	if( !vsize )
mpi-genesis~          484 	    return 0;
mpi-genesis~          485 
mpi-genesis~          486 	/* Multiply by the first limb in V separately, as the result can be
mpi-genesis~          487 	 * stored (not added) to PROD.	We also avoid a loop for zeroing.  */
mpi-genesis~          488 	v_limb = vp[0];
mpi-genesis~          489 	if( v_limb <= 1 ) {
mpi-genesis~          490 	    if( v_limb == 1 )
mpi-genesis~          491 		MPN_COPY( prodp, up, usize );
mpi-genesis~          492 	    else
mpi-genesis~          493 		MPN_ZERO( prodp, usize );
mpi-genesis~          494 	    cy = 0;
mpi-genesis~          495 	}
mpi-genesis~          496 	else
mpi-genesis~          497 	    cy = mpihelp_mul_1( prodp, up, usize, v_limb );
mpi-genesis~          498 
mpi-genesis~          499 	prodp[usize] = cy;
mpi-genesis~          500 	prodp++;
mpi-genesis~          501 
mpi-genesis~          502 	/* For each iteration in the outer loop, multiply one limb from
mpi-genesis~          503 	 * U with one limb from V, and add it to PROD.	*/
mpi-genesis~          504 	for( i = 1; i < vsize; i++ ) {
mpi-genesis~          505 	    v_limb = vp[i];
mpi-genesis~          506 	    if( v_limb <= 1 ) {
mpi-genesis~          507 		cy = 0;
mpi-genesis~          508 		if( v_limb == 1 )
mpi-genesis~          509 		   cy = mpihelp_add_n(prodp, prodp, up, usize);
mpi-genesis~          510 	    }
mpi-genesis~          511 	    else
mpi-genesis~          512 		cy = mpihelp_addmul_1(prodp, up, usize, v_limb);
mpi-genesis~          513 
mpi-genesis~          514 	    prodp[usize] = cy;
mpi-genesis~          515 	    prodp++;
mpi-genesis~          516 	}
mpi-genesis~          517 
mpi-genesis~          518 	return cy;
mpi-genesis~          519     }
mpi-genesis~          520 
mpi-genesis~          521     memset( &ctx, 0, sizeof ctx );
mpi-genesis~          522     mpihelp_mul_karatsuba_case( prodp, up, usize, vp, vsize, &ctx );
mpi-genesis~          523     mpihelp_release_karatsuba_ctx( &ctx );
mpi-genesis~          524     return *prod_endp;
mpi-genesis~          525 }
mpi-genesis~          526 
mpi-genesis~          527