:Science and Technology Innovation Herald T技术 用GPU实现基于LSM算法的美式期权定价 蒋晓蓝 (中山大学信息科学与技术学院广东广州510006) 摘 要:期权是金融领域中投资者用以进行套利和避险交易的一种衍生性金融工具。相对于CPU,GPU有着更好的并行处理能力和带宽优势, 将其用于期权定价计算将极大地提高运算性能。本文以经典的美式期权定价模型的最小二来蒙特卡洛方法为基础,提出了该算法基于GPU的一 种实现。凌文对一维期权合约的定价在CPU和GPU..E进行了比较,来探索用GPU进行期权定价计算的优越性。测试结果表明,在保证相应的系 统稳定性的前提下,针对不同的模拟次数和时间步数,GPU平台在运算性能上明显优于CPU平台。 关键词:美式期权定价GPU CUDA 中图分类号:TP391 文献标识码:A 文章编号:1674--098X(2013)06(c)一0034—02 Abst ract:Recently,with the rapid development of computer techniques,the ability of dealing with parallel computing has got significantly improved.The parallel computing technique is widely used in the field of Financial,Oil,Hydr0mechanics,Image Processing and so on.The Least-Squares Monte Carlo method dealing with American Option pricing is born to be parallized and parallization will make it more effieient.The aim of this paper,is to study the paranelizati0n of the Least—Squares Monte Carlo method on GPU and explore its performances.The result tell us that the GPU platform is obviously better than CPU. Key words:American Option pricing GPU CUDA 期权是在期货的基础上产生的一种 衍生性金融工具,可以使其买方将风险 锁定在一定的范围之内。美式期权由于 其执行日期灵活,得到了普遍的应用,其 研究是期权理论无法回避的核心内容…, 美式期权定价问题也具有重要的现实意 义。通常,美式期权只能使用近似解析方 法或者数值方法进行求解。其中,较为著 名的近似解析方法是由Macreillan最初 提出 ,并由Ba rone—Sde si和Whaley 进行扩展的二次方程近似” 。由于GPU 具备强大的并行处理能力和良好的带宽 优势,故考虑将GPU作为算法并行化的 实现平台。本文将基于LSM算法来研究 如何利用GPU来提高该算法的定价计算 效率。 该文接下来的内容安排如下:第二部 分介绍LSM算法的并行化;第三部分将一 维美式期权定价在CPU和GPU上进行比 较,第五部分总结该文的工作和研究结果, 并对计算金融领域并行化的研究前景进行 了展望。 1.2回归模块 IAjx 一 ll 4、化的条件 基于P.GIasserman和B.Yu的收敛性 对角矩阵,于是,I为: 研究” ,我们用次数小于等于2的单项式作 为基函数。这个回归需要求矩阵的逆,一个 X = =O U 最有效且最稳定的计算矩阵的逆的方法是 这种方法方法难于并行处理,但由于 基于矩阵的奇异值分解(Singular Value 用上述基函数进行回归时回归系数矩阵 Decomposition,SVD),即将矩阵 ,进 小,计算复杂度较低,相比于这种求回归系 行SVD分解为UE ,其中U为nx 正交 数的计算,对其他模块进行并行将节省更 多的时间,因此我们把求回归系数矩阵部 矩阵,『,为 xtn正交矩阵,∑为n× 1 LSM算法的并行化 LSM算法的并行化主要涉及到了三大 主要模块:路径生成模块、回归模块和定 价模块。 1.1路径生成模块 路径生成模块的并行化取决于随机数 生成的并行化,我们用每个线程生成一条 路径,多个线程同时生成呈标准正态分布 的随机数。 CUrandC reateGeneratOF()创建 个随机数生成器,并返回 gene rato r类 型。curandSetPseudoRand0mGenerat (a)路径生成模块 orSeed()设置伪随机数生成器的种子值。 不同的种子值将生成不同的随机序列。 CurandGeneTateNOFmal()用随机数生 成器生成服从标准正态分布N(0,1)的随机 值,结果存放在设备寄存器中。本函数先用 伪随机数生成器生成随机数,再通过上文 介绍的BOx~Muller转换得到,这就要求 随机数数目这个参数为偶数。 (b)回归模块 34 科技创新导报Science and Technology Innovation Herald 垫! :3 丁技术 Science and Technology ̄novation Herald 从图l可看出,当使用GPU时,减少了 仿真的总时间,回归模块在GPU上的运行 快于在CPU上的运行,其他两个模块的运 行时间也得到显著的改善。除此之外,随 着时间步数的增加,我们的仿真变得更加 复杂,GPU从而提供了一个更高的加速。 3结语 由测试结果可以看出,在大容量数据 的密集计算中,GPU具有明显的性能优 势,从而证实了将GPU应用于最小二乘蒙 特卡洛方法的美式期权定价计算的可行性 和优越性。本文仍存在许多不足之处,只是 对并行化的执行结果进行了研究,其并行 模块还有待优化,以便兼顾算法的执行效 (c)期权定价模块 囱1 cPu和GPu仿真时间对比 率和准确度,这将成为日后的一个研究方 分放在CPU上执行。用GPU计算出每条路 和。然后,将值保存到全局内存,并结束 向。 , 径的 ,和 的值,从GPU传至CPU, 核函数。这样便得到一个新的数组c[],数 再用CPU进行求矩阵计算。虽然本模块有 组的每个元素中都包含了某线程块计算得 参考文献 [1部分在CPU执行,却对整体的计算性能影 到的和,最后一步是计算c[】中所有元素的 】单娴.美式期权定价问题研究[D】.中国 石油大学,2007.响不大。 总和。由于此时的数据集通常较小,一般 I.3期权定价模块 交由CPU进行计算 。将数据从GPU传至 【2]MacMillan L W.An Analytical Approximation for the Prices[J】. 计算出回归系数矩阵后,从时刻T至时 CPU,计算所有元素的总和,求出均值即为 刻0,每条路径仿真计算现金流可独立进 所求美式期权的价格。 Advances in Futures and 0ptions Research,l986(1):119—1 39. 行。最后用时刻0得到的不同的价格求算术 [3]B a i-o n e—A d e s i G,W h a l e Y 平均值来估计所有价格的期望值。 2实验 R..E f f i C i e n t A n a l Y t i C a 1归约算法的基本思想是,每个线程将 该文所有实验都是基于Inte1(R) APProximati0n of AmeriC an cache[】中的两个值相加,然后将结果保存 COre(TM)2 Duo CPU和NVIDIA 0Pti0n Va1ue s[J].J ou rnal of 回cache[】。由于每个线程都将两个值合并 GeForce 9200M GS显卡。为了测试LSM Finanee,1987(42):3O1—320. 为一个值,完成这个步骤后,得到的结果数 算法在GPU上并行运行较在CPU上的优 14I P.Glasserman and B.量为计算开始时数值数量的一半。在下一 化程度,本文关注GPU对CPU的加速比。 YU..NUmber of Paths Versus Number of Basis 个步骤,我们对得到的数值继续执行相同 三步测试除上述三个变量外,其他参数相 的操作,将这个操作执行log (threadPerBlock) 同。我们设置初始价格为l0,敲定价格为 FunctiOnS in AmeriCan OPtiOn Pricing[J】.The Annals of个步骤后,就得到cache[]中所有值的总 10,无风险利率,为0.06,资产的流动性 Applied 和。 为0.2。首先我们固定仿真路径数目为 Probability,2004,l4(4). 15l Jason Sanders,Edward Kandrot.. 在结束了while()循环后,每个线程 2l 16384,固定基函数为次数小于等于2的 GPU高性能编程cUDA实战【M】.北 都得到了一个值,这个值位于cache【】的 单项式,用来测试时间步数分别为50、1O0 京:机械工业出版社,20l1. 第一个元素中,且等于线程块中元素的加 和200时,GPU对CPU的加速比。 (上接33页) 在互联网接入点采用天融信NGFW4000 安全管理制度,避免由于个别一两台计算 性和保密性;4)决策领导离开办公室后无 网络防火墙(集成VPN功能)产品,客户 机“恶意“下载造成的网络堵塞等问题。加 法访问办公网络,无法及时获得上级文件, 端安装VPN客户端软件,分配用户名和密 强业务人员的工作责任心教育和网络安全 无法批阅网络公文,影响决策办公。 码,这样在任何有internet网络的地方都 防范意识教育,避免出现人为原因造成网 可以通过虚拟隧道实现内网办公,决策者 络安全事故。 3 VPN技术组网的实现 可以随时掌握各种文件信息,提高决策效 针对原网络缺少备份传输线路的弊 率,网络管理员可以随时登陆内网对服务 参考文献 端,我省2009年基于VPN技术进行备份网 器、路由器等网络设备进行远程维护,解决 [1】唐怀瓯,华连生,江双五.基于SDH和 络建设,当主干网络SDH线路出现故障时 各种软件故障,方便工作。 VPN构建热备省级气象宽带网络[J].电 不需要网络管理员人工操作,通过与原有 子世界,2012(2):l35. 路由设备应用VRRP协议实现全自动备份 4网络安全与管理 [2】陈艺宏,林荣惠,张磊.V P N技术 切换,能快速自动切换到VPN备份线路, 因为有互联网的接入,网络安全问题 在气象网络中的应用【J】.陕西气 县级台站不再经过市级,减少网络层次,直 更为重要,目前办公网和各级台站的业务 象,2010(5):37. 接启动VPN设备与省信息中心建立互联网 用机网络病毒问题日益严重,建议购置网 [3】肖文明,阮惠华,孙周军,等.核心网络及 虚拟隧道,通过虚拟隧道进行数据传输, 络版的防病毒软件,实现网络防毒的统一 VPN技术在广东气象业务中的应用[J】. 当主干网络恢复正常后能自动切换回SDH 监控、查杀与管理。各级网络管理人员要 计算机系统应用,2007(7):84. 专线,极大的提高了气象数据传输及时 制定相应的防火墙访问规则及策略,预防 率。 不法黑客攻击及网络病毒的传播,保证气 我局为加强网络安全管理,实现异地 象信息网络的安全。此外还要建立健全相 办公直属单位与局机关的办公网络连接, 关网络管理制度与流程,严格执行计算机 科技创新导报Science and Technology Innovation Herald 35