【摘 要】
:
强化学习(Reinforcement Learning)是解决序列化决策问题的途径之一,其在围棋、电子游戏、物理控制等确定环境下解决问题的能力已经得到证明。该文将强化学习应用到自动交易
论文部分内容阅读
强化学习(Reinforcement Learning)是解决序列化决策问题的途径之一,其在围棋、电子游戏、物理控制等确定环境下解决问题的能力已经得到证明。该文将强化学习应用到自动交易系统(Automated Trading System)的设计中,通过实验讨论了强化学习方法在混沌、动态环境下的表现,为自动交易系统的设计提出新的可能。不同于传统自动交易系统分别设计预测算法与策略算法的做法,基于强化学习的算法将两者合二为一,简化了设计步骤。该文第1章简述了强化学习发展现状;第2章阐述了金融交易问题的建模方法
其他文献
高考学生是一个特殊群体,他们面临高考升学激烈竞争的心理压力,其心理卫生状况有别于一般的高中学生。为了解应届高中毕业生高考前的心理卫生状况,以便为进行有效的预防和干
前不久,倍科洗衣机工厂举行了正式的开业典礼。这是土耳其阿尔切利克(Arcelik)自7月6000万元人民币(约800万美金)购买了新科电器有限公司在常州的厂房,注册了"倍科电器有限公司"后
在“摩登上海——2008口碑指数大赏”评选活动中,百思买荣获“2008上海最具影响力的购物场所”称号。
日立电器日前推出内简直径比原机型加大2cm至约63cm的滚动式洗干一体机“BD-V7300”和“BD-V5300”。通过将滚筒容积从82L增加至86L。提高了拍打清洗的清洁力及干燥后衣物的
由北京大学建筑学研究中心与日本明治大学共同举办的每年一度的中日两国学生的建筑与城市规划的设计工作营活动,继上期“关于北京市保障性用房的规划与设计研讨工作营”的工
四川省旺苍县位于四川盆地北缘,米仓山南麓,县域东西宽约74千米,南北长约80千米,辖区2987.17平方千米。辖35个乡(镇),3个街道办事处,30个居委会,352个行政村,2516个社,总人口
电子工业作单晶片用的硅必须超净超纯。这里介绍一种生产超纯材料的方法,高度可控、有效、价廉并可连续生产。用的是一般的连续CO_2激光器(10.6微米)。激光束入射角大约是88
GB/T4288—2008《家用及类似用途电动洗衣机》中,通过测量残留漂洗液(湿衣物进行2800rpm高速脱水得到的溶液)的相对碱度(相对于试验用水的碱度,是为了消除用水对结果的影响)来确定洗
2009年4月21日-23日,由中国家用电器研究院华东分院、慈溪科技局主办,《家电科技》承办,北京工业设计促进中心与北京各院校鼎力支持的“工业设计产学研互动2009慈溪行”活动
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield