论文部分内容阅读
本文对购物篮分析中的两个问题进行了深入研究:最有利润的商品选择问题,价格促销利润估计问题。本文对这些问题提出了怎样将数据挖掘直接集成到用户目标中的方法。试验表明,这些方法是有效的。 本文提出MOPIS(MOst Profitable Items Selection)算法来选择出最有利润的商品。MOPIS通过预测多个选择的利润来选取最优的选择,通过预测某选择下新的交易数据库来预测该选择的利润。MOPIS算法准确建模了顾客的购买行为,能预测出买不到期望商品时,顾客选择购买其它商品的概率与数量;又能预测出不可得的商品对顾客的购买行为的影响。MOPIS算法使用了一种新的估计选择利润的有效方法,建立了新的商品选择框架,提出了一种新的通过商品间的距离来预测代替商品的购买数量、购买概率的方法,给出了一种新的计算品种间的交叉销售影响的有效方法,提出了用品种贡献值来排序品种间的交叉销售影响的新方法。本文给出了选取最有利润的商品的启发式算法,同时提出了用遗传算法来解决最有利润的商品选择问题的gaMOPIS算法。 本文提出PEPP算法来估计价格促销中的利润。PEPP根据促销前的交易来预测促销中的交易。PEPP算法准确建模了价格促销中顾客的购买行为,能预测出价格变化时,顾客选择购买其它商品的行为;又能预测出被促销的商品对顾客的购买行为的影响。提出了通过商品间的距离来预测价格促销中商品的购买数量及购买概率的新方法,给出了一种新的用交叉销售影响因子来预测被促销的商品对其它商品的影响的有效算法,提出了一种新的预测未购买被促销商品的顾客购买被促销商品的算法。 本文研究表明:MOPIS算法与gaMOPIS算法是解决最有利润的商品选择问题的有效算法;试验表明,MOPIS算法能快速发现具有高的选择利润率的选择,比MPIS平均要快14倍,对含有大量商品、大量交易的数据集也是有效的;PEPP算法是解决价格促销利润估计问题的有效算法;试验表明,PEPP算法能快速、高效地预测价格促销中的利润,且对具有大量交易、大量商品的数据集也是很有效的。