rfm

Python与RFM分析

假如想象 提交于 2020-02-12 02:35:01
RFM是一种用于分析客户价值的方法。 它通常用于数据库营销和直接营销,并在零售和专业服务行业受到特别关注。 评价一个客户是否好坏有上万个变量,但这些变量最终可降到三个维度,即RFM模型 模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。 根据美国 数据库营销 研究所Arthur Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标: 最近一次消费 (Recency) 消费频率 (Frequency) 消费金额 (Monetary) RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的 客户关系管理 (CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。 根据美国 数据库营销 研究所Arthur Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标: 最近一次消费 (Recency) 消费频率 (Frequency) 消费金额 (Monetary) 最近一次消费 简介 最近一次消费意指上一次购买的时候——顾客上一次是几时来店里、上一次根据哪本邮购目录购买东西、什么时候买的车,或在你的超市买早餐最近的一次是什么时候。 理论上,上一次消费时间越近的顾客应该是比较好的顾客

数据分析day05

妖精的绣舞 提交于 2020-01-25 18:49:40
数据分析day05 数据分析回顾 numpy 基于一维或者多维的数组 如何创建numpy数组 np.array() plt.imread() random linspace range 数组的索引和切片 索引: arr[0]:取出第一行数据 切片: arr[行,列] 翻转: arr[::-1,::-1] 级联 条件: 必须保证维度一致形状相符 变形: reshape():修改数组的形状 基于聚合、统计的函数 std(标准差),val(方差) 矩阵: 矩阵乘法 pandas Series:类似于一维数组的数据结构 创建方式 索引和切片 运算法则: 索引与之一致的元素可以进行算术运算否则补空 isnull,notnull,unique,nunique DataFrame df是由Series组成 df中如果单独取出一行或者一列返回的一定是一个Series df的创建方式 索引和切片 索引: df['列索引'] df.iloc['行索引'] df.loc[行,列] 切片 df[row1:row4] df.loc[:,col1:col4] 股票案例: read_xxx():将外部文件中的数据读取到df to_xxx():将df中的数据写入到文件中 tushare:财经数据接口包 Series中有一个方法:shift(x),将Series中的元素上下移动x个位置 数据的重新取样: df

k-means实战-RFM客户价值分群

不问归期 提交于 2019-12-05 12:03:49
数据挖掘的十大算法 基本概念 导入数据集到mysql数据库中 总共有940个独立消费数据 K- Means 算法 K-Means 算法是一个聚类算法。你可以这么理解,最终我想把物体划分成 K 类。假设每 个类别里面,都有个“中心点”,即意见领袖,它是这个类别的核心。现在我有一个新点 要归类,这时候就只要计算这个新点与 K 个中心点的距离,距离哪个中心点近,就变成了 哪个类别。 引入模块 import pandas as pd import numpy as np from sklearn.cluster import KMeans import pymysql 连接数据库: conn = pymysql.connect(host='localhost',user='root',password='123',db='db2',port=3306) rfm = pd.read_sql('select * from consumption_data',con=conn) conn.close() 查看详情: rfm.info() rfm.head() """选取RFM 三列""" new_rfm = rfm.loc[:,['R','F','M']] """调用KMeans算法 进行聚类 ,设定为8类""" clf = KMeans(n_clusters=8,random_state=0)

特征工程――特征转换

匿名 (未验证) 提交于 2019-12-03 00:27:02
无量纲化: 使不同规格尺度的数据转化统一规格尺度(将数据单位统一) 无量纲化方法:标准化, 区间所方法 x ′ = x x σ x ′ = x x σ 其中 x x 是均值, σ σ 是标准差 代码: #对 Amount字段--均值为0,方差为1标准化 from sklearn import preprocessing std = preprocessing.StandardScaler() #StandardScaler Amount = RFM[ 'Amount' ].values.reshape(- 1 , 1 ) std.fit(Amount) RFM[ 'Amount_std' ] = std.transform(Amount) RFM.head( 5 ) x ′ = x m i n ( x ) m a x ( x ) m i n ( x ) x ′ = x m i n ( x ) m a x ( x ) m i n ( x ) 代码: #对 Amount字段--[0,1]区间归一化 from sklearn import preprocessing M in Maxscaler = preprocessing.M in Maxscaler() #MinMaxscaler Amount = RFM[ 'Amount' ].values.reshape(- 1 , 1 )

结对编程(JAVA实现)

只谈情不闲聊 提交于 2019-12-01 13:58:15
结对成员:钟苑莉 张冰微 一、 Github项目地址: https://github.com/Clarazhangbw/ruangongjd 二、PSP表格 PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 30 30 · Estimate · 估计这个任务需要多少时间 30 30 Development 开发 1960 2270 · Analysis · 需求分析 (包括学习新技术) 120 150 · Design Spec · 生成设计文档 40 50 · Design Review · 设计复审 (和同事审核设计文档) 20 30 · Coding Standard · 代码规范 (为目前的开发制定合适的规范) 30 30 · Design · 具体设计 60 80 · Coding · 具体编码 1600 1800 · Code Review · 代码复审 30 40 · Test · 测试(自我测试,修改代码,提交修改) 60 90 Reporting 报告 80 110 · Test Report · 测试报告 30 50 · Size Measurement · 计算工作量 20 20 · Postmortem & Process Improvement Plan · 事后总结

用户价值和RFM模型

落花浮王杯 提交于 2019-11-29 04:57:37
什么是用户价值? 用户价值就是对公司来说有用的地方,比如有的公司看中用户的消费能力,有的公司则看中用户的忠诚度 。各公司的业务目的不同,用户价值的体现自然也不同。这里主要说一下适用于电商的RFM模型。 什么是RFM模型? RFM模型根据用户最近一次消费时间R,消费频率F,消费金额M,计算出RFM值,通过RFM这三个维度来评估用户的价值。 R(Recency) :最近一次消费。用户距离上一次消费的时间间隔。R值越大,表示用户最近一次消费的时间距离现在越久。R指标反应了用户对品牌的熟悉度和回购频率。 F(Frequency) :消费频率。用户在一段时间内的消费次数。F值越大,表示客户在最近一段时间交易次数越多。F指标反应了用户对品牌的忠诚度及购买习惯是否养成。 M(Monetary) :消费金额。用户在一段时间内的消费金额。M值越大,表示客户消费能力越大。M指标反应了用户价值和产品认可度。 RFM模型有什么用? 可以根据RFM模型将用户进行细分,并通过RFM这三个维度将用户分成多个类别,以便实现精益化运营。 用户的8个类别: 如何计算RFM值? R值、F值、M值这三个维度存在量级差距,无法直接通过加减运算来计算出RFM值。计算RFM值有两大类方法: 1,评分方法 方法一:采用5分制为RFM三个维度的值赋予一个评分值。对于F、M变量来讲,值越大代表购买购买频率越高、订单金额越高

GBA 464: Assignment

白昼怎懂夜的黑 提交于 2019-11-27 08:21:43
GBA 464: Assignment 3 1 Objective The general goal of this task is that we try to distinguish potential high-value consumers and separate them from low-value consumers. Recency, frequency and monetary value (RFM) are 3 factors that we can calculate and use to do the targeting. In this assignment, we will work with a sample dataset from a company called CDNOW, to try and figure out the potential value of a consumer in a given month, using only historical data prior to this month. We will then classify the sample by the “RFM index” we generated and see how much it is related to actual consumer