Làm thế nào để ước tính giá trị của khách hàng của bạn đúng cách

Thực hiện mô hình xác suất cho giá trị trọn đời của khách hàng

Khi nói đến giá trị trọn đời của khách hàng (CLV), hầu hết mọi người đang làm sai, theo giáo sư tiếp thị Wharton Peter Fader. Theo mệnh giá, CLV là một khái niệm dễ hiểu để hiểu về một số lượng khách hàng của một doanh nghiệp có giá trị trong suốt cuộc đời của họ. Trong thực tế, nó khó có thể thực hiện theo cách nắm bắt chính xác sự thay đổi trong hành vi của khách hàng. CLV rất có giá trị đối với mọi doanh nghiệp mà nó đáng để đặt thời gian và nghiên cứu để ước tính nó đúng.

Để giúp bạn ước tính CLV đúng cách, chúng ta sẽ tìm hiểu định nghĩa chính thức, kiểm tra những cạm bẫy gây ra các cách tiếp cận phổ biến nhất, tìm hiểu một số lý thuyết đằng sau mô hình buy-til-you-die cho CLV và xem cách triển khai mô hình với gói trọn đời trong Python.

Xác định giá trị trọn đời của khách hàng

Giá trị trọn đời của khách hàng là một dự đoán về giá trị (trong hầu hết các trường hợp, giá trị tiền tệ) mà khách hàng sẽ mang lại cho công ty chúng tôi trong suốt cuộc đời của họ. Định nghĩa chính thức của giá trị trọn đời của khách hàng như sau:

Giá trị hiện tại của tổng dòng tiền chiết khấu dự kiến ​​của một khách hàng cá nhân.

Chúng ta nên nắm bắt một cách trực giác rằng giá trị của một khách hàng trong suốt cuộc đời của họ dựa trên tổng của tất cả các giao dịch mua hàng của họ (tức là dòng tiền). Chúng tôi sẽ quay trở lại giá trị hiện tại và các phần chiết khấu của định nghĩa này. Xác định một khách hàng sẽ chi bao nhiêu trong tương lai là phần khó nhất, và đó là những gì chúng tôi sẽ dành phần lớn thời gian của chúng tôi.

Khi chúng tôi hiểu được giá trị của mỗi khách hàng, chúng tôi có thể

  • Xác định các đặc điểm của mối quan hệ khách hàng có giá trị nhất của chúng tôi và tìm kiếm khách hàng có đặc điểm tương tự
  • Hiểu được chúng ta nên chi bao nhiêu để có được một loại khách hàng cụ thể
  • Đẩy các kênh mang lại cho chúng tôi khách hàng giá trị nhất của chúng tôi
  • Tiếp cận với khách hàng tốt nhất của chúng tôi để nghiên cứu thị trường và phản hồi sản phẩm

Xác định bối cảnh kinh doanh

Trước khi bắt đầu, chúng tôi cần phân biệt quan trọng giữa hai loại khách hàng (hợp đồng và không hợp đồng) và cơ hội mua hàng của họ (rời rạc hoặc liên tục). Sự kết hợp giữa loại khách hàng và cơ hội mua hàng xác định bối cảnh kinh doanh, điều này sẽ ảnh hưởng đến sự lựa chọn phương pháp ước tính CLV của chúng tôi.

Khách hàng theo hợp đồng là khách hàng đăng ký - họ bắt đầu vào một ngày xác định nếu họ chọn không gia hạn. Khách hàng không hợp đồng tồn tại trong các doanh nghiệp thương mại điện tử hoặc bán lẻ, nơi khách hàng có thể mua hàng với tần suất và số lượng khác nhau. Chúng tôi có thể tự tin xác định khuấy đảo trong môi trường không hợp đồng, vì điều đó không thể chắc chắn nếu khách hàng là người bị đảo ngược hoặc chỉ mua hàng không thường xuyên.

Một công ty thương mại điện tử điển hình có cơ hội mua hàng liên tục - khách hàng có thể mua bất cứ lúc nào. Tuy nhiên, một số doanh nghiệp có cơ hội mua hàng riêng biệt, trong đó khách hàng chỉ có thể mua tại một thời điểm cụ thể (ví dụ: nạp theo toa hoặc vé buổi hòa nhạc).

Chúng tôi phải chọn cách tiếp cận ước tính CLV phù hợp với loại khách hàng mà chúng tôi đánh giá. Với mục đích của hướng dẫn này, tôi sẽ xem xét cài đặt liên tục, không hợp đồng.

Điều gì sai trái với cách tiếp cận phổ biến đối với CLV?

Google Hướng dẫn cách tính giá trị trọn đời của khách hàng và bạn sẽ tìm thấy các trang hướng dẫn từ các thương hiệu tiếp thị có vẻ đáng tin cậy như HubSpot, Kissmetrics và Optimizely. Thật không may, cách tiếp cận phổ biến trên trang nhất của Google là quá đơn giản và đôi khi chỉ đơn giản là sai. Dưới đây, một ví dụ về cách CLV thường được mô tả:

[CLV] được tính bằng cách nhân Giá trị đơn hàng trung bình với số lần mua dự kiến ​​và thời gian tham gia.

Tại sao đây là một định nghĩa sai lệch? Trước hết, chúng tôi thực sự không nên nghĩ về CLV như một phép tính (giống như cách chúng tôi tính toán các số liệu như giá trị đơn hàng trung bình hoặc tỷ lệ nhấp). CLV về cơ bản là một ước tính của một ẩn số, không phải là tính toán của một cái đã biết. Chắc chắn, chúng ta có thể nhìn vào tổng doanh thu trong quá khứ của một khách hàng, nhưng nếu chúng ta muốn ước tính giá trị của một khách hàng trong suốt cuộc đời của họ, chúng ta phải giới thiệu một thành phần dự đoán mô tả hành vi mua hàng trong tương lai của họ. Về mặt thống kê, chúng tôi rất tò mò về giá trị mong đợi của khách hàng. Sẽ luôn có sự không chắc chắn trong câu trả lời cuối cùng của chúng tôi cho CLV.

Thứ hai, phương pháp phổ biến này phụ thuộc quá nhiều vào mức trung bình trên tổng số tất cả các khách hàng của bạn. Các giá trị thực tế cho tần suất đặt hàng và giá trị đơn hàng có thể thay đổi đáng kể từ khách hàng này sang khách hàng khác. Tính trung bình không đủ để mô tả để nắm bắt sự phân phối của các tham số này khi chúng tồn tại trong thực tế.

Ví dụ, hãy tưởng tượng hai khách hàng - Khách hàng A đã đặt một loạt các đơn đặt hàng khoảng một tháng trước, nhưng sau đó mất hứng thú với công ty chúng tôi và biến mất. Khách hàng B mua ít thường xuyên hơn, nhưng đã là khách hàng thường xuyên. Nếu chúng tôi dựa trên ước tính CLV của chúng tôi về tần suất mua trung bình và giá trị đơn hàng trung bình, chúng tôi sẽ bị lầm tưởng rằng Khách hàng A sẽ có giá trị hơn Khách hàng B theo thời gian. Chúng tôi đã thất bại trong việc tính toán khả năng cái chết của người chết của khách hàng A.

Hành vi mua hàng cho hai khách hàng khác nhau trong khoảng thời gian hai tháng.

Nếu chúng ta muốn ước tính CLV chính xác, chúng ta cần bắt đầu suy nghĩ về cách ước tính giá trị trọn đời cho mỗi khách hàng và không chỉ cho tổng hợp. Tất nhiên, ước tính đó khó khăn hơn nhiều so với nhân một số trung bình với nhau, nhưng kết quả cuối cùng của chúng tôi sẽ chính xác hơn nhiều.

Mô hình mua-til-you-die

Năm 1987, một nhóm các nhà nghiên cứu từ Wharton và Columbia đã mô tả một mô hình gọi là Pareto / NBD để ước tính số lượng mua hàng trong tương lai mà khách hàng sẽ thực hiện. Mô hình Pareto / NBD là một phần của một nhóm biến thể lớn hơn được gọi là mô hình buy-til-you-die (BTYD).

Các mô hình BTYD ước tính hành vi mua của khách hàng thông qua hai quy trình ngẫu nhiên - xác suất khách hàng thực hiện giao dịch mua lặp lại và xác suất khách hàng chết, chết hoặc ngừng mua vĩnh viễn. Bạn có thể nghĩ về điều này như hai đồng tiền được lật liên tục. Đồng xu đầu tiên ra lệnh cho dù khách hàng có mua hàng hay không. Đồng xu thứ hai ra lệnh cho dù khách hàng có còn sống hay không. Mỗi đồng xu có xác suất đầu của nó được rút ra từ phân phối của nó.

Chúng tôi không cần nhiều thông tin để ước tính các tham số chi phối các phân phối này. Các yếu tố thúc đẩy cho mô hình này là lần truy cập gần đây và tần suất, trong đó lần truy cập đề cập đến thời gian kể từ lần mua hàng cuối cùng của khách hàng và tần suất đề cập đến số lần mua lặp lại được đặt bởi khách hàng đó trong khoảng thời gian nhất định. Những yếu tố này có ý nghĩa trực quan - một khách hàng đã mua thường xuyên trong quá khứ, nhưng đã mua gần đây có lẽ đã chết. Một khách hàng đã mua không thường xuyên trong quá khứ có thể không chết nhưng chưa sẵn sàng để mua lại.

Mục tiêu của chúng tôi với mô hình BTYD là ước tính số lượng mua hàng dự kiến ​​trong tương lai mà mỗi khách hàng sẽ đặt trong một khoảng thời gian với tần suất và tần suất của họ.

E [X (t)] = số lượng giao dịch dự kiến ​​trong thời gian dài t
          (đưa ra tần suất và tần suất của khách hàng)

Khi chúng tôi có số lượng mua hàng dự kiến ​​trong tương lai cho mỗi khách hàng, chúng tôi có thể nhân số đó với giá trị đơn hàng trung bình của khách hàng đó để có được giá trị trọn đời còn lại (RLV) của họ. Có một số cách chúng ta có thể ước tính giá trị đơn hàng trung bình của khách hàng - chúng ta sẽ đi qua một mô hình được gọi là mô hình Gamma Gamma sau này.

RLV = mua hàng trong tương lai dự kiến ​​* giá trị đơn hàng trung bình dự kiến

Giá trị trọn đời còn lại là lượng giá trị bổ sung mà chúng tôi dự kiến ​​sẽ thu thập từ một khách hàng trong một khoảng thời gian nhất định. Từ đây, CLV rất dễ dàng để truy cập - chỉ cần thêm tổng của từng khách hàng mua hàng trước đây vào RLV của họ. Mặc dù chúng tôi không thể mô hình hóa một hành vi khách hàng cá nhân chặt chẽ, nhưng mô hình BTYD thực hiện rất tốt cho tổng hợp vì chúng tôi có thể nắm bắt được sự thay đổi trong từng hành vi mua hàng của khách hàng.

Vào năm 2003, Peter Fader và Bruce Hardie đã xuất bản bài báo bán nguyệt của họ về một phiên bản đơn giản của Pareto / NBD được gọi là Beta-hình học / NBD (BG / NBD) dễ thực hiện hơn nhiều. Họ dành một lượng thời gian đáng kể để làm cho mô hình này có thể truy cập nhiều nhất có thể - xây dựng gói R, mẫu Excel và viết nhiều về cách suy nghĩ và mô hình CLV. Công việc của họ về chủ đề này đã giúp thiết lập mô hình BTYD làm cơ sở ưa thích để ước tính CLV trong bối cảnh kinh doanh ngoài hợp đồng.

Với tinh thần giữ cho điều này trở nên thiết thực hơn, tôi đã chiến thắng môn toán hoặc phân phối đằng sau các mô hình này, nhưng tôi khuyến khích bạn đọc các bài viết được liên kết ở cuối hướng dẫn này để phát triển sự hiểu biết khái niệm sâu sắc hơn trước khi bạn thực hiện điều này.

Triển khai mô hình BTYD với tuổi thọ

Khi nói đến việc thực hiện mô hình BG / NBD, hầu hết các công việc đã được thực hiện cho chúng tôi. Cameron Davidson-Pilon, cựu giám đốc khoa học dữ liệu tại Shopify, đã xây dựng một gói Python tuyệt vời gọi là thời gian sống thực hiện hầu hết các công việc nặng nhọc (nếu R là việc của bạn, hãy xem BTYD). Chúng tôi sẽ sử dụng GammaGammaFitter sử dụng mô hình Gamma Gamma để ước tính giá trị đơn hàng trung bình và mô hình BG / NBD để ước tính tần suất mua trong tương lai. Gói này được ghi chép khá đầy đủ, vì vậy tôi sẽ giới thiệu cho bạn tài liệu về các ví dụ mã cụ thể.

Để sử dụng trọn đời, chúng tôi sẽ cần một nhật ký sự kiện giao dịch với ID khách hàng, ngày đặt hàng và số lượng đặt hàng. Nếu một khách hàng đặt hàng nhiều lần trong cùng một ngày, hãy cộng các đơn hàng của họ vào ngày đó cùng nhau.

Tiếp theo, chúng tôi sẽ sử dụng Summary_data_from_transaction_data để chuyển đổi nhật ký sự kiện của chúng tôi thành lần truy cập, tần suất và giá trị tiền tệ (RFM) cho mỗi khách hàng. Các cột này chứa các thuộc tính sau cho mỗi khách hàng:

  • T là độ dài của khoảng thời gian quan sát cho khách hàng dựa trên giá trị được sử dụng cho freq (mặc định là tần số là ngày). Điều này cũng có thể được nghĩ đến về khoảng thời gian giữa lần mua hàng đầu tiên của khách hàng và cuối kỳ, được tính theo gia số được xác định bởi freq.
  • lần truy cập gần đây là điểm (liên quan đến thời gian quan sát của chính họ) mà tại đó khách hàng thực hiện giao dịch mua lặp lại gần đây nhất. Điều này cũng có thể được nghĩ đến về khoảng thời gian giữa lần mua hàng đầu tiên và lần mua hàng cuối cùng của khách hàng trong khoảng thời gian, được tính theo gia số được xác định bởi freq.
  • tần suất là số lần mua lặp lại mà khách hàng đã thực hiện trong suốt thời gian quan sát.
  • tiền tệ_value là số tiền trung bình của mỗi lần mua lặp lại được thực hiện bởi một khách hàng.

Trước khi chúng tôi phù hợp với mô hình của chúng tôi, chúng tôi cần kiểm tra một giả định quan trọng. Mô hình mà chúng tôi sẽ sử dụng giả định rằng giá trị và tần suất tiền tệ là độc lập tuyến tính - nghĩa là, giả định rằng khách hàng không bắt đầu chi tiêu nhiều hơn hoặc ít hơn khi họ mua thêm. Theo tài liệu, chúng tôi tính toán mối tương quan Pearson giữa tần suất và tiền tệ_value cho khách hàng với các lần mua lặp lại (tần số> 0) để xác thực giả định này.

Tiếp theo, chúng tôi sẽ sử dụng GammaGammaFitter để phù hợp với mô hình của chúng tôi, sử dụng khung dữ liệu RFM của chúng tôi (được lọc để nó chỉ bao gồm các khách hàng mua lặp lại). Sau khi khớp mô hình, chúng ta có thể sử dụng phương thức mô hình khách hàng mô hình khách hàng_lifetime_value để tính toán số tiền chúng tôi dự đoán mỗi khách hàng sẽ chi tiêu trong một khoảng thời gian nhất định (đây là giá trị trọn đời còn lại của khách hàng). Lưu ý rằng tại thời điểm viết, có một số vấn đề mở với việc sử dụng tần số khác với ngày đối với phương thức customer_lifetime_value. Để hiểu đối số discount_rate, chúng ta cần xem lại định nghĩa ban đầu về CLV.

Giá trị hiện tại của tổng dòng tiền chiết khấu dự kiến ​​của một khách hàng cá nhân.

Vì vậy, giá trị hiện tại và giảm giá có nghĩa là gì? Các thuật ngữ này đề cập đến giá trị thời gian của tiền, nói rằng dòng tiền xảy ra trong tương lai ngày nay ít có giá trị hơn so với khi chúng xảy ra trong hiện tại. Về cơ bản, giá trị trọn đời của một khách hàng ngày hôm nay bằng tổng số tiền mua hàng trong tương lai của họ, được điều chỉnh cho thực tế là chúng tôi sẽ nhận được những dòng tiền đó vào một ngày sau đó.

Để thực hiện điều chỉnh đó, chúng tôi phải nhập giá trị được điều chỉnh hàng tháng cho discount_rate. Chọn tỷ lệ chiết khấu nằm ngoài phạm vi của cuộc thảo luận này, nhưng bạn sẽ muốn nhập một tỷ lệ phù hợp với sự phát triển của doanh nghiệp. Giảm giá hàng tháng mặc định là 1%, đây là một nơi tốt để bắt đầu.

Khi chúng tôi ước tính từng khách hàng, dự đoán giá trị trọn đời còn lại với phương thức customer_lifetime_value, chúng tôi có thể thêm nó vào tổng của từng khách hàng Giá trị đơn hàng lịch sử để có được CLV ước tính cho mỗi khách hàng! Đây là thông tin rất mạnh mẽ. Cuối cùng, bạn sẽ muốn đưa mô hình này vào sản xuất để nó cập nhật thường xuyên khi dữ liệu giao dịch của bạn phát triển.

Gói trọn đời có rất nhiều phương thức thú vị khác (kiểm tra lô_probability_alive_matrix), vì vậy tôi khuyến khích bạn khám phá tài liệu chi tiết hơn. Tôi cũng đã liên kết một loạt các bài báo, bài nói và bài viết hữu ích khác dưới đây để tham khảo. Việc triển khai một mô hình CLV dự đoán là không tầm thường, nhưng nó sẽ giúp bạn có được sự hiểu biết chính xác và sắc thái hơn về những người mua sản phẩm của bạn. Bạn có thể làm được!

Nếu bạn thích bài viết này, vui lòng theo dõi tôi tại đây để biết thêm nội dung về kỹ thuật dữ liệu và phân tích trong các công ty vừa và nhỏ.

đọc thêm

  1. Peter Fader & Bruce Hardie từ giấy, đếm khách hàng của bạn một cách dễ dàng
  2. Peter Fader & Bruce Hardie Tờ giấy, Cái gì sai với công thức CLV này?
  3. Jean-Rene Gauthier & Ben Van Dyke từ 2017 nói về các mô hình CLV tại PyData
  4. Bài viết của Ben Keen sườn về việc triển khai mô hình BG / NBD bằng Python từ đầu.
  5. Bài thuyết trình của Roberto Medri sườn 2012 về mô hình CLV và BG / NBD tại Etsy.

Câu chuyện này được xuất bản trong The Startup, ấn phẩm doanh nhân lớn nhất Medium Medium theo sau là +438.678 người.

Đăng ký để nhận những câu chuyện hàng đầu của chúng tôi ở đây.