


Daripada Data kepada Strategi: Bagaimana Statistik Boleh Memacu Keputusan Pemasaran yang Boleh Dipercayai
statistik ialah alat berkuasa yang membolehkan kami menangani masalah yang rumit dan menjawab soalan yang timbul apabila memerhati data atau corak buat kali pertama. Contohnya boleh menganalisis personaliti pelanggan di pasar raya. Soalan seperti Adakah kumpulan ini benar-benar berbeza daripada yang lain? Setakat mana? Perlukah saya lebih fokus pada kumpulan ini untuk meningkatkan pengalaman mereka dan jualan saya? Mereka adalah kunci untuk membuat keputusan yang baik.
Walaupun visualisasi boleh membantu kami memahami data dengan cepat, ia tidak selalunya boleh dipercayai 100%. Kita boleh melihat perbezaan yang jelas antara kumpulan, tetapi perbezaan tersebut mungkin tidak signifikan secara statistik.
Di sinilah statistik berperanan: bukan sahaja ia membantu kami menganalisis data dengan lebih mendalam, tetapi ia memberi kami keyakinan untuk mengesahkan andaian kami. Sebagai saintis data atau profesional membuat keputusan, kita mesti sedar bahawa analisis yang salah boleh membawa kepada keputusan yang salah, mengakibatkan kehilangan masa dan wang. Oleh itu, adalah penting bahawa kesimpulan kami berasas, disokong oleh bukti statistik.
Kepuasan sebenar datang apabila kami melihat hasil analisis kami dicerminkan dalam perubahan berkesan dalam syarikat, peningkatan dalam pengalaman pelanggan dan, akhirnya, kesan positif terhadap jualan dan operasi. Sungguh satu perasaan yang luar biasa untuk menjadi sebahagian daripada proses itu!
Untuk membantu anda mengembangkan kemahiran ini, kami akan membangunkan dalam artikel ini dalam Analisis Personaliti pelanggan pasar raya, kami akan menggunakan Set Data Kaggle Analisis Personaliti Pelanggan: https://www.kaggle.com/datasets / imakash3011/analisis-personaliti-pelanggan
Dalam analisis ini, kami akan meneroka gelagat pelanggan pasar raya dengan tujuan mengekstrak maklumat berharga daripada data. Kami akan berusaha untuk menjawab soalan berikut:
- Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan mengikut Pendidikan?
- Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan sebanyak Bilangan kanak-kanak?
- Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan mengikut Status Perkahwinan?
Walaupun analisis ini boleh dipanjangkan lebih jauh, kami akan menumpukan pada menjawab tiga soalan ini, kerana ia menawarkan kuasa penjelasan yang hebat. Sepanjang artikel itu, kami akan menunjukkan kepada anda bagaimana kami boleh menangani soalan ini dan bagaimana, melalui pendekatan yang sama, kami boleh menjawab lebih banyak soalan.
Dalam artikel ini kita akan meneroka analisis statistik seperti ujian Kolmogorov-Smirnov, ujian Levene dan bagaimana untuk mengetahui masa untuk memohon ANOVA atau Kruskal -Wallis. Nama-nama ini mungkin terdengar asing bagi anda, tetapi jangan risau, saya akan menerangkannya dengan cara yang mudah supaya anda memahaminya tanpa komplikasi.
Seterusnya, saya akan menunjukkan kepada anda kod Python dan langkah-langkah yang perlu diikuti untuk melaksanakan analisis statistik ini dengan berkesan.
1. Bermula
Kami mengimport perpustakaan Python yang diperlukan.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
Kini kami boleh memilih dua cara untuk memuat naik fail .csv, kami terus mendapatkan fail tersebut atau kami boleh mendapatkan pautan kaggle, terus pada butang muat turun.
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
ID | Year_Birth | Education | Marital_Status | Income | Kidhome | Teenhome | Dt_Customer | Recency | MntWines | MntFruits | MntMeatProducts | MntFishProducts | MntSweetProducts | MntGoldProds | NumDealsPurchases | NumWebPurchases | NumCatalogPurchases | NumStorePurchases | NumWebVisitsMonth | AcceptedCmp3 | AcceptedCmp4 | AcceptedCmp5 | AcceptedCmp1 | AcceptedCmp2 | Complain | Z_CostContact | Z_Revenue | Response | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 5524 | 1957 | Graduation | Single | 58138.0 | 0 | 0 | 04-09-2012 | 58 | 635 | 88 | 546 | 172 | 88 | 88 | 3 | 8 | 10 | 4 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 1 |
1 | 2174 | 1954 | Graduation | Single | 46344.0 | 1 | 1 | 08-03-2014 | 38 | 11 | 1 | 6 | 2 | 1 | 6 | 2 | 1 | 1 | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
2 | 4141 | 1965 | Graduation | Together | 71613.0 | 0 | 0 | 21-08-2013 | 26 | 426 | 49 | 127 | 111 | 21 | 42 | 1 | 8 | 2 | 10 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
Untuk mendapatkan idea yang lebih baik tentang set data yang akan kami analisis, saya akan menunjukkan maksud setiap lajur.
Lajur:
-
Orang:
- ID: pengecam unik pelanggan
- Tahun_Lahir: tahun kelahiran pelanggan.
- Pendidikan: tahap pendidikan klien.
- Status_Perkahwinan: status perkahwinan pelanggan
- Pendapatan: pendapatan tahunan isi rumah pelanggan
- Kidhome: Bilangan kanak-kanak di rumah pelanggan
- Rumah Remaja: Bilangan remaja di rumah pelanggan
- Dt_Customer: Tarikh pendaftaran pelanggan dalam syarikat
- Keterkinian: bilangan hari sejak pembelian terakhir pelanggan.
- Aduan: 1 jika pelanggan mengadu dalam 2 tahun lepas, 0 sebaliknya
-
Produk:
- MntWines: Amaun yang dibelanjakan untuk wain dalam tempoh 2 tahun yang lalu.
- MntFruits: Amaun yang dibelanjakan untuk buah-buahan dalam tempoh 2 tahun yang lalu.
- MntMeatProducts: Amaun yang dibelanjakan untuk daging dalam tempoh 2 tahun yang lalu.
- MntFishProducts: jumlah yang dibelanjakan untuk ikan dalam tempoh 2 tahun yang lalu.
- MntSweetProducts: jumlah yang dibelanjakan untuk gula-gula dalam 2 tahun lepas.
- MntGoldProds: jumlah yang dibelanjakan untuk emas dalam tempoh 2 tahun lepas.
-
Promosi:
- NumDealsPurchases: Bilangan pembelian yang dibuat dengan diskaun.
- AcceptedCmp1: 1 jika pelanggan menerima tawaran dalam kempen pertama, 0 sebaliknya.
- AcceptedCmp2: 1 jika pelanggan menerima tawaran dalam kempen kedua, 0 sebaliknya.
- AcceptedCmp3: 1 jika pelanggan menerima tawaran dalam kempen ketiga, 0 sebaliknya.
- AcceptedCmp4: 1 jika pelanggan menerima tawaran dalam kempen keempat, 0 sebaliknya.
- AcceptedCmp5: 1 jika pelanggan menerima tawaran dalam kempen kelima, 0 sebaliknya.
- Jawapan: 1 jika pelanggan menerima tawaran dalam kempen terakhir, 0 sebaliknya
-
Tempat:
- NumWebPurchases: Bilangan pembelian yang dibuat melalui tapak web syarikat.
- NumCatalogPurchases: Bilangan pembelian yang dibuat melalui katalog.
- NumStorePurchases: Bilangan pembelian yang dibuat terus di kedai.
- NumWebVisitsMonth: Bilangan lawatan ke tapak web syarikat pada bulan lepas.
Ya, terdapat banyak lajur, namun di sini kami hanya akan menggunakan beberapa, supaya tidak memanjangkan terlalu banyak, dalam apa jua keadaan anda boleh menggunakan langkah yang sama untuk lajur lain.
Sekarang, kami akan mengesahkan bahawa kami tidak mempunyai data nol
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
Kami dapat melihat bahawa kami mempunyai 24 data nol dalam lajur Pendapatan, namun lajur ini tidak akan digunakan dalam analisis ini oleh itu kami tidak akan melakukan apa-apa dengannya, sekiranya anda ingin menggunakannya, anda mesti mengesahkan melaksanakan salah satu daripada dua pilihan ini:
- Imput data yang hilang jika ia tidak mewakili lebih daripada 5% daripada jumlah data (pengesyoran).
- Padamkan data nol.
2. Konfigurasikan Set Data untuk analisis
Kami akan menyimpan lajur yang menarik minat kami, seperti pendidikan, anak, status perkahwinan, jumlah perbelanjaan bagi setiap kategori produk, antara lain.
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
Kami mengira jumlah perbelanjaan dengan menambah perbelanjaan semua kategori produk.
'marketing_campaign.csv'
Atas ialah kandungan terperinci Daripada Data kepada Strategi: Bagaimana Statistik Boleh Memacu Keputusan Pemasaran yang Boleh Dipercayai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Python cemerlang dalam permainan dan pembangunan GUI. 1) Pembangunan permainan menggunakan pygame, menyediakan lukisan, audio dan fungsi lain, yang sesuai untuk membuat permainan 2D. 2) Pembangunan GUI boleh memilih tkinter atau pyqt. TKInter adalah mudah dan mudah digunakan, PYQT mempunyai fungsi yang kaya dan sesuai untuk pembangunan profesional.

Python lebih mudah dipelajari dan digunakan, manakala C lebih kuat tetapi kompleks. 1. Sintaks Python adalah ringkas dan sesuai untuk pemula. Penaipan dinamik dan pengurusan memori automatik menjadikannya mudah digunakan, tetapi boleh menyebabkan kesilapan runtime. 2.C menyediakan kawalan peringkat rendah dan ciri-ciri canggih, sesuai untuk aplikasi berprestasi tinggi, tetapi mempunyai ambang pembelajaran yang tinggi dan memerlukan memori manual dan pengurusan keselamatan jenis.

Untuk memaksimumkan kecekapan pembelajaran Python dalam masa yang terhad, anda boleh menggunakan modul, masa, dan modul Python. 1. Modul DateTime digunakan untuk merakam dan merancang masa pembelajaran. 2. Modul Masa membantu menetapkan kajian dan masa rehat. 3. Modul Jadual secara automatik mengatur tugas pembelajaran mingguan.

Python lebih baik daripada C dalam kecekapan pembangunan, tetapi C lebih tinggi dalam prestasi pelaksanaan. 1. Sintaks ringkas Python dan perpustakaan yang kaya meningkatkan kecekapan pembangunan. 2. Ciri-ciri jenis kompilasi dan kawalan perkakasan meningkatkan prestasi pelaksanaan. Apabila membuat pilihan, anda perlu menimbang kelajuan pembangunan dan kecekapan pelaksanaan berdasarkan keperluan projek.

Pythonlistsarepartofthestandardlibrary, sementara

Python cemerlang dalam automasi, skrip, dan pengurusan tugas. 1) Automasi: Sandaran fail direalisasikan melalui perpustakaan standard seperti OS dan Shutil. 2) Penulisan Skrip: Gunakan Perpustakaan Psutil untuk memantau sumber sistem. 3) Pengurusan Tugas: Gunakan perpustakaan jadual untuk menjadualkan tugas. Kemudahan penggunaan Python dan sokongan perpustakaan yang kaya menjadikannya alat pilihan di kawasan ini.

Adakah cukup untuk belajar Python selama dua jam sehari? Ia bergantung pada matlamat dan kaedah pembelajaran anda. 1) Membangunkan pelan pembelajaran yang jelas, 2) Pilih sumber dan kaedah pembelajaran yang sesuai, 3) mengamalkan dan mengkaji semula dan menyatukan amalan tangan dan mengkaji semula dan menyatukan, dan anda secara beransur-ansur boleh menguasai pengetahuan asas dan fungsi lanjutan Python dalam tempoh ini.

Python dan C masing -masing mempunyai kelebihan sendiri, dan pilihannya harus berdasarkan keperluan projek. 1) Python sesuai untuk pembangunan pesat dan pemprosesan data kerana sintaks ringkas dan menaip dinamik. 2) C sesuai untuk prestasi tinggi dan pengaturcaraan sistem kerana menaip statik dan pengurusan memori manual.
