


Von Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können
Statistik ist ein leistungsstarkes Tool, mit dem wir komplexe Probleme angehen und Fragen beantworten können, die bei der erstmaligen Beobachtung von Daten oder Mustern auftauchen. Ein Beispiel hierfür könnte die Analyse der Persönlichkeit von Kunden in einem Supermarkt sein. Fragen wie Unterscheidet sich diese Gruppe wirklich von den anderen? Inwieweit? Sollte ich mich mehr auf diese Gruppe konzentrieren, um ihr Erlebnis und meine Verkäufe zu verbessern? Sie sind der Schlüssel zum Treffen guter Entscheidungen.
Visualisierungen können uns zwar helfen, Daten schnell zu verstehen, sie sind jedoch nicht immer 100 % zuverlässig. Wir konnten deutliche Unterschiede zwischen den Gruppen beobachten, aber diese Unterschiede sind möglicherweise nicht statistisch signifikant.
Hier kommt die Statistik ins Spiel: Sie hilft uns nicht nur, die Daten tiefer zu analysieren, sondern gibt uns auch die Sicherheit, unsere Annahmen zu bestätigen. Als Datenwissenschaftler oder Entscheidungsträger müssen wir uns darüber im Klaren sein, dass falsche Analysen zu falschen Entscheidungen führen können, was zu Zeit- und Geldverlusten führt. Daher ist es von entscheidender Bedeutung, dass unsere Schlussfolgerungen fundiert sind und durch statistische Beweise gestützt werden.
Wahre Zufriedenheit entsteht, wenn wir sehen, dass sich die Ergebnisse unserer Analyse in wirksamen Veränderungen im Unternehmen, Verbesserungen im Kundenerlebnis und letztendlich einer positiven Auswirkung auf Vertrieb und Betrieb widerspiegeln. Es ist ein unglaubliches Gefühl, Teil dieses Prozesses gewesen zu sein!
Um Ihnen bei der Entwicklung dieser Fähigkeit zu helfen, werden wir in diesem Artikel zur Persönlichkeitsanalyse von Supermarktkunden den Kaggle-Datensatz Kundenpersönlichkeitsanalyse verwenden: https://www.kaggle.com/datasets / imakash3011/customer-personality-analysis
In dieser Analyse untersuchen wir das Verhalten der Kunden eines Supermarkts mit dem Ziel, aus den Daten wertvolle Informationen zu extrahieren. Wir werden versuchen, die folgenden Fragen zu beantworten:
- Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Bildung?
- Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Anzahl der Kinder?
- Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Familienstand?
Obwohl diese Analyse noch viel weiter ausgedehnt werden könnte, werden wir uns auf die Beantwortung dieser drei Fragen konzentrieren, da sie eine große Erklärungskraft bieten. Im gesamten Artikel zeigen wir Ihnen, wie wir diese Fragen beantworten können und wie wir mit demselben Ansatz noch viele weitere Fragen beantworten können.
In diesem Artikel befassen wir uns mit statistischen Analysen wie dem Kolmogorov-Smirnov-Test, dem Levene-Test und wie man weiß, wann man ANOVA anwenden sollte Kruskal -Wallis. Diese Namen mögen für Sie ungewohnt klingen, aber keine Sorge, ich werde sie auf einfache Weise erklären, damit Sie sie ohne Komplikationen verstehen.
Als Nächstes zeige ich Ihnen den Python-Code und die Schritte, die Sie befolgen müssen, um diese statistischen Analysen effektiv durchzuführen.
1. Erste Schritte
Wir importieren die notwendigen Python-Bibliotheken.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
Jetzt können wir zwei Möglichkeiten zum Hochladen der CSV-Datei wählen: Wir erhalten die Datei direkt oder wir können den Kaggle-Link direkt auf der Download-Schaltfläche abrufen.
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
ID | Year_Birth | Education | Marital_Status | Income | Kidhome | Teenhome | Dt_Customer | Recency | MntWines | MntFruits | MntMeatProducts | MntFishProducts | MntSweetProducts | MntGoldProds | NumDealsPurchases | NumWebPurchases | NumCatalogPurchases | NumStorePurchases | NumWebVisitsMonth | AcceptedCmp3 | AcceptedCmp4 | AcceptedCmp5 | AcceptedCmp1 | AcceptedCmp2 | Complain | Z_CostContact | Z_Revenue | Response | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 5524 | 1957 | Graduation | Single | 58138.0 | 0 | 0 | 04-09-2012 | 58 | 635 | 88 | 546 | 172 | 88 | 88 | 3 | 8 | 10 | 4 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 1 |
1 | 2174 | 1954 | Graduation | Single | 46344.0 | 1 | 1 | 08-03-2014 | 38 | 11 | 1 | 6 | 2 | 1 | 6 | 2 | 1 | 1 | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
2 | 4141 | 1965 | Graduation | Together | 71613.0 | 0 | 0 | 21-08-2013 | 26 | 426 | 49 | 127 | 111 | 21 | 42 | 1 | 8 | 2 | 10 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
Um eine bessere Vorstellung von dem Datensatz zu bekommen, den wir analysieren werden, werde ich die Bedeutung jeder Spalte angeben.
Spalten:
-
Personen:
- ID:eindeutige Kennung des Kunden
- Geburtsjahr:Geburtsjahr des Kunden.
- Bildung:Bildungsniveau des Kunden.
- Familienstand:Familienstand des Kunden
- Einkommen:Jahreseinkommen des Haushalts des Kunden
- Kidhome:Anzahl der Kinder im Haus des Kunden
- Teenhome:Anzahl der Teenager im Haus des Kunden
- Dt_Customer:Datum der Kundenregistrierung im Unternehmen
- Aktualität: Anzahl der Tage seit dem letzten Kauf des Kunden.
- Beschweren: 1, wenn sich der Kunde in den letzten 2 Jahren beschwert hat, sonst 0
-
Produkte:
- MntWines: Betrag, der in den letzten 2 Jahren für Wein ausgegeben wurde.
- MntFruits: Betrag, der in den letzten 2 Jahren für Obst ausgegeben wurde.
- MntMeatProducts: Betrag, der in den letzten 2 Jahren für Fleisch ausgegeben wurde.
- MntFishProducts:Betrag, der in den letzten 2 Jahren für Fisch ausgegeben wurde.
- MntSweetProducts:Betrag, der in den letzten 2 Jahren für Süßigkeiten ausgegeben wurde.
- MntGoldProds:Betrag, der in den letzten 2 Jahren für Gold ausgegeben wurde.
-
Aktion:
- NumDealsPurchases:Anzahl der mit Rabatt getätigten Käufe.
- AcceptedCmp1: 1, wenn der Kunde das Angebot in der ersten Kampagne angenommen hat, andernfalls 0.
- AcceptedCmp2: 1, wenn der Kunde das Angebot in der zweiten Kampagne angenommen hat, andernfalls 0.
- AcceptedCmp3: 1, wenn der Kunde das Angebot in der dritten Kampagne angenommen hat, andernfalls 0.
- AcceptedCmp4: 1, wenn der Kunde das Angebot in der vierten Kampagne angenommen hat, andernfalls 0.
- AcceptedCmp5: 1, wenn der Kunde das Angebot in der fünften Kampagne angenommen hat, andernfalls 0.
- Antwort: 1, wenn der Kunde das Angebot in der letzten Kampagne angenommen hat, andernfalls 0
-
Ort:
- NumWebPurchases:Anzahl der über die Unternehmenswebsite getätigten Käufe.
- NumCatalogPurchases: Anzahl der über einen Katalog getätigten Käufe.
- NumStorePurchases:Anzahl der Einkäufe, die direkt in Geschäften getätigt wurden.
- NumWebVisitsMonth: Anzahl der Besuche auf der Website des Unternehmens im letzten Monat.
Ja, es gibt viele Spalten, hier werden wir jedoch nur einige wenige verwenden, um nicht zu sehr zu erweitern. Auf jeden Fall können Sie die gleichen Schritte für die anderen Spalten anwenden.
Jetzt überprüfen wir, dass wir keine Nulldaten haben
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
Wir können feststellen, dass wir 24 Nulldaten in der Spalte „Einkommen“ haben, diese Spalte wird jedoch in dieser Analyse nicht verwendet, daher werden wir nichts damit machen, falls Sie sie verwenden möchten, Sie müssen überprüfen, ob Sie eine dieser beiden Optionen ausführen:
- Imputieren Sie die fehlenden Daten, wenn sie nicht mehr als 5 % der Gesamtdaten ausmachen (Empfehlung).
- Nulldaten löschen.
2. Konfigurieren Sie den Datensatz für die Analyse
Wir behalten die Spalten bei, die für uns von Interesse sind, wie unter anderem Bildung, Kinder, Familienstand, Höhe der Ausgaben pro Produktkategorie.
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
Wir berechnen den Gesamtaufwand, indem wir die Ausgaben aller Produktkategorien addieren.
'marketing_campaign.csv'
Das obige ist der detaillierte Inhalt vonVon Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











Python zeichnet sich in Gaming und GUI -Entwicklung aus. 1) Spielentwicklung verwendet Pygame, die Zeichnungen, Audio- und andere Funktionen bereitstellt, die für die Erstellung von 2D -Spielen geeignet sind. 2) Die GUI -Entwicklung kann Tkinter oder Pyqt auswählen. Tkinter ist einfach und einfach zu bedienen. PYQT hat reichhaltige Funktionen und ist für die berufliche Entwicklung geeignet.

Python ist leichter zu lernen und zu verwenden, während C leistungsfähiger, aber komplexer ist. 1. Python -Syntax ist prägnant und für Anfänger geeignet. Durch die dynamische Tippen und die automatische Speicherverwaltung können Sie die Verwendung einfach zu verwenden, kann jedoch zur Laufzeitfehler führen. 2.C bietet Steuerung und erweiterte Funktionen auf niedrigem Niveau, geeignet für Hochleistungsanwendungen, hat jedoch einen hohen Lernschwellenwert und erfordert manuellem Speicher und Typensicherheitsmanagement.

Um die Effizienz des Lernens von Python in einer begrenzten Zeit zu maximieren, können Sie Pythons DateTime-, Zeit- und Zeitplanmodule verwenden. 1. Das DateTime -Modul wird verwendet, um die Lernzeit aufzuzeichnen und zu planen. 2. Das Zeitmodul hilft, die Studie zu setzen und Zeit zu ruhen. 3. Das Zeitplanmodul arrangiert automatisch wöchentliche Lernaufgaben.

Python ist in der Entwicklungseffizienz besser als C, aber C ist in der Ausführungsleistung höher. 1. Pythons prägnante Syntax und reiche Bibliotheken verbessern die Entwicklungseffizienz. 2. Die Kompilierungsmerkmale von Compilation und die Hardwarekontrolle verbessern die Ausführungsleistung. Bei einer Auswahl müssen Sie die Entwicklungsgeschwindigkeit und die Ausführungseffizienz basierend auf den Projektanforderungen abwägen.

PythonlistsarePartThestandardlibrary, whilearraysarenot.listarebuilt-in, vielseitig und UNDUSEDFORSPORINGECollections, während dieArrayRay-thearrayModulei und loses und loses und losesaluseduetolimitedFunctionality.

Python zeichnet sich in Automatisierung, Skript und Aufgabenverwaltung aus. 1) Automatisierung: Die Sicherungssicherung wird durch Standardbibliotheken wie OS und Shutil realisiert. 2) Skriptschreiben: Verwenden Sie die PSUTIL -Bibliothek, um die Systemressourcen zu überwachen. 3) Aufgabenverwaltung: Verwenden Sie die Zeitplanbibliothek, um Aufgaben zu planen. Die Benutzerfreundlichkeit von Python und die Unterstützung der reichhaltigen Bibliothek machen es zum bevorzugten Werkzeug in diesen Bereichen.

Ist es genug, um Python für zwei Stunden am Tag zu lernen? Es hängt von Ihren Zielen und Lernmethoden ab. 1) Entwickeln Sie einen klaren Lernplan, 2) Wählen Sie geeignete Lernressourcen und -methoden aus, 3) praktizieren und prüfen und konsolidieren Sie praktische Praxis und Überprüfung und konsolidieren Sie und Sie können die Grundkenntnisse und die erweiterten Funktionen von Python während dieser Zeit nach und nach beherrschen.

Python und C haben jeweils ihre eigenen Vorteile, und die Wahl sollte auf Projektanforderungen beruhen. 1) Python ist aufgrund seiner prägnanten Syntax und der dynamischen Typisierung für die schnelle Entwicklung und Datenverarbeitung geeignet. 2) C ist aufgrund seiner statischen Tipp- und manuellen Speicherverwaltung für hohe Leistung und Systemprogrammierung geeignet.
