In Abschnitt 2.2 wird erlautert, wie wichtig die Auswahl der Variablen fur die Qualitat der Ergebnisse einer Clusteranalyse sind. Daher wird in diesem Abschnitt auf Basis der vorangehenden Uberlegungen eine Menge von relevanten Variablen fur die Clusteranalyse de_niert. Dies soll dazu dienen, dass alle Variablen einen konzeptionell unterstutzten Hintergrund haben. Da eine Nutzung der vorgestellten Google Places API vorgeschlagen wird, wird unter Berucksichtigung der in Abschnitt 3.3.2 vorgestellten Liste von Kennzeichen fur Lokalitaten die fur die Untersuchung relevante Menge von Kennzeichen ausgewahlt werden. Fur diesen Zweck wird folgende Annahme getro_en, die der Annahme 1 aus Abschnitt 3.4 zwar stark ahnelt, aber unter dem Kontext der Auswahl der Variablen fur die Clusteranalyse steht:

Annahme 3: Die Existenz von umgebenden Lokalitaten kann die Zahlungsbereitschaft der Konsumenten fur bestimmte Produktgruppen beeinussen.

Dies ist eine grundlegende Annahme, die fur den gesamten Verlauf der Untersuchung vorausgesetzt wird. Die Besonderheit hierbei ist, dass sich diese Annahme auf Lokalitaten (in Abschnitt 3.3.2 als eine Zusammenfassung von Konkurrenten und Points-of-Interest de_niert) bezieht, sodass die Betrachtung von abstrakten ‘lokalen Eigenschaften’ zur konkreten ‘Existenz von umgebenden Lokalitaten’ im Sinne der Schnittstelle ubergeht, um einen Bezug auf die zu nutzende Datenquelle herzustellen. Diese zu berucksichtigenden Lokalitaten beziehen sich auf Daten, die aus der Google Places API ermittelt werden konnen und somit auf ihre Existenz gepruft werden konnen. Eine Begrundung fur diese Annahme aus anderer Sichtweise wurde gro_tenteils bereits in Abschnitt 3.4 hergeleitet, zusammenfassend hat es den Hintergrund, dass einige Lokalitaten entweder das Angebot (durch die Konkurrenzsituation des Standorts) oder die Nachfrage (durch ortliche Besonderheiten des Standorts) eines Guts beeinussen. Diese Annahme umfasst damit sowohl andere, nach De_nition aus vorangehendem Abschnitt konkurrierende Verkaufsstatten, als auch Points-of-Interest, die einen Einuss auf die Zahlungsbereitschaft fur bestimmte Produkgruppen haben.

Die in Abbildung 1 dargestellte Liste von Kennzeichen aus der Schnittstellendokumentation umfasst 90 verschiedene Kennzeichen fur Lokalitaten. Zwar repr asentieren alle diese Kennzeichen strenggenommen Lokalitaten, wie sie eingangs de_niert wurden und beeinussen somit allesamt die lokalen Gegebenheiten einer Verkaufsstatte. Allerdings ist nicht anzunehmen, dass jede dieser Lokalitaten auch tatsachlich einen relevanten Einuss auf die Zahlungsbereitschaft der Abnehmer hat. Eine Berucksichtigung aller Kennzeichen wurde demnach die Komplexitat in die Hohe treiben, ohne zwangslau_g einen Mehrwert zu bieten. Daruber hinaus sind Clusteranalysen anfallig fur irrelevante Variablen, sodass die Ergebnisse verfalscht werden. Es wurde namlich untersucht, dass bereits ab einer Anzahl von 20 Variablen die Vergleichbarkeit von ahnlichen Objekten unter der Mehrdimensionalitat leidet (vgl. [Hair et al., 2018], S. 203), daher sollte der Fokus auf eine sorgfaltige Auswahl der Variablen gelegt werden. Deswegen ist es notwendig, die Liste der Kennzeichen auf eine uberschaubare Menge zu limitieren, sodass nur die relevantesten Lokalitaten

betrachtet werden, also diejenigen, die den mutma_lich gr o_ten Einuss auf die Zahlungsbereitschaft der Kunden haben. Um dies je Kennzeichen zu bewerten, werden aus den vorangehend angestellten  Uberlegungen Kriterien abgeleitet, anhand derer die vorhandenen Kennzeichen bewertet werden. Das erste Kriterium bezieht sich auf die  ortliche Wettbewerbssituation und dient dazu, Verkaufsst atten von relevanten Konkurrenten zu identi_zieren. Das zweite Kriterium umfasst weitere  ortliche Besonderheiten, die einen Einuss auf die Zahlungsbereitschaft f ur bestimmte Produktgruppen haben kann. Hierbei werden aufgrund der durch die Schnittstelle bereitgestellten Daten nur Points-of-Interest einbezogen. Dementsprechend wird die Liste der Flags anhand folgender Kriterien ge_ltert:

a) Beschreibt das Kennzeichen eine Verkaufsst atte, wird das Kennzeichen nur ber ucksichtigt, falls in der Verkaufsst atte Waren vertrieben werden, die sich mit dem Sortiment eines Supermarktes  uberschneiden. Verkaufsst atten f ur Dienstleistungen werden nicht betrachtet.

b) Beschreibt das Kennzeichen einen Point-of-Interest, so wird individuell entschieden, ob dieser Point-of-Interest einen signi_kanten Einuss auf die Zahlungsbereitschaft von Kunden bez uglich der typischen Produktgruppen eines Supermarkts auswirken kann. Hier sind erfahren etwa Verkehrsknotenpunkte, als auch Orte zur Gestaltung von Freizeitaktivit aten besondere Betrachtung.

Da diese Kriterien dennoch auf subjektiverWahrnehmung basieren, besteht durchaus die M oglichkeit, dass nach den Kriterien auch Kennzeichen herausge_ltert werden, die einen gr o_eren Einuss auf die Zahlungsbereitschaften haben, als angenommen. Kennzeichen wie etwa car wash (zu Deutsch: Autowaschanlage) oder city hall (zu Deutsch: Rathaus) k onnten beispielsweise rein auf den  Uberlegungen aus vorangehenden Abschnitten aufgrund potentieller Wartezeiten, und der zwischenzeitlichen M oglichkeit einer Erfrischung, gr o_ere Auswirkungen auf die Zahlungsbereitschaft f ur bestimmte Produktgruppen wie Getr anke oder Snacks haben, als erwartet wird. Die Subjektivit at des Autors kann an dieser Stelle nicht vollends eliminiert werden, es wird darauf allerdings hingewiesen und im Schlussteil dieser Arbeit diskutiert. Dar uber hinaus k onnen weitere Gesichtspunkt durch diese Filterkriterien unber ucksichtigt bleiben, da auch eine Verkaufsst atte mit vollkommen disjunktem Sortiment etwa durch Komplement arg uter oder andere, nicht ber ucksichtigte Faktoren einen Einuss auf die Zahlungsbereitschaft der Abnehmer f ur bestimmte Produktgruppen auswirken kann. Auch von solchen E_ekten wird hier abstrahiert, da es im Rahmen dieser Untersuchung prinzipiell darum geht, Geodaten f ur eine solche Klassi_zierung nutzbar zu machen, um Filialen zu bewerten, statt ein aus Sicht der Preispolitik ganzheitliches Modell zur Filialbewertung zu entwickeln. Die Liste der verf ugbaren Kennzeichen wird daher anhand vorangehender Kriterien ge_ltert, wodurch noch folgende 14, f ur die Untersuchung relevanten, Kennzeichen  ubrig bleiben:

airport (Flughafen) Laut Hartmann hat an einem Flughafen der Preis wenig Einuss auf die Kaufentscheidung (vgl. [Hartmann, 2006]. Kunden, die sich an diesem Ort be_nden und etwas ben otigen, haben wenig M oglichkeit, sich einen anderen, g unstigeren Anbieter zu suchen, oder auf das Gut zu verzichten. Die Existenz eines Flughafens in der Umgebung erh oht somit die Zahlungsbereitschaft von Kunden f ur das gesamte Sortiment.

bakery (B ackerei) Eine B ackerei stellt Backwaren her, vertreibt diese (vgl. [Lerchenm uller et al., 2011], S. 15) und stellt somit eine Konkurrenz zur Produktgruppe der Backwaren eines Supermarkts dar.

convenience store (Convenience Store, damals auch Mischwaren- oder Tante-Emma- Laden) In diese Kategorie fallen u.A. auch Kioske. Verkaufsst atten dieser Kategorie haben meist schmales und aches Sortiment und konzentrieren sich auf Waren, die allt aglich gebraucht werden, sowie verzehrfertige Lebensmittel (vgl. [Lerchenm uller et al., 2011], S. 33). F ur diese Produktgruppen steht ein Convenience Store mit einem Supermarkt in Konkurrenz.

department store (Warenhaus) Dieses Kennzeichen umfasst Warenh auser mit breiterem und tiefem Sortiment (vgl. [Lerchenm uller et al., 2011], S. 205), h au_g auch Vollsortimenter genannt. Durch das umfassende Sortiment tritt ein Warenhaus mit dem Gro_teil des Sortiments, wenn nicht sogar mit dem ganzen Sortiment eines Supermarktes in Konkurrenz.

florist (Blumengesch aft) In einem solchen Gesch aft werden Blumen und andere Gew achse verkauft. Da auch Superm arkte teilweise ein kleines Sortiment an Blumen besitzen, treten Blumengesch afte f ur diese Produktgruppe mit einem Supermarkt in Konkurrenz.

gas station (Tankstelle) Tankstellen bieten  ahnlich wie Convenience Stores ein recht  uberschaubares Sortiment an, welches sich auf kurzfristigen Bedarf, wie beispielsweise Snacks und Getr anke bezieht (vgl. [Lerchenm uller et al., 2011], S. 183). F ur diese Produktgruppen stellt eine Tankstelle eine Konkurrenz zu Superm arkten dar.

liquor store (Spirituosenladen) Spirituosenl aden im engeren Sinne sind in Deutschland relativ selten, da Alkohol auch in vielen anderen Verkaufsst atten verkauft werden darf. Sie weisen ein breites und tiefes Sortiment im Bereich von Spirituosen auf, seltener auch Weine oder Craft Biere. Dementsprechend stellt es eine Konkurrenz f ur diese Produktgruppen eines Supermarkts dar.

movie theater (Kino) In Kinos werden Filme gezeigt und komplement are Snacks verkauft. Da diese allerdings oft teuer sind (da vermutlich Kinobetreiber ebenfalls auf hohe Zahlungsbereitschaft der Kunden spekulieren), kann im Rahmen eines umliegenden Supermarkts ebenfalls eine h ohere Zahlungsbereitschaft der Kunden f ur Produktgruppen wie Getr anke und Snacks angenommen werden.

night club (Nachtclub) In den meisten Nachtclubs oder Diskotheken geh ort der Verzehr von alkoholischen Getr anken zur Abendgestaltung. Hier ist sowohl w ahrend der Abendstunden (falls dies in die  O_nungszeiten des Supermarktes passt), als auch vorher ein verst arktes Interesse an (alkoholischen) Getr anken anzunehmen, wodurch die Zahlungsbereitschaft f ur ebenjene steigt.

park (Park) Parks sind gekennzeichnet durch Gr un achen, wodurch sie zur Freizeitgestaltung bei passendem Wetter einladen. Hierdurch d urfte sich eine Erh ohung der Nachfrage nach Erfrischungsgetr anken und Snacks abzeichnen, was sich f ur diese Produktgruppen in der Zahlungsbereitschaft wiederspiegelt.

pet store (Zoohandlung, auch Tierhandlung) Gesch afte, in denen Tiere und Tierbedarf, wie etwa Futter oder Zubeh or, verkauft wird. Da die meisten Superm arkte auch Tierfutter verkaufen, konkurriert diese Produktgruppe eines Supermarktes mit Zoohandlungen.

pharmacy (Apotheke) In einer Apotheke werden rezeptpichtige, wie auch frei verk auiche Arzneimittel vertrieben. In Superm arkten gibt es teilweise auch frei verk auiche Arzneimittel, womit ein Supermarkt f ur diese Produktgruppe in Konkurrenz mit Apotheken steht.

supermarket (Supermarkt) Da im Rahmen dieser Untersuchung Supermarkt_lialen die Untersuchungsgegenst ande darstellen, sind selbstverst andlich andere Superm  arkte direkte und o_ensichtliche Konkurrenten und sollten somit auch in die Variablen mit einie_en. Als Supermarkt wird ein Einzelhandelsbetrieb de_niert, “in dem vorwiegend Nahrungs- und Genussmittel einschlie_lich Frischwaren angeboten werden; zudem sind Waren des t aglichen und des kurzfristigen Bedarfs anderer Branchen im Sortiment enthalten” ([Purper, 2007], S. 29).

train station (Bahnstation) Wie auch der Flughafen, f uhrt eine Bahnstation zu einer gewissen Reduktion der Handlungsm oglichkeiten der Kunden, wodurch Bahnstationen ebenfalls als Faktoren in Frage kommen, die die Zahlungsbereitschaft f ur das gesamte Sortiment beeinussen k onnen.

Jedes der nach der Filterung  ubrig gebliebenen Kennzeichen ist mit einer Erl auterung versehen, die gleichzeitig als eine Art Annahme zu verstehen ist, welche wiederum auf vorangehendem Annahmensystem basiert. Der tats achliche Einuss auf die jeweilige Zahlungsbereitschaft – bzw. die Existenz dessen – wird im Rahmen dieser Untersuchung demnach nicht empirisch belegt, sondern auf Basis der hier angestellten konzeptuellen  Uberlegungen unterstellt. Da zudem nicht gew ahrleistet werden kann, dass die jeweiligen Kennzeichen in der Datenquelle strikt der De_nition der Betriebsformen entspricht, wird explizit darauf hingewiesen, dass Fehler in der zugrundliegenden Datenquelle der Google Places API im Rahmen des M oglichen sind. Demnach sollten die Kennzeichen nicht als strikte Abbildung der formalen Begri_e interpretiert werden, sondern als Richtlinie. Die in vorangehender Liste abgebildeten Kennzeichen werden zun achst als die relevanten, zu betrachtenden Variablen behandelt, sollte sich allerdings w ahrend der Interpretation der resultierenden Cluster herausstellen, dass einzelne Variablen nicht den erwarteten Mehrwert bringen, werden sie eliminiert und die Clusteranalyse mit dem neuen Variablensatz durchgef uhrt. Dies ist laut Hair et al. ein bew ahrtes Verfahren, da es keine klar de_nierte Methode daf ur gibt, die Relevanz von Variablen im Vorfeld zu erkennen (vgl. [Hair et al., 2018], S. 203). Auch Kashwan und Velu beschreiben in in ihrer  ahnlichen Untersuchung zur Kundensegmentierung mit Hilfe des k-Means-Verfahrens die Clusteranalyse als kontinuierlichen und iterativen Prozess der Wissensgewinnung (vgl. [Kashwan und Velu, 2013]).

Ein wichtiges Kriterium f ur Variablen, die in einer deterministische Clusteranalyse ber ucksichtigt werden sollen, ist die Vergleichbarkeit (siehe [Bacher et al., 2010], S. 175). Ist dies nicht gegeben, kann die Analyse zu fehlerhaften Ergebnissen und somit fehlerhaften Interpretationen f uhren. Da bei dieser Untersuchung – im Gegensatz zum klassischen Vorgehen von Clusteranalysen – zum Startzeitpunkt noch keine Datenmatrix vorliegt, kann diese Anforderung bereits zum Zeitpunkt der Datenerhebung ber ucksichtigt werden indem die Daten bei Abruf in die gew unschte Form gebracht werden. Der Aufbau der in Abschnitt 3.3.2 beschriebenen Geodaten-Schnittstelle liefert eine M oglichkeit, zu exakten Koordinaten in einem bis f unf Kilometern frei de_nierbaren Radius eine Suche aller umliegenden Lokalit aten auszul osen, die etwa ein bestimmtes Kennzeichen aufweisen. Beispielsweise w urden eine Suche zum Breitengrad 51.464054 und zum L angengrad 7.0080579 (die ungef ahren Koordinaten der Bibliothek f ur Geisteswissenschaften der Universit at Duisburg-Essen am Standort Essen) mit dem Radius von 5000 m und dem Kennzeichen train station s amtliche Bahnstationen im 5 Kilometer Umkreis zur Bibliothek des Campus Essen zur uckliefern, inklusive der Koordinaten und allerhand Metainformationen; eine beispielhafte Antwort mit solchen Metadaten ist im JSON-Format in Abbildung 3 zu sehen. Der beispielhafte API-Aufruf, um diese Antwort von der Schnittstelle zu erzeugen, ist hingegen in Abbildung 2 ersichtlich und wird in Abschnitt 3.3.2 n aher erl autert. Die R uckmeldung besitzt viel semantischen Wert, allerdings zu viel, um sinnvoll und vergleichbar in einer Clusteranalyse verwendet werden zu k onnen, dementsprechend muss das Ergebnis quanti_ziert werden. Basierend auf der vorangehenden Annahme, w are aufgrund der Pr ufung bez uglich der Existenz eine simple boolesche Logik mit 0 und 1 denkbar, um jedes Kennzeichen zu einem dichotomen Merkmal des Datenobjekts zu machen. Somit w urde eine Variable basierend auf diesem Kennzeichen aussagen, ob besagte Lokalit at sich im Radius der Filiale be_ndet, oder nicht und als Attribut in dem Datensatz festgehalten werden. Die ergebenen Cluster w urden dann auf Basis der selben Kombination von umliegenden Verkaufsst atten und Points-of-Interest in unmittelbarer N ahe gebildet werden, wobei jedoch nur auf die Existenz der Verkaufsst atten und Points-of-Interest eingegangen wird. Damit w urde ein Vergleich von zwei Filialen zum Ergebnis der  Aquivalenz kommen, wenn eine Filiale f unf Superm arkte und sieben B ackereien im Umfeld h atte, w ahrend die andere Filiale nur einen Supermarkt und zwei B ackereien im Umfeld hat. Mehr inhaltlichen Wert, als auch h ohere Vergleichbarkeit – und somit bessere Ergebnisse bei der Clusteranalyse bietet jedoch eine metrische Skala (vgl. [Hair et al., 2018], S. 202 f.). Um dies zu erreichen, bietet es sich an, die Anzahl an Lokalit aten, die auf Basis des untersuchten Kennzeichens r uckgemeldet werden, zu z ahlen. Die Anzahl kann dann in einem Attribut des Datensatzes festgehalten werden, welches f ur das Kennzeichen steht. Somit sind die verschiedenen Werte der Datens atze einerseits vergleichbarer und besitzen dazu einen nat urlichen Nullpunkt.

Die Schnittstelle ist so aufgebaut, dass Lokalit aten auch mehrere Kennzeichen besitzen k onnen und somit bei mehreren unterschiedlichen Abfragen auf Basis unterschiedlicher Kennzeichen auftauchen k onnen. Somit kann dieselbe Lokalit at zwei Variablen in unterschiedlichen Abfragen beeinussen, wie etwa die Existenz der beiden Kennzeichen supermarket und bakery bei einem Supermarkt, der eine integrierte B ackerei besitzt. Falls dieser Supermarkt mit beiden Kennzeichen gepegt ist, erh oht er sowohl den Z ahler der konkurrierenden B ackereien, als auch den Z ahler der konkurrierenden Superm arkte. Die Summe aller Werte der Variablen ergibt dann nicht mehr die kumulierte Menge aller r uckgemeldeten Lokalit aten, dies wird jedoch in Kauf genommen, da nicht angenommen wird, dass dies zu einem Problem f uhrt und eine solche Behandlung von Lokalit aten mit mehreren Kennzeichen vom Autor als sinnvoll eingesch atzt wird. Voranstehende  Uberlegungen zur Einbeziehung der Anzahl der jeweiligen Lokalit aten f uhrt zu der zweiten Annahme, die im Rahmen der Identi_kation von Variablen stets gilt, und somit zur vierten Annahme im Rahmen der gesamten Untersuchung:

Annahme 4: Die Anzahl von umgebenden Lokalit aten desselben Typs beeinusst die Zahlungsbereitschaft der Konsumenten f ur unterschiedliche Produktgruppen in anderem Ausma_. Dies gilt auch f ur Kombinationen von Lokalit aten in unterschiedlichen Auspr agungen der Anzahl.

Diese Annahme formuliert die Anzahl der einzelnen Lokalit aten als weiteren ma_geblichen Einussfaktor f ur  Ahnlichkeit, zus atzlich zur reinen Existenz. Damit werden die erl auterten Unterschiede zwischen Gegenden mit wenig Lokalit aten und Gegenden mit vielen Lokalit aten ebenfalls abgebildet.

Im Rahmen der getro_enen Annahmen wird noch eine De_nition des Begri_s ‘Umgebung’ ben otigt, da f ur die Nutzung der Google Places API der Radius um ein Koordinatenpaar angegeben werden muss, innerhalb dessen nach Lokalit aten eines bestimmten Typens gesucht werden soll. Das Bundeskartellamt hat in einem Beschluss bez uglich einer Fusion von deutschen Lebensmitteleinzelh andlern zusammengefasst, “dass die Umsatz-reduzierenden Ein usse durch die Anzahl benachbarter Filialen, die nicht zum selben Unternehmen geh oren, bereits im Umkreis von 1 bis 2 km geringer sind als jene im Umkreis von 0 bis 1 km” ([Bundeskartellamt, 2015], S. 71), dementsprechend bietet es sich f ur diese Art der Untersuchung an, eine Umgebung zwischen 0 m und 1000 m zu betrachten. F ur alle Annahmen im Rahmen der Untersuchung gilt somit, dass die Umgebung als ein Umkreis von 500 m de_niert ist. Selbstverst andlich kann der Radius Spielraum bieten, um in weiteren Iterationen oder folgenden Untersuchungen angepasst zu werden, um gegebenenfalls die Analyse zu verbessern, allerdings wird hier zun achst das Mittel des vom Bundeskartellamt angef uhrten Spektrums gew ahlt, um einen konstanten Wert f ur die Ermittlung der Daten  uber die Schnittstelle zu erhalten.

In voranstehendem Kapitel wurde ein Gedankengang pr asentiert, der argumentativ herleitet, wieso es f ur Unternehmen gewinnbringend sein kann, f ur unterschiedliche Filialen bei der Auswahl der _lialspezi_schen Preise die Umgebung der Filiale zu betrachten. Hieraus resultierte ein Annahmensystem, welches die unterschiedlichen Zahlungsbereitschaften von Abnehmern f ur bestimmte Produktgruppen bei der Frage ber ucksichtigt, wie unterschiedliche Filialen bewertet und kategorisiert werden k onnen, um auf Basis dessen eine standortspezi_sche Preisdi_erenzierung durchzuf uhren. In dem Rahmen wurden lokale Eigenschaften, die entweder das Konkurrenzumfeld auf Basis von Produktgruppen umfassen oder nachfragebezogene Faktoren f ur Produktgruppen darstellen, als wichtige Einussfaktoren auf die jeweiligen Zahlungsbereitschaften identi_ziert. Au_erdem wurde die Nutzung von Geodaten in angesprochenes Annahmensystem eingeordnet, sodass hieraus ein Ansatz hervorgeht, wie diese Einussfaktoren auf die Zahlungsbereitschaften in Geodaten wiedergefunden werden k onnen. Diese Identi_kation der Einussfaktoren wurde dann konkret im Hinblick auf die Google Places API durchgef uhrt, um eine f ur die im nachfolgenden Abschnitt durchzuf uhrende Clusteranalyse notwendige Menge an relevanten Variablen festzulegen, die diese Einussfaktoren widerspiegeln, und diese Auswahl f ur das folgende Kapitel konzeptionell zu untermauern.