<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>http://glottopedia.org/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Oos</id>
	<title>Glottopedia - User contributions [en]</title>
	<link rel="self" type="application/atom+xml" href="http://glottopedia.org/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Oos"/>
	<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php/Special:Contributions/Oos"/>
	<updated>2026-04-07T11:39:22Z</updated>
	<subtitle>User contributions</subtitle>
	<generator>MediaWiki 1.34.2</generator>
	<entry>
		<id>http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12050</id>
		<title>Zipfsches Gesetz</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12050"/>
		<updated>2012-07-18T07:40:35Z</updated>

		<summary type="html">&lt;p&gt;Oos: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Das Zipfsche Gesetz ist ein statistisches Modell, bei dem bestimmte Größen, die nach ihrem Rang angeordneten wurden, einer bestimmten Häufigkeitsverteilung, der Zipf-Verteilung, folgen, die einer Hyperbel &amp;lt;math&amp;gt;\tfrac{1}{n}&amp;lt;/math&amp;gt; ähnelt. Benannt ist es nach dem Linguisten [[George Kingsley Zipf]] (1902-1950), der mit der Entwicklung des Modells (1935-1949) den Beginn der [[Quantitativen Linguistik]] markierte. Dort dient es beispielsweise zur Beschreibung der Verteilung von Worthäufigkeiten in Texten.&lt;br /&gt;
&lt;br /&gt;
== Zipfverteilung ==&lt;br /&gt;
&lt;br /&gt;
Gegeben sei eine Gesamtheit von &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt; Elementen einer nichtleeren Menge. Sortiert man diese Elemente in eine Rangfolge nach ihrer Häufigkeit, so verhält sich die Wahrscheinlichkeit &amp;lt;math&amp;gt;p&amp;lt;/math&amp;gt; des Auftretens eines Elementes zu deren Position &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt;:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim n^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Zipfverteilung beschreibt also eine Hyperbelartige Kurve, die weiterhin durch ein Zahl der harmonischen Reihe normiert wird. Es ergibt sich&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_N} \cdot \frac{1}{n^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
wobei für den Normierungsfaktor &amp;lt;math&amp;gt;H_N&amp;lt;/math&amp;gt; gilt:&lt;br /&gt;
:&amp;lt;math&amp;gt;H_N = \sum_{i=1}^N \frac{1}{i} \approx ln(N) + 0,577 \approx ln(1,78 \cdot N)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Zusammengefasst folgt damit:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \approx \frac{1}{n^b \cdot ln(1,78 \cdot N)}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Der Parameter &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; wird als Fitparameter bezeichnet. Er variiert mit dem zugrundeliegenden Datensatz und passt die Kurve bestmöglich an die tatsächliche Verteilung an. Ursprünglich verfasste Zipf das Gesetz parameterlos, also mit &amp;lt;math&amp;gt;\textstyle b = 1&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Anwendung ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf.png|thumb|Zipf-Verteilung der Worthäufigkeiten im Roman ''Effi Briest'']]&lt;br /&gt;
&lt;br /&gt;
Seine häufigste Anwendung findet das Zipfsche Gesetz in der [[Korpuslinguistik]] und der Quantitativen Linguistik. Hier werden Wörter eines Korpus (oder Textes) nach der Häufigkeit ihres Vorkommens in diesem angeordnet. Die entstehende Zipfverteilung beschreibt dabei, dass das zweite Wort in der Rangfolge in etwa nur halb so oft in dem Korpus vorkommt wie das Wort an erster Stelle, die Häufigkeit des dritten Wortes beträgt nur ungefähr ein Drittel der des ersten Wortes, usw. Dies gilt jedoch nicht für alle Sprachen.&lt;br /&gt;
&lt;br /&gt;
Das Zipfsche Gesetz findet auch Beachtung in anderen wissenschaftlichen Disziplinen, so beispielsweise in der Demografie. Hier folgen Verteilungen der Einwohner pro Stadt einer Zipf-Verteilung. Auf dieses Phänomen wurde sogar schon 1913 der deutsche Physiker Felix Auerbach aufmerksam.&lt;br /&gt;
&lt;br /&gt;
== Anpassung durch Benoît Mandelbrot ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log.png|thumb|left|Logarithmischer Plot der Zipf-Verteilung]]&lt;br /&gt;
&lt;br /&gt;
Die von Zipf aufgestellte Formel passt in der Praxis leider noch nicht so genau, wie es wünschenswert wäre. Die ersten Ranghäufigkeiten sind selten so streng wie beschrieben vielfache voneinander, sondern liegen noch nah beieinander. Auch für die größten Ränge verhält sich Zipfs Formel nicht mehr ganz exakt. Dies ist vor allem erkennbar, wenn Häufigkeit und Rang logarithmisch gegeneinander aufgetragen werden. Zipfs Kurve wird dabei linear und kann nicht mehr gut an den gesamten Wertebereich angepasst werden, da dieser eine annähernd konvexe Kurve beschreibt.&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log-anpassung.png|thumb|Eine gute Anpassung an die Zipf-Verteilung ist nur abschnittweise möglich.]]&lt;br /&gt;
[[Image:Effi-plot-zipf-mandelbrot-log.png|thumb|Zipf-Mandelbrot-Anpassung.]]&lt;br /&gt;
&lt;br /&gt;
Durch Stellen an den Parametern (inkl. dem Normierungsfaktor) kann höchstens eine abschnittweise Anpassung erreicht werden, jedoch keine hinreichend befriedigende Anpassung an die gesamte Verteilung.&lt;br /&gt;
&lt;br /&gt;
Dieser Umstand liegt zuletzt darin begründet, dass Zipf in erster Linie Linguist war und ihm ein tiefergehendes mathematisches Verständnis zur Verbesserung der Formel fehlte.&lt;br /&gt;
&lt;br /&gt;
Der Mathematiker [[Benoît Mandelbrot]] erweiterte die von Zipf entwickelte „einfache“ Verteilungs-Funktion um zwei weitere Parameter und schuf damit eine bessere Anpassung im Bereich der niedrigen und höheren Ränge, indem er die entgegengesetzte Proportionalität um einen weiteren Parameter &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;ergänzte:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim (n+m)^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
oder als Gleichung mit der Konstanten &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{a}{(n+m)^{b}}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Für &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt; bedient sich Mandelbrot ebenfalls der &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt;-ten (verallgemeinerten) harmonischen Zahl &amp;lt;math&amp;gt;\textstyle H_{N,m,b}&amp;lt;/math&amp;gt; als Normierungsfaktor:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_{N,m,b}} \cdot \frac{1}{(n+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
mit&lt;br /&gt;
:&amp;lt;math&amp;gt;H_{N,m,b} = \sum_{i=1}^N \frac{1}{(i+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
&lt;br /&gt;
* Adamic, Lada: ''Zipf, Power-laws, and Pareto - a ranking tutorial''.  http://www.hpl.hp.com/research/idl/papers/ranking/ranking.html&lt;br /&gt;
* Auerbach, Felix (1913): ''Das Gesetz der Bevölkerungskonzentration.'' Petermann’s Geographische Mitteilungen 59, 74–76&lt;br /&gt;
* Mandelbrot, Benoît (1965): &amp;quot;Information Theory and Psycholinguistics&amp;quot;. In B.B. Wolman and E. Nagel. Scientific psychology. Basic Books&lt;br /&gt;
* Rapaport, Anatol: ”Zipf‟s Law Re-visited.” Studies on Zipf‟s Law. Bochum:Brockmeyer.&lt;br /&gt;
* Silagadze, Z. K. (1999): &amp;quot;Citations and the Zipf-Mandelbrot's law.&amp;quot;  http://uk.arxiv.org/abs/physics/9901035&lt;br /&gt;
* Zanette, Damián H. (2006): &amp;quot;Zipf's law and the creation of musical context.&amp;quot; Musicae Scientiae 10: 3-18.&lt;br /&gt;
* Zipf, George Kingsley (1932): &amp;quot;Selected Studies of the Principle of Relative Frequency in Language.&amp;quot; Cambridge, MA: Harvard University Press.&lt;br /&gt;
* Zipf, George Kingsley (1935/68): ''The Psycho-Biology of Language. An Introduction to Dynamic Philology.'' The M.I.T. Press, Cambridge, Mass.&lt;br /&gt;
* Zipf, George Kingsley (1949): ''Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology.'' Addison-Wesley Press, Cambridge, Mass.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12049</id>
		<title>Zipfsches Gesetz</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12049"/>
		<updated>2012-07-05T12:36:43Z</updated>

		<summary type="html">&lt;p&gt;Oos: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Das Zipfsche Gesetz ist ein statistisches Modell, bei dem bestimmte Größen, die nach ihrem Rang angeordneten wurden, einer bestimmten Häufigkeitsverteilung, der Zipf-Verteilung, folgen, die einer Hyperbel &amp;lt;math&amp;gt;\tfrac{1}{n}&amp;lt;/math&amp;gt; ähnelt. Benannt ist es nach dem Linguisten [[George Kingsley Zipf]] (1902-1950), der mit der Entwicklung des Modells (1935-1949) den Beginn der [[Quantitativen Linguistik]] markierte. Dort dient es beispielsweise zur Beschreibung der Verteilung von Worthäufigkeiten in Texten.&lt;br /&gt;
&lt;br /&gt;
== Zipfverteilung ==&lt;br /&gt;
&lt;br /&gt;
Gegeben sei eine Gesamtheit von &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt; Elementen einer nichtleeren Menge. Sortiert man diese Elemente in eine Rangfolge nach ihrer Häufigkeit, so verhält sich die Wahrscheinlichkeit &amp;lt;math&amp;gt;p&amp;lt;/math&amp;gt; des Auftretens eines Elementes zu deren Position &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt;:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim n^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Zipfverteilung beschreibt also eine Hyperbelartige Kurve, die weiterhin durch ein Zahl der harmonischen Reihe normiert wird. Es ergibt sich&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_N} \cdot \frac{1}{n^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
wobei für den Normierungsfaktor &amp;lt;math&amp;gt;H_N&amp;lt;/math&amp;gt; gilt:&lt;br /&gt;
:&amp;lt;math&amp;gt;H_N = \sum_{i=1}^N \frac{1}{i} \approx ln(N) + 0,577 \approx ln(1,78 \cdot N)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Zusammengefasst folgt damit:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \approx \frac{1}{n^b \cdot ln(1,78 \cdot N)}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Der Parameter &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; wird als Fitparameter bezeichnet. Er variiert mit dem zugrundeliegenden Datensatz und passt die Kurve bestmöglich an die tatsächliche Verteilung an. Ursprünglich verfasste Zipf das Gesetz parameterlos, also mit &amp;lt;math&amp;gt;\textstyle b = 1&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Anwendung ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf.png|thumb|Zipf-Verteilung der Worthäufigkeiten im Roman ''Effi Briest'']]&lt;br /&gt;
&lt;br /&gt;
Seine häufigste Anwendung findet das Zipfsche Gesetz in der [[Korpuslinguistik]] und der Quantitativen Linguistik. Hier werden Wörter eines Korpus (oder Textes) nach der Häufigkeit ihres Vorkommens in diesem angeordnet. Die entstehende Zipfverteilung beschreibt dabei, dass das zweite Wort in der Rangfolge in etwa nur halb so oft in dem Korpus vorkommt wie das Wort an erster Stelle, die Häufigkeit des dritten Wortes beträgt nur ungefähr ein Drittel der des ersten Wortes, usw. Dies gilt jedoch nicht für alle Sprachen.&lt;br /&gt;
&lt;br /&gt;
Das Zipfsche Gesetz findet auch Beachtung in anderen wissenschaftlichen Disziplinen, so beispielsweise in der Demografie. Hier folgen Verteilungen der Einwohner pro Stadt einer Zipf-Verteilung. Auf dieses Phänomen wurde sogar schon 1913 der deutsche Physiker Felix Auerbach aufmerksam.&lt;br /&gt;
&lt;br /&gt;
== Anpassung durch Benoît Mandelbrot ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log.png|thumb|left|Logarithmischer Plot der Zipf-Verteilung]]&lt;br /&gt;
&lt;br /&gt;
Die von Zipf aufgestellte Formel passt in der Praxis leider noch nicht so genau, wie es wünschenswert wäre. Die ersten Ranghäufigkeiten sind selten so streng wie beschrieben vielfache voneinander, sondern liegen noch nah beieinander. Auch für die größten Ränge verhält sich Zipfs Formel nicht mehr ganz exakt. Dies ist vor allem erkennbar, wenn Häufigkeit und Rang logarithmisch gegeneinander aufgetragen werden. Zipfs Kurve wird dabei linear und kann nicht mehr gut an den gesamten Wertebereich angepasst werden, da dieser eine annähernd konvexe Kurve beschreibt.&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log-anpassung.png|thumb|Eine gute Anpassung an die Zipf-Verteilung ist nur abschnittweise möglich.]]&lt;br /&gt;
[[Image:Effi-plot-zipf-mandelbrot-log.png|thumb|Zipf-Mandelbrot-Anpassung.]]&lt;br /&gt;
&lt;br /&gt;
Durch Stellen an den Parametern (inkl. dem Normierungsfaktor) kann höchstens eine abschnittweise Anpassung erreicht werden, jedoch keine hinreichend befriedigende Anpassung an die gesamte Verteilung.&lt;br /&gt;
&lt;br /&gt;
Dieser Umstand liegt zuletzt darin begründet, dass Zipf in erster Linie Linguist war und ihm ein tiefergehendes mathematisches Verständnis zur Verbesserung der Formel fehlte.&lt;br /&gt;
&lt;br /&gt;
Der Mathematiker [[Benoît Mandelbrot]] erweiterte die von Zipf entwickelte „einfache“ Verteilungs-Funktion um zwei weitere Parameter und schuf damit eine bessere Anpassung im Bereich der niedrigen und höheren Ränge, indem er die entgegengesetzte Proportionalität um einen weiteren Parameter &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;ergänzte:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim (n+m)^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
oder als Gleichung mit der Konstanten &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{a}{(n+m)^{b}}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Für &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt; bedient sich Mandelbrot ebenfalls der &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt;-ten (verallgemeinerten) harmonischen Zahl &amp;lt;math&amp;gt;\textstyle H_{N,m,b}&amp;lt;/math&amp;gt; als Normierungsfaktor:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_{N,m,b}} \cdot \frac{1}{(n+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
mit&lt;br /&gt;
:&amp;lt;math&amp;gt;H_{N,m,b} = \sum_{i=1}^N \frac{1}{(i+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
&lt;br /&gt;
* Auerbach, Felix (1913): ''Das Gesetz der Bevölkerungskonzentration.'' Petermann’s Geographische Mitteilungen 59, 74–76&lt;br /&gt;
* Zipf, George Kingsley (1949): ''Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology.'' Addison-Wesley Press, Cambridge, Mass.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12048</id>
		<title>Zipfsches Gesetz</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12048"/>
		<updated>2012-07-05T12:36:20Z</updated>

		<summary type="html">&lt;p&gt;Oos: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Das Zipfsche Gesetz ist ein statistisches Modell, bei dem bestimmte Größen, die nach ihrem Rang angeordneten wurden, einer bestimmten Häufigkeitsverteilung, der Zipf-Verteilung, folgen, die einer Hyperbel &amp;lt;math&amp;gt;\tfrac{1}{n}&amp;lt;/math&amp;gt; ähnelt. Benannt ist es nach dem Linguisten [[George Kingsley Zipf]] (1902-1950), der mit der Entwicklung des Modells (1935-1949) den Beginn der [[Quantitativen Linguistik]] markierte. Dort dient es beispielsweise zur Beschreibung der Verteilung von Worthäufigkeiten in Texten.&lt;br /&gt;
&lt;br /&gt;
== Zipfverteilung ==&lt;br /&gt;
&lt;br /&gt;
Gegeben sei eine Gesamtheit von &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt; Elementen einer nichtleeren Menge. Sortiert man diese Elemente in eine Rangfolge nach ihrer Häufigkeit, so verhält sich die Wahrscheinlichkeit &amp;lt;math&amp;gt;p&amp;lt;/math&amp;gt; des Auftretens eines Elementes zu deren Position &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt;:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim n^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Zipfverteilung beschreibt also eine Hyperbelartige Kurve, die weiterhin durch ein Zahl der harmonischen Reihe normiert wird. Es ergibt sich&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_N} \cdot \frac{1}{n^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
wobei für den Normierungsfaktor &amp;lt;math&amp;gt;H_N&amp;lt;/math&amp;gt; gilt:&lt;br /&gt;
:&amp;lt;math&amp;gt;H_N = \sum_{i=1}^N \frac{1}{i} \approx ln(N) + 0,577 \approx ln(1,78 \cdot N)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Zusammengefasst folgt damit:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \approx \frac{1}{n^b \cdot ln(1,78 \cdot N)}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Der Parameter &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; wird als Fitparameter bezeichnet. Er variiert mit dem zugrundeliegenden Datensatz und passt die Kurve bestmöglich an die tatsächliche Verteilung an. Ursprünglich verfasste Zipf das Gesetz parameterlos, also mit &amp;lt;math&amp;gt;\textstyle b = 1&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Anwendung ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf.png|thumb|Zipf-Verteilung der Worthäufigkeiten im Roman ''Effi Briest'']]&lt;br /&gt;
&lt;br /&gt;
Seine häufigste Anwendung findet das Zipfsche Gesetz in der [[Korpuslinguistik]] und der Quantitativen Linguistik. Hier werden Wörter eines Korpus (oder Textes) nach der Häufigkeit ihres Vorkommens in diesem angeordnet. Die entstehende Zipfverteilung beschreibt dabei, dass das zweite Wort in der Rangfolge in etwa nur halb so oft in dem Korpus vorkommt wie das Wort an erster Stelle, die Häufigkeit des dritten Wortes beträgt nur ungefähr ein Drittel der des ersten Wortes, usw. Dies gilt jedoch nicht für alle Sprachen.&lt;br /&gt;
&lt;br /&gt;
Das Zipfsche Gesetz findet auch Beachtung in anderen wissenschaftlichen Disziplinen, so beispielsweise in der Demografie. Hier folgen Verteilungen der Einwohner pro Stadt einer Zipf-Verteilung. Auf dieses Phänomen wurde sogar schon 1913 der deutsche Physiker Felix Auerbach aufmerksam.&lt;br /&gt;
&lt;br /&gt;
== Anpassung durch Benoît Mandelbrot ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log.png|thumb|left|Logarithmischer Plot der Zipf-Verteilung]]&lt;br /&gt;
&lt;br /&gt;
Die von Zipf aufgestellte Formel passt in der Praxis leider noch nicht so genau, wie es wünschenswert wäre. Die ersten Ranghäufigkeiten sind selten so streng wie beschrieben vielfache voneinander, sondern liegen noch nah beieinander. Auch für die größten Ränge verhält sich Zipfs Formel nicht mehr ganz exakt. Dies ist vor allem erkennbar, wenn Häufigkeit und Rang logarithmisch gegeneinander aufgetragen werden. Zipfs Kurve wird dabei linear und kann nicht mehr gut an den gesamten Wertebereich angepasst werden, da dieser eine annähernd konvexe Kurve beschreibt.&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log-anpassung.png|thumb|Eine gute Anpassung an die Zipf-Verteilung ist nur abschnittweise möglich.]]&lt;br /&gt;
[[Image:Effi-plot-zipf-mandelbrot-log.png|thumb|Zipf-Mandelbrot-Anpassung.]]&lt;br /&gt;
&lt;br /&gt;
Durch Stellen an den Parametern (inkl. dem Normierungsfaktor) kann höchstens eine abschnittweise Anpassung erreicht werden, jedoch keine hinreichend befriedigende Anpassung an die gesamte Verteilung.&lt;br /&gt;
&lt;br /&gt;
Dieser Umstand liegt zuletzt darin begründet, dass Zipf in erster Linie Linguist war und ihm ein tiefergehendes mathematisches Verständnis zur Verbesserung der Formel fehlte.&lt;br /&gt;
&lt;br /&gt;
Der Mathematiker [[Benoît Mandelbrot]] erweiterte die von Zipf entwickelte „einfache“ Verteilungs-Funktion um zwei weitere Parameter und schuf damit eine bessere Anpassung im Bereich der niedrigen und höheren Ränge, indem er die entgegengesetzte Proportionalität um einen weiteren Parameter &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;ergänzte:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim (n+m)^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
oder als Gleichung mit der Konstanten &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{a}{(n+m)^{b}}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Für &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt; bedient sich Mandelbrot ebenfalls der &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt;-ten (verallgemeinerten) harmonischen Zahl &amp;lt;math&amp;gt;\textstyle H_{N,m,b}&amp;lt;/math&amp;gt; als Normierungsfaktor:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_{N,m,b}} \cdot \frac{1}{(n+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
mit&lt;br /&gt;
:&amp;lt;math&amp;gt;H_{N,m,b} = \sum_{i=1}^N \frac{1}{(i+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
&lt;br /&gt;
'''Zeitschriftenartikel''':&lt;br /&gt;
&lt;br /&gt;
* Auerbach, Felix (1913): ''Das Gesetz der Bevölkerungskonzentration.'' Petermann’s Geographische Mitteilungen 59, 74–76&lt;br /&gt;
&lt;br /&gt;
'''Bücher''':&lt;br /&gt;
&lt;br /&gt;
* Zipf, George Kingsley (1949): ''Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology.'' Addison-Wesley Press, Cambridge, Mass.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12047</id>
		<title>Zipfsches Gesetz</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=Zipfsches_Gesetz&amp;diff=12047"/>
		<updated>2012-07-03T14:20:07Z</updated>

		<summary type="html">&lt;p&gt;Oos: Created page with &amp;quot; Das Zipfsche Gesetz ist ein statistisches Modell, bei dem bestimmte Größen, die nach ihrem Rang angeordneten wurden, einer bestimmten Häufigkeitsverteilung, der Zipf-Verte...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Das Zipfsche Gesetz ist ein statistisches Modell, bei dem bestimmte Größen, die nach ihrem Rang angeordneten wurden, einer bestimmten Häufigkeitsverteilung, der Zipf-Verteilung, folgen, die einer Hyperbel &amp;lt;math&amp;gt;\tfrac{1}{n}&amp;lt;/math&amp;gt; ähnelt. Benannt ist es nach dem Linguisten [[George Kingsley Zipf]] (1902-1950), der mit der Entwicklung des Modells (1935-1949) den Beginn der [[Quantitativen Linguistik]] markierte. Dort dient es beispielsweise zur Beschreibung der Verteilung von Worthäufigkeiten über deren Rangfolge in Texten.&lt;br /&gt;
&lt;br /&gt;
== Zipfverteilung ==&lt;br /&gt;
&lt;br /&gt;
Gegeben sei eine Gesamtheit von &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt; Elementen einer nichtleeren Menge. Sortiert man diese Elemente in eine Rangfolge nach ihrer Häufigkeit, so gilt für die Wahrscheinlichkeit &amp;lt;math&amp;gt;p&amp;lt;/math&amp;gt; des Auftretens eines Elementes an der Position &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt;:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim n^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Zipfverteilung entspricht allerdings nicht genau einer Hyperbel (&amp;lt;math&amp;gt;\tfrac{1}{n}&amp;lt;/math&amp;gt;), sondern wird durch die harmonische Reihe normiert. Es ergibt sich&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_N} \cdot \frac{1}{n^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
wobei für den Normierungsfaktor &amp;lt;math&amp;gt;H_N&amp;lt;/math&amp;gt; gilt:&lt;br /&gt;
:￼&amp;lt;math&amp;gt;H_N = \sum_{i=1}^N \frac{1}{i} \approx ln(N) + 0,577 \approx ln(1,78 \cdot N)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Zusammengefasst folgt damit:&lt;br /&gt;
:￼&amp;lt;math&amp;gt;p(n) = \frac{1}{H_N} \cdot \frac{1}{n^b} \approx \frac{1}{n^b \cdot ln(1,78 \cdot N)}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Der Parameter &amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; wird als Fitparameter bezeichnet. Er variiert mit dem zugrundeliegenden Datensatz und passt die Kurve bestmöglich an die tatsächliche Verteilung an. Ursprünglich verfasste Zipf das Gesetz parameterlos, also mit &amp;lt;math&amp;gt;\textstyle b = 1&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Anwendung ==&lt;br /&gt;
&lt;br /&gt;
&amp;lt;p&amp;gt;&lt;br /&gt;
[[Image:Effi-plot-zipf.png|thumb|Zipf-Verteilung der Worthäufigkeiten im Roman ''Effi Briest'']]&lt;br /&gt;
&lt;br /&gt;
Seine häufigste Anwendung findet das Zipfsche Gesetz in der [[Korpuslinguistik]] und der Quantitativen Linguistik. Hier werden Wörter eines Korpus (oder Textes) nach der Häufigkeit ihres Vorkommens in diesem angeordnet. Die entstehende Zipfverteilung beschreibt dabei, dass das zweite Wort in der Rangfolge in etwa nur halb so oft in dem Korpus vorkommt wie das Wort an erster Stelle, die Häufigkeit des dritten Wortes beträgt nur ungefähr ein Drittel der des ersten Wortes, usw. Dies gilt jedoch nicht für alle Sprachen.&lt;br /&gt;
&amp;lt;/p&amp;gt;&lt;br /&gt;
￼&amp;lt;p&amp;gt;&lt;br /&gt;
Das Zipfsche Gesetz findet auch Beachtung in anderen wissenschaftlichen Disziplinen, so beispielsweise in der Demografie. Hier folgen Verteilungen der Einwohner pro Stadt einer Zipf-Verteilung. Dieses Phänomen an sich wurde sogar schon 1913 von dem deutschen Physiker Felix Auerbach entdeckt.&lt;br /&gt;
&amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Anpassung durch Benoît Mandelbrot ==&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log.png|thumb|left|Logarithmischer Plot der Zipf-Verteilung]]&lt;br /&gt;
&lt;br /&gt;
Die von Zipf aufgestellte Formel passt in der Praxis leider noch nicht so genau, wie es wünschenswert wäre. Die ersten Ranghäufigkeiten sind selten so streng wie beschrieben vielfache voneinander, sondern liegen noch nah beieinander. Auch für die größten Ränge verhält sich Zipfs Formel nicht mehr ganz exakt. Dies ist vor allem erkennbar, wenn Häufigkeit und Rang logarithmisch gegeneinander aufgetragen werden. Zipfs Kurve wird dabei linear und kann nicht mehr gut an den gesamten Wertebereich angepasst werden, da dieser eine annähernd konvexe Kurve beschreibt.&lt;br /&gt;
&lt;br /&gt;
[[Image:Effi-plot-zipf-log-anpassung.png|thumb|Eine gute Anpassung an die Zipf-Verteilung ist nur abschnittweise möglich.]]&lt;br /&gt;
[[Image:Effi-plot-zipf-mandelbrot-log.png|thumb|Zipf-Mandelbrot-Anpassung.]]&lt;br /&gt;
&lt;br /&gt;
Durch Stellen an den Parametern (inkl. dem Normierungsfaktor) kann höchstens eine abschnittweise Anpassung erreicht werden, jedoch keine hinreichend befriedigende Anpassung an die gesamte Verteilung.&lt;br /&gt;
&lt;br /&gt;
Dieser Umstand liegt zuletzt darin begründet, dass Zipf in erster Linie Linguist war und ihm ein tiefergehendes mathematisches Verständnis zur Verbesserung der Formel fehlte.&lt;br /&gt;
&lt;br /&gt;
Der Mathematiker [[Benoît Mandelbrot]] erweiterte die von Zipf entwickelte „einfache“ Verteilungs-Funktion um zwei weitere Parameter und schuf damit eine bessere Anpassung im Bereich der niedrigen und höheren Ränge, indem er die entgegengesetzte Proportionalität um einen weiteren Parameter &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;ergänzte:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) \sim (n+m)^{-b}&amp;lt;/math&amp;gt;&lt;br /&gt;
oder als Gleichung mit der Konstanten &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt;&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{a}{(n+m)^{b}}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Für &amp;lt;math&amp;gt;a&amp;lt;/math&amp;gt; bedient sich Mandelbrot ebenfalls der &amp;lt;math&amp;gt;N&amp;lt;/math&amp;gt;-ten (verallgemeinerten) harmonischen Zahl &amp;lt;math&amp;gt;\textstyle H_{N,m,b}&amp;lt;/math&amp;gt; als Normierungsfaktor:&lt;br /&gt;
:&amp;lt;math&amp;gt;p(n) = \frac{1}{H_{N,m,b}} \cdot \frac{1}{(n+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
mit&lt;br /&gt;
:&amp;lt;math&amp;gt;H_{N,m,b} = \sum_{i=1}^N \frac{1}{(i+m)^b}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
&lt;br /&gt;
'''Zeitschriftenartikel''':&lt;br /&gt;
&lt;br /&gt;
* Auerbach, Felix (1913): ''Das Gesetz der Bevölkerungskonzentration.'' Petermann’s Geographische Mitteilungen 59, 74–76&lt;br /&gt;
&lt;br /&gt;
'''Bücher''':&lt;br /&gt;
&lt;br /&gt;
* Zipf, George Kingsley (1949): ''Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology.'' Addison-Wesley Press, Cambridge, Mass.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=File:Effi-plot-zipf.png&amp;diff=12045</id>
		<title>File:Effi-plot-zipf.png</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=File:Effi-plot-zipf.png&amp;diff=12045"/>
		<updated>2012-07-03T09:25:37Z</updated>

		<summary type="html">&lt;p&gt;Oos: uploaded a new version of &amp;amp;quot;File:Effi-plot-zipf.png&amp;amp;quot;: Zipf-Verteilung der Worthäufigkeiten im Roman Effi Briest.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Zipf-Verteilung der Worthäufigkeiten im Roman &amp;lt;i&amp;gt;Effi Briest&amp;lt;/i&amp;gt;.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=File:Effi-plot-zipf-mandelbrot-log.png&amp;diff=12044</id>
		<title>File:Effi-plot-zipf-mandelbrot-log.png</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=File:Effi-plot-zipf-mandelbrot-log.png&amp;diff=12044"/>
		<updated>2012-07-02T19:02:58Z</updated>

		<summary type="html">&lt;p&gt;Oos: Logarithmischer Plot der relativen Worthäufigkeiten im Roman Effi Briest mit Zipp-Mandelbrot-Anpassung.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Logarithmischer Plot der relativen Worthäufigkeiten im Roman Effi Briest mit Zipp-Mandelbrot-Anpassung.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=File:Effi-plot-zipf-log-anpassung.png&amp;diff=12043</id>
		<title>File:Effi-plot-zipf-log-anpassung.png</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=File:Effi-plot-zipf-log-anpassung.png&amp;diff=12043"/>
		<updated>2012-07-02T18:52:36Z</updated>

		<summary type="html">&lt;p&gt;Oos: Abschnittweise Anpassung an den logarithmischen Plot der Zipf-Verteilung der Worthäufigkeiten im Roman Effi Briest.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Abschnittweise Anpassung an den logarithmischen Plot der Zipf-Verteilung der Worthäufigkeiten im Roman Effi Briest.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=File:Effi-plot-zipf-log.png&amp;diff=12042</id>
		<title>File:Effi-plot-zipf-log.png</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=File:Effi-plot-zipf-log.png&amp;diff=12042"/>
		<updated>2012-07-02T18:45:39Z</updated>

		<summary type="html">&lt;p&gt;Oos: Logarithmisch geplottete Zipf-Verteilung der relativen Worthäufigkeiten im Roman Effi Briest.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Logarithmisch geplottete Zipf-Verteilung der relativen Worthäufigkeiten im Roman Effi Briest.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
	<entry>
		<id>http://glottopedia.org/index.php?title=File:Effi-plot-zipf.png&amp;diff=12041</id>
		<title>File:Effi-plot-zipf.png</title>
		<link rel="alternate" type="text/html" href="http://glottopedia.org/index.php?title=File:Effi-plot-zipf.png&amp;diff=12041"/>
		<updated>2012-07-02T13:15:39Z</updated>

		<summary type="html">&lt;p&gt;Oos: Zipf-Verteilung der Worthäufigkeiten im Roman &amp;lt;i&amp;gt;Effi Briest&amp;lt;/i&amp;gt;.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Zipf-Verteilung der Worthäufigkeiten im Roman &amp;lt;i&amp;gt;Effi Briest&amp;lt;/i&amp;gt;.&lt;/div&gt;</summary>
		<author><name>Oos</name></author>
		
	</entry>
</feed>