Stutzung

Der Begriff der Stutzung (englisch truncation) wird in der Stochastik für zwei verschiedene Konzepte verwendet. Beim ersten Konzept ist eine gestutzte Verteilung die Wahrscheinlichkeitsverteilung einer Zufallsvariablen $X$ unter der Bedingung auf ein Ereignis $\{X\in A\}$ , wobei $A$ in der Regel ein Teilintervall der reellen Zahlen ist. Beim zweiten Konzept wird aus einer gegebenen Zufallsvariablen eine neue gestutzte Zufallsvariable so gebildet, dass die Wahrscheinlichkeit außerhalb eines beschränkten Intervalls $[a,b]$ auf den Punkt 0 oder auf die Punkte $a$ und $b$ gelegt wird.

Gestutzte Verteilung als bedingte Verteilung[Bearbeiten | Quelltext bearbeiten]

Definition[Bearbeiten | Quelltext bearbeiten]

Die reellwertige Zufallsvariable $X$ besitze die Wahrscheinlichkeitsverteilung $P_{X}$ auf dem Messraum $(\mathbb {R} ,\mathbb {B} )$ , wobei $\mathbb {B}$ die Borelsche σ-Algebra auf $\mathbb {R}$ bezeichnet. Es sei $A\in \mathbb {B}$ mit $P_{X}(A)>0$ . Die auf $A$ gestutzte (oder eingeschränkte) Verteilung (englisch truncated distribution) ist dann durch die bedingten Wahrscheinlichkeiten

P_{X|A}(B)=P_{X}(B\cap A|A)={\frac {P_{X}(B\cap A)}{P_{X}(A)}}\quad {\text{für }}B\in \mathbb {B}

gegeben.

Bezeichnungen[Bearbeiten | Quelltext bearbeiten]

Häufig ist die Menge $A$ ein Intervall der Form $(-\infty ,b]$ , $[a,b]$ mit $a<b$ oder $[a,\infty )$ . Bei einer Stutzung auf das Intervall $(-\infty ,b]$ nennt man die Verteilung einseitig bei $b$ nach oben gestutzt^[1] oder rechtsseitig gestutzt^[2]. Bei einer Stutzung auf das Intervall $[a,\infty )$ nennt man die Verteilung einseitig bei $a$ noch unten gestutzt^[1] oder linksseitig gestutzt^[2]. Bei einer Stutzung auf das Intervall $[a,b]$ nennt man die Verteilung zweiseitig bei $a$ noch unten gestutzt und bei $b$ nach oben gestutzt^[1] oder zweiseitig gestutzt^[3]. Manchmal wird eine gestutzte Verteilung auch als trunkierte Verteilung^[4] bezeichnet.

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

$P_{X|A}$ ist eine Wahrscheinlichkeitsverteilung auf dem Messraum $(A,\mathbb {B} _{A})$ mit $\mathbb {B} _{A}=\{B\cap A\mid B\in \mathbb {B} \}$ , so dass $(A,\mathbb {B} _{A},P_{X|A})$ einen Wahrscheinlichkeitsraum bildet.
Es gilt $P_{X|A}(A)=1\;.$
In einer eher in der Statistik üblichen Schreibweise ist

P_{X|A}(B)={\frac {P(X\in B\cap A)}{P(X\in A)}}\;.

In maßtheoretischer Interpretation ist $(\Omega ,{\mathcal {F}},P)$ ein gegebener Wahrscheinlichkeitsraum, die Zufallsvariable $X$ eine $(\Omega ,{\mathcal {F}}){\text{–}}(\mathbb {R} ,\mathbb {B} )$ -messbare Abbildung und

P_{X|A}(B)={\frac {P(\{\omega \mid X(\omega )\in B\cap A\})}{P(\{\omega |X(\omega )\in A\})}}\;.

Beispiel[Bearbeiten | Quelltext bearbeiten]

Wenn eine Poissonverteilung auf $\mathbb {N}$ gestutzt wird, dann entsteht eine positive Poisson-Verteilung.
Wenn eine Standardnormalverteilung auf $[0,\infty )$ gestutzt wird, dann entsteht eine Chi-Verteilung mit einem Freiheitsgrad. Dies ist die Verteilung von $|Z|$ , wenn $Z$ standardnormalverteilt ist.^[5]
Häufig ist die Menge $A$ ein Intervall der Form $(-\infty ,a]$ , $[a,b]$ mit $a<b$ oder $[b,\infty )$ . In diesen Fällen gibt es explizite Formeln, um die Verteilungsfunktion $F_{X|A}(B)$ der gestutzten Verteilung $P_{X|A}(B)$ durch die Verteilungsfunktion $F_{X}$ von $P_{X}$ und die Koeffizienten $a$ und $b$ darzustellen.^[6] Falls $X$ eine stetige Zufallsvariable ist, für die eine Dichtefunktion $f_{X}$ existiert, gibt es auch Formeln um die Dichtefunktion $f_{X|A}$ aus der Dichtefunktion $f_{X}$ zu berechnen.^[7]
Falls die Zufallsvariable $Y$ die Verteilungsfunktion der auf das Intervall $(a,b]$ gestutzten Verteilung der Zufallsvariablen $X$ hat, gilt

F_{Y}(t)={\begin{cases}0&{\text{für }}t\leq a\\\displaystyle {\frac {F_{X}(t)-F_{X}(a)}{F_{X}(b)-F_{X}(a)}}&{\text{für }}a<t\leq b\\1&{\text{für }}t>1\end{cases}}\;.

^[8]

Falls die Zufallsvariable $Y$ die auf das Intervall $(a,b]$ gestutzte Verteilung der diskreten Zufallsvariablen $X$ hat, gilt

P(Y=t)={\begin{cases}\displaystyle {\frac {P(X=t)}{F_{X}(b)-F_{X}(a)}}&{\text{für }}a<t\leq b\\0&{\text{sonst}}\end{cases}}\;.

^[8]

Falls die Zufallsvariable $Y$ die auf das Intervall $(a,b]$ gestutzte Verteilung der stetigen Zufallsvariablen $X$ mit der Dichtefunktion $f_{X}$ hat, ist

f_{Y}(t)={\begin{cases}\displaystyle {\frac {f_{X}(t)}{F_{X}(b)-F_{X}(a)}}&{\text{für }}a<t\leq b\\0&{\text{sonst}}\end{cases}}

die Dichtefunktion der Zufallsvariablen

Y

.^[8]

Gestutzte Normalverteilung[Bearbeiten | Quelltext bearbeiten]

Ein häufig verwendeter Fall einer gestutzten Verteilung ist die auf ein Intervall gestutzte Normalverteilung ${\mathcal {N}}(\mu ,\sigma ^{2})$ . Im Folgenden bezeichnen $\varphi$ und $\Phi$ die Dichtefunktion und die Verteilungsfunktion der Standardnormalverteilung. Für jedes $x\in \mathbb {R}$ wird die Bezeichnung ${\tilde {x}}=(x-\mu )/\sigma$ vereinbart.

Eine Zufallsvariablen $Y$ mit der auf das Intervall $[a,b]$ mit $a<b$ gestutzten Normalverteilung ${\mathcal {N}}(\mu ,\sigma ^{2})$ hat die Verteilungsfunktion

F_{Y}(t)={\begin{cases}0&{\text{für }}t\leq a\\\displaystyle {\frac {\Phi ({\tilde {t}})-\Phi ({\tilde {a}})}{\Phi ({\tilde {b}})-\Phi ({\tilde {a}})}}&{\text{für }}a<t\leq b\\1&{\text{sonst }}\end{cases}}\;,

die Dichtefunktion

f_{Y}(t)={\begin{cases}\displaystyle {\frac {\varphi ({\tilde {t}})}{\sigma (\Phi ({\tilde {b}})-\Phi ({\tilde {a}}))}}&{\text{für }}a<t<b\\0&{\text{sonst }}\end{cases}}\;,

den Erwartungswert

\mathbb {E} [Y]=\mu -\sigma {\frac {\varphi ({\tilde {b}})-\varphi ({\tilde {a}})}{\Phi ({\tilde {b}})-\Phi ({\tilde {a}})}}

und die Varianz

\mathrm {Var} [Y]=\sigma ^{2}\left(1-{\frac {{\tilde {b}}\varphi ({\tilde {b}})-{\tilde {a}}\varphi ({\tilde {a}})}{\Phi ({\tilde {b}})-\Phi ({\tilde {a}})}}-\left({\frac {\varphi ({\tilde {b}})-\varphi ({\tilde {a}})}{\Phi ({\tilde {b}})-\Phi ({\tilde {a}})}}\right)^{2}\right)\;.

^[9]

Eine Zufallsvariablen $Y$ mit der auf das Intervall $[a,\infty )$ gestutzten Normalverteilung ${\mathcal {N}}(\mu ,\sigma ^{2})$ hat die Verteilungsfunktion

F_{Y}(t)={\begin{cases}0&{\text{für }}t\leq a\\\displaystyle {\frac {\Phi ({\tilde {t}})-\Phi ({\tilde {a}})}{1-\Phi ({\tilde {a}})}}&{\text{für }}a<t\leq b\\1&{\text{sonst }}\end{cases}}\;,

die Dichtefunktion

f_{Y}(t)={\begin{cases}\displaystyle {\frac {\varphi ({\tilde {t}})}{\sigma (1-\Phi ({\tilde {a}}))}}&{\text{für }}a<t\\0&{\text{sonst }}\end{cases}}\;,

den Erwartungswert

\mathbb {E} [Y]=\mu +\sigma {\frac {\varphi ({\tilde {a}})}{1-\Phi ({\tilde {a}})}}

und die Varianz

\mathrm {Var} [Y]=\sigma ^{2}\left(1+{\frac {{\tilde {a}}\varphi ({\tilde {a}})}{1-\Phi ({\tilde {a}})}}-\left({\frac {\varphi ({\tilde {a}})}{1-\Phi ({\tilde {a}})}}\right)^{2}\right)\;.

Eine Zufallsvariablen $Y$ mit der auf das Intervall $(-\infty ,b]$ gestutzten Normalverteilung ${\mathcal {N}}(\mu ,\sigma ^{2})$ hat die Verteilungsfunktion

F_{Y}(t)={\begin{cases}\displaystyle {\frac {\Phi ({\tilde {t}})}{\Phi ({\tilde {b}})}}&{\text{für }}t\leq b\\1&{\text{sonst }}\end{cases}}\;,

die Dichtefunktion

f_{Y}(t)={\begin{cases}\displaystyle {\frac {\varphi ({\tilde {t}})}{\sigma \Phi ({\tilde {b}})}}&{\text{für }}t<b\\0&{\text{sonst }}\end{cases}}\;,

den Erwartungswert

\mathbb {E} [Y]=\mu -\sigma {\frac {\varphi ({\tilde {b}})}{\Phi ({\tilde {b}})}}

und die Varianz

\mathrm {Var} [Y]=\sigma ^{2}\left(1-{\frac {{\tilde {b}}\varphi ({\tilde {b}})}{\Phi ({\tilde {b}})}}-\left({\frac {\varphi ({\tilde {b}})}{\Phi ({\tilde {b}})}}\right)^{2}\right)\;.

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Die statistische Lebensdaueranalyse (englisch life testing) wird hauptsächlich in der Technik und Biometrie angewendet. Die positive und stetige Zufallsvariable $X$ bezeichne eine zufällige Lebensdauer.

Dann beschreibt für einen Zeitpunkt $a>0$ die Zufallsvariable $Y=X-a$ durch negative bzw. positive Werte inwieweit die Lebensdauer den Zeitpunkt $b$ zufällig unter- bzw. überschreitet.

Die zufällige Restlebensdauer bei Erreichen von $a$ ist durch die Verteilung der Zufallsvariablen $Y$ unter der Bedingung $\{Y>0\}$ bzw. die auf das Intervall $[0,\infty )$ gestutzte Verteilung von $Y$ beschrieben.^[10]

Ist der Einsatz einer Maschine bis zum Zeitpunkt $b>0$ geplant, dann interessiert die zufällige Frühausfallzeit, die durch die Verteilung von $X$ unter der Bedingung $\{X<b\}$ bzw. die auf das Intervall $(0,b)$ gestutzte Verteilung von $X$ gegeben ist.^[11]

Die zufällige Interimslebensdauer zwischen zwei Zeitpunkten $a$ und $b$ mit $0<a<b$ ist die Verteilung $Y=X-a$ unter der Bedingung $\{a\leq X\leq b\}=\{0\leq Y\leq b-a\}$ bzw. die auf das Intervall $[0,b-a]$ gestutzte Verteilung von $Y$ gegeben.^[12]

Gestutzte Zufallsvariable als beschränkte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Gestutzte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Bei Konvergenzuntersuchungen für eine Folge von Zufallsvariablen $(X_{n})_{n\in \mathbb {N} }$ werden häufig die Zufallsvariablen

Y_{n}=X_{n}\mathbf {1} _{[-n,n]}(X_{n})={\begin{cases}X_{n},&{\text{falls }}|X_{n}|\leq n\\0,&{\text{falls }}|X_{n}|>n\end{cases}}

gebildet und als gestutzte Zufallsvariablen (englisch truncated random variables) bezeichnet.^[13]^[14] Dabei bezeichnet $x\mapsto \mathbf {1} _{A}(x)$ die Indikatorfunktion der Menge $A\subseteq \mathbb {R}$ .

Die so gebildeten Zufallsvariablen sind beschränkt, da $Y_{n}\in [-n,n]$ gilt und haben damit eine endliche Varianz und endliche Momente höherer Ordnung. Die Folge $(Y_{n})_{n\in \mathbb {N} }$ besteht nur aus beschränkten Zufallsvariablen und ist eine Approximation der Folge $(X_{n})_{n\in \mathbb {N} }$ . Wenn die Zufallsvariablen $X_{n}$ endliche Erwartungswerte haben, gilt die Abschätzung $P(X_{n}\neq Y_{n})\leq 1/n$ für hinreichend großes $n$ .^[15]

Beim Beweis von Grenzwertsätzen ist die Verwendung in dieser Art gestutzter Zufallsvariablen eine wichtige Beweismethode, die als Stutzungsmethode (englisch method of truncation)^[16] oder Abschneidetechnik^[17] bekannt ist. Eine typische Anwendung ist der Beweis des schwachen Gesetzes der großen Zahlen in einer allgemeinen Version, die endliche Erwartungswerte, aber keine endlichen Varianzen voraussetzt.^[15] In diesem Zusammenhang heißt die Folge $(Y_{n})_{n\in \mathbb {N} }$ auch gestutzte Version der Folge $(X_{n})_{n\in \mathbb {N} }$ .^[13]

Die Beschränktheit der Zufallsvariablen $Y_{n}$ wird dabei dadurch erreicht, dass die außerhalb des Intervalls $[-n,n]$ liegende Wahrscheinlichkeitsmasse der Stelle 0 zugeordnet wird. Dagegen wird bei der auf das Intervall $[-n,n]$ gestutzten Verteilung die außerhalb des Intervalls $[-n,n]$ liegende Wahrscheinlichkeitsmasse gleichmäßig auf das Intervall $[-n,n]$ verteilt.

Alternative Form der Stutzung einer Folge von Zufallsvariablen im Zusammenhang Untersuchungen der Voraussetzungen für Gesetze der großen Zahlen sind die Stutzung der Zufallsvariablen $X_{n}$ in der Form^[18]

Y_{n}=X_{n}\mathbf {1} _{(-n,n)}(X_{n})+n\mathbf {1} _{\mathbb {R} \setminus (-n,n)}(X_{n})={\begin{cases}X_{n},&{\text{falls }}|X_{n}|<n\\n,&{\text{falls }}|X_{n}|\geq n\end{cases}}

und in der Form^[19]

Y_{n}=X_{n}\mathbf {1} _{[-{\sqrt {n}},{\sqrt {n}}]}(X_{n})={\begin{cases}X_{n},&{\text{falls }}|X_{n}|\leq {\sqrt {n}}\\0,&{\text{falls }}|X_{n}|>{\sqrt {n}}\end{cases}}\;.

Winsorisierte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Für eine Zufallsvariable $X$ und ein Intervall $(a,b]$ mit $a<b$ ist

Y=X\mathbf {1} _{(a,b]}(X)+a\mathbf {1} _{(-\infty ,a]}(X)+b\mathbf {1} _{(b,\infty )}(X)

die auf das Intervall $(a,b]$ winsorisierte Zufallsvariable. Dabei werden Werte von $X$ , die kleiner als $a$ sind, der Stelle $a$ und Werte von $X$ , die größer als $b$ sind, der Stelle $b$ zugeordnet. Die neu gebildete Zufallsvariable ist beschränkt mit Werten in $[a,b]$ .^[20]

Unterschied der Konzepte[Bearbeiten | Quelltext bearbeiten]

Der Unterschied der beiden Konzepte sei an einer standardnormalverteilten Zufallsvariable $X$ mit der Verteilungsfunktion $\Phi$ erläutert.

Die auf das Intervall $[-2,2]$ gestutzte Verteilung hat die Verteilungsfunktion

\Phi _{|[-2,2]}(x)={\begin{cases}0&{\text{für }}x<-2\\{\frac {\Phi (x)-\Phi (-2)}{\Phi (2)-\Phi (-2)}}&{\text{für }}-2\leq x<2\\1&{\text{für }}x\geq 2\end{cases}}\;.

Dabei gilt $P(X\in [-2,2])=\Phi (2)-\Phi (-2)$ .

Die durch $Y:=X\mathbf {1} _{[-2,2]}(X)$ definierte Zufallsvariable ist beschränkt, da sie nur Wert im Intervall $[-2,2]$ annimmt, und hat die Verteilungsfunktion

F_{Y}(x)=P(Y\leq x)={\begin{cases}0&{\text{für }}x<-2\\\Phi (x)-\Phi (-2)&{\text{für }}-2\leq x<0\\\Phi (x)+1-\Phi (2)&{\text{für }}0\leq x<2\\1&{\text{für }}x\geq 2\end{cases}}\;.

Während die Verteilungsfunktion $\Phi _{|[-2,2]}$ stetig ist, hat die Verteilungsfunktion von $Y$ die Sprungstelle 0, an der diese um den Wert $1-(\Phi (2)-\Phi (-2))$ springt, es gilt also $P(Y=0)=1-(\Phi (2)-\Phi (-2)))$ .

In der Literatur kommt es manchmal zur Konfusion beider Konzepte. Beispielsweise wird ausgehend von einer Zufallsvariablen $X$ und einem Intervall $(a,b]$ die Zufallsvariable $X\mathbf {1} _{(a,b]}(X)$ definiert und als auf $(a,b]$ gestutzte Zufallsvariable bezeichnet, dann aber die Verteilungsfunktion der auf $(a,b]$ gestutzten Verteilung (im Sinn einer bedingten Verteilung) angegeben.^[21]

Gestutzte Beobachtungswerte und verwandte Konzepte[Bearbeiten | Quelltext bearbeiten]

Gestutzte und zensierte Beobachtungswerte sind Fälle unvollständig erhobener oder berichteter Daten, während bei getrimmten und winsorisierten Beobachtungswerten zunächst eine Stichprobe vollständiger Daten vorliegt, aus der extreme Werte entfernt werden, um eine Verbesserung im Sinn robuster Schätzverfahren zu erreichen.

Gestutzte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Gestutzte Beobachtungswerte sind ein Fall unvollständiger berichteter Daten, wobei nur Beobachtungswerte aus einem Teil der Grundgesamtheit vorliegen. Bei der Beobachtung von Lebenszeiten liegen linksseitig gestutzte Beobachtungswerte vor, wenn eine Häufigkeitsverteilung von Lebenszeiten vorliegt, wobei nur Beobachtungseinheiten berücksichtigt sind, deren Lebenszeit einen bestimmten Wert überschreitet. Im Fall von Zufallsstichproben können solche Beobachtungswerte als Realisierungen von Stichprobenvariablen mit einer gestutzten (bedingten) Verteilung beschrieben werden.

Zensierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Bei zensierten Daten (oder Beobachtungswerten) sind einige beobachtete Werte nur unvollständig bekannt. Wenn bei $n$ Untersuchungseinheiten für die Werte eines Merkmals $x\colon \{1,\dots ,n\}\to \mathbb {R}$ mit Werten $x_{i}=x(i)$ gemessen werden, so spricht man von an der Stelle $a$ linksseitig zensierten Beobachtungswerten. Falls nur die Werte im Intervall $(-\infty ,b]$ bekannt sind, so liegen an der Stelle $b$ rechtsseitig zensierte Beobachtungswerte vor. Falls nur die beobachteten Werte im Intervall $[a,b]$ bekannt sind, liegen beidseitig durch das Intervall $[a,b]$ zensierte Beobachtungwerte vor.^[22]

Wenn $(X_{1},\dots ,X_{n})$ eine Zufallsstichprobe ist und nur die Realisierungen in einem vor der Stichprobenziehung fixierten Intervall $[a,\infty )$ bekannt sind, so spricht man von einer linksseitig zensierten Stichprobe vom Typ I. Dabei ist die Anzahl $n_{u}$ der unterhalb von $a$ liegenden Beobachtungswerte die Realisierung einer Zufallsgröße.^[23] Von einer linksseitig zensierten Stichprobe vom Typ II spricht man, wenn die Anzahl $r=n-n_{u}$ vorgegeben ist und sich die Grenze $a$ zufällig ergibt. Dabei liegen nur $r$ Beobachtungswerte vor.^[23] Analog werden die Begriffe der rechtsseitig und beidseitig zensierten Stichprobe verwendet.

Zensierte Stichproben spielen eine Rolle bei der Lebensdaueranalyse und Zuverlässigkeitsanalyse in der Biometrie und Technik, bei der die Beobachtungsdauer begrenzt ist. Wenn die Beobachtungsdauer durch einen festen Abbruchzeitpunkt begrenzt ist, entsteht eine rechtsseitig zentrierte Stichprobe vom Typ I; wenn noch einer vorgegebenen Anzahl von Ausfällen abgebrochen wird, entsteht eine rechtsseitig zentrierte Stichprobe vom Typ II.^[24]

Zensierte Stichproben vom Typ I werden manchmal als gestutzte Stichproben bezeichnet.^[23]

Getrimmte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Für Stichprobenwerte $x_{1}\leq x_{2}\leq \dots \leq x_{n}$ entstehen symmetrisch getrimmte Stichprobenwerte, wenn für ein $k<n/2$ die jeweils $k$ kleinsten und $k$ größten Werte entfernt werden, so dass die verbliebene Stichprobe aus $n-2k$ Werten besteht.^[25] Der arithmetische Mittelwert der verbliebenen Werte

{\frac {1}{n-2k}}\sum _{i=k+1}^{n-2k}x_{i}

,

heißt dann $\alpha$ -getrimmter Mittelwert mit $\alpha =k/n$ .^[25]

Dabei kann der getrimmte Mittelwert im Fall $x_{k}<x_{k+1}$ und $x_{n-k}<x_{n-k+1}$ als Mittelwert der auf das Intervall $A=[x_{k+1},x_{n-k}]$ gestutzten empirischen Verteilung interpretiert werden. Die empirische Verteilung der beobachteten Werte ist

P_{n}(B)={\frac {1}{n}}\sum _{i=1}^{n}\mathbf {1} _{B}(x_{i}),\quad B\subseteq \mathbb {R}

.

Durch Stutzung auf $A$ ergibt sich

P_{n|A}(B)={\frac {P_{n}(B\cap A)}{P_{n}(B)}}={\frac {{\frac {1}{n}}\sum _{i=1}^{n}\mathbf {1} _{B\cap A}(x_{i})}{{\frac {1}{n}}\sum _{i=1}^{n}\mathbf {1} _{A}(x_{i})}}={\frac {\sum _{i=k+1}^{n-k}\mathbf {1} _{B}(x_{i})}{n-2k}},\quad B\subset \mathbb {R}

und damit die empirische Verteilung für die $n-2k$ beobachteten Werte $(x_{k+1},x_{k+2},\dots ,x_{n-k})$ , die sich im Intervall $A$ befinden.

Winsorisierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Aus den Stichprobenwerten $x_{1}\leq x_{2}\leq \dots \leq x_{n}$ wird für $k<n/2$ die winsorisierte Stichprobe gebildet, indem die $k$ kleinsten Werte auf den nächstgrößeren Wert $x_{k+1}$ erhöht werden und die $k$ größten Wert auf den nächstkleineren Wert $x_{n-k}$ reduziert werden.^[25] Der arithmetische Mittelwert dieser Werte ist der winsorisierte Mittelwert

{\frac {1}{n}}\left(kx_{k+1}+\sum _{i=k+1}^{n-k}x_{i}+kx_{n-k}\right)

.

Literatur[Bearbeiten | Quelltext bearbeiten]

P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Gestutzte Verteilung (eingeschränkte Verteilung), S. 146–148.
Janos Galambos: Truncation Methods in Probability. In: Samuel Kotz et al. (Hrsg.): Encyclopedia of Statistical Sciences. 2. Auflage. Band 14. Wiley, New York 2006, ISBN 978-0-471-15044-2, Truncation Methods in Probability , S. 8773–8775, doi:10.1002/0471667196.
David Ruppert: Trimming and Winsorization. In: Samuel Kotz et al. (Hrsg.): Encyclopedia of Statistical Sciences. 2. Auflage. Band 14. Wiley, New York 2006, ISBN 978-0-471-15044-2, S. 8765–8770, doi:10.1002/0471667196.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

↑ ^a ^b ^c P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S. 147.
↑ ^a ^b Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik – Lehr- und Handbuch der angewandten Statistik. 15., überarbeitete und wesentlich erweiterte Auflage. Oldenbourg, München 2009, ISBN 978-3-486-59028-9, S. 150, doi:10.1524/9783486710540.
↑ Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik – Lehr- und Handbuch der angewandten Statistik. 15., überarbeitete und wesentlich erweiterte Auflage. Oldenbourg, München 2009, ISBN 978-3-486-59028-9, S. 149, doi:10.1524/9783486710540.
↑ Ludwig Fahrmeir, Thomas Kneib, Stefan Lang: Regression – Modelle, Methoden und Anwendungen. 2. Auflage. Springer, Heidelberg / Dordrecht / London / New York 2009, ISBN 978-3-642-01836-7, S. 459, doi:10.1007/978-3-642-01837-4.
↑ P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, χ-Verteilung, S. 58.
↑ P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Gestutzte Verteilung (eingeschränkte Verteilung), S. 147 (Bei der Verwendung der Formeln ist zu beachten, dass in dieser Quelle eine Verteilungsfunktion linksseitig stetig definiert ist).
↑ P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S. 147-148.
↑ ^a ^b ^c Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 220.
↑ P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Gestutzte Verteilung (eingeschränkte Verteilung), S. 146.
↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 863–864.
↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 865–866.
↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 866–867.
↑ ^a ^b Sidney I. Resnick: A Probability Path. Birkhäuser, Boston / Basel / Berlin, ISBN 0-8176-4055-X, S. 203, doi:10.1007/978-0-8176-8409-9.
↑ Joseph P. Romano, Andrew F. Siegel: Counterexamples in Probability and Statistics. Chapman & Hall, New York / London 1986, ISBN 0-412-98901-8, S. 110.
↑ ^a ^b Janos Galambos: Truncation Methods in Probability. S. 8774.
↑ Janos Galambos: Truncation Methods in Probability. S. 8775.
↑ Ludger Rüschendorf: Wahrscheinlichkeitstheorie (= Springer Lehrbuch Masterclass). Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-48936-9, S. 240, doi:10.1007/978-3-662-48937-6.
↑ Michael A. Proschan, Pamela A. Shaw: Essentials of Probability Theory for Statisticians. CRC Press, Boca Raton 2016, ISBN 978-1-4987-0419-9, S. 139–140.
↑ Jordan Stoyanov: Counterexamples in Probability (= Dover Books on Mathematics). 3. Auflage. Dover Publications, New York 2013, ISBN 978-0-486-49998-7, Abschn. 17.3, S. 186–187.
↑ Janos Galambos: Truncation Methods in Probability. S. 8773.
↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 221–222.
↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 216.
↑ ^a ^b ^c P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Zensierte Stichprobe (censored sample), S. 596.
↑ P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Zensierte Stichprobe (censored sample), S. 597.
↑ ^a ^b ^c David Ruppert: Trimming and Winsorization. S. 8765.

[Lex-147-1] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S. 147.

[Hartung-150-2] Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik – Lehr- und Handbuch der angewandten Statistik. 15., überarbeitete und wesentlich erweiterte Auflage. Oldenbourg, München 2009, ISBN 978-3-486-59028-9, S. 150, doi:10.1524/9783486710540.

[Hartung-149-3] Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik – Lehr- und Handbuch der angewandten Statistik. 15., überarbeitete und wesentlich erweiterte Auflage. Oldenbourg, München 2009, ISBN 978-3-486-59028-9, S. 149, doi:10.1524/9783486710540.

[4] Ludwig Fahrmeir, Thomas Kneib, Stefan Lang: Regression – Modelle, Methoden und Anwendungen. 2. Auflage. Springer, Heidelberg / Dordrecht / London / New York 2009, ISBN 978-3-642-01836-7, S. 459, doi:10.1007/978-3-642-01837-4.

[5] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, χ-Verteilung, S. 58.

[6] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Gestutzte Verteilung (eingeschränkte Verteilung), S. 147 (Bei der Verwendung der Formeln ist zu beachten, dass in dieser Quelle eine Verteilungsfunktion linksseitig stetig definiert ist).

[7] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S. 147-148.

[Rinne-220-8] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 220.

[9] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Gestutzte Verteilung (eingeschränkte Verteilung), S. 146.

[10] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 863–864.

[11] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 865–866.

[12] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 866–867.

[Resnik-203-13] Sidney I. Resnick: A Probability Path. Birkhäuser, Boston / Basel / Berlin, ISBN 0-8176-4055-X, S. 203, doi:10.1007/978-0-8176-8409-9.

[14] Joseph P. Romano, Andrew F. Siegel: Counterexamples in Probability and Statistics. Chapman & Hall, New York / London 1986, ISBN 0-412-98901-8, S. 110.

[Galambos-8774-15] Janos Galambos: Truncation Methods in Probability. S. 8774.

[Galambos-8775-16] Janos Galambos: Truncation Methods in Probability. S. 8775.

[17] Ludger Rüschendorf: Wahrscheinlichkeitstheorie (= Springer Lehrbuch Masterclass). Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-48936-9, S. 240, doi:10.1007/978-3-662-48937-6.

[18] Michael A. Proschan, Pamela A. Shaw: Essentials of Probability Theory for Statisticians. CRC Press, Boca Raton 2016, ISBN 978-1-4987-0419-9, S. 139–140.

[19] Jordan Stoyanov: Counterexamples in Probability (= Dover Books on Mathematics). 3. Auflage. Dover Publications, New York 2013, ISBN 978-0-486-49998-7, Abschn. 17.3, S. 186–187.

[Galambos-8773-20] Janos Galambos: Truncation Methods in Probability. S. 8773.

[21] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 221–222.

[22] Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 216.

[Lex-596-23] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Zensierte Stichprobe (censored sample), S. 596.

[Lex-597-24] P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Zensierte Stichprobe (censored sample), S. 597.

[Ruppert-8765-25] David Ruppert: Trimming and Winsorization. S. 8765.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

Stutzung

Inhaltsverzeichnis

Gestutzte Verteilung als bedingte Verteilung[Bearbeiten | Quelltext bearbeiten]

Definition[Bearbeiten | Quelltext bearbeiten]

Bezeichnungen[Bearbeiten | Quelltext bearbeiten]

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Gestutzte Normalverteilung[Bearbeiten | Quelltext bearbeiten]

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Gestutzte Zufallsvariable als beschränkte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Gestutzte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Winsorisierte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Unterschied der Konzepte[Bearbeiten | Quelltext bearbeiten]

Gestutzte Beobachtungswerte und verwandte Konzepte[Bearbeiten | Quelltext bearbeiten]

Gestutzte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Zensierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Getrimmte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Winsorisierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Stutzung

Gestutzte Verteilung als bedingte Verteilung[Bearbeiten | Quelltext bearbeiten]

Definition[Bearbeiten | Quelltext bearbeiten]

Bezeichnungen[Bearbeiten | Quelltext bearbeiten]

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Gestutzte Normalverteilung[Bearbeiten | Quelltext bearbeiten]

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Gestutzte Zufallsvariable als beschränkte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Gestutzte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Winsorisierte Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Unterschied der Konzepte[Bearbeiten | Quelltext bearbeiten]

Gestutzte Beobachtungswerte und verwandte Konzepte[Bearbeiten | Quelltext bearbeiten]

Gestutzte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Zensierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Getrimmte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Winsorisierte Beobachtungswerte[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche