bath42

quiz
probability
bayes
num
qm2
qm2-pruefung
Published

November 8, 2023

Aufgabe

Mehrere Proben werden zu einem unbekannten Planeten geschossen. Die Forschungsfrage lautet: Ist es die Erde (70% Wasseranteil) oder der Planet “Bath42” mit 90% Wasseranteil?

Wir sind indifferent (apriori) zu den Parameterwerten.

Daten: 6 Treffer (Wasser) von 9 Versuchen (Proben).

Behauptung: “Das ist fast sicher Bath42!”.

Aufgabe: Wie groß ist die Wahrscheinlichkeit, dass es sich um Bath42 handelt (und nicht um die Erde)?

Hinweise:











Lösung

Da wir indifferent apriori sind, ist der Parameterwert mit der höchsten Likelihood am wahrscheinlichsten. Der höchsten Likelihood hat der Parameter, der gleich den Daten ist. Das ist:

6/9
[1] 0.6666667

Schauen wir uns die Likelihoods für alle Parameterwerte \(0, 0.1, 0.2, \ldots, 1\) an.

Hier ist eine Sequenz dieser Parameterwerte:

parameterwerte <- seq(0, 1, by = .1)
parameterwerte
 [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Und hier sind die zugehörigen Likelihoods:

library(tidyverse)

likelihoods <-
  tibble(
    parameterwerte = parameterwerte,
    likelihoods = dbinom(x = 6, size = 9, prob = parameterwerte))

likelihoods
# A tibble: 11 × 2
   parameterwerte likelihoods
            <dbl>       <dbl>
 1            0     0        
 2            0.1   0.0000612
 3            0.2   0.00275  
 4            0.3   0.0210   
 5            0.4   0.0743   
 6            0.5   0.164    
 7            0.6   0.251    
 8            0.7   0.267    
 9            0.8   0.176    
10            0.9   0.0446   
11            1     0        

Wie man sieht, hat der Parameterwert, der den Daten (6/9) am nächsten kommt, die höchste Likelihood.

Die Post-Wahrscheinlichkeit können in gewohnter Manier mit Bayes’ Theorem berechnen. Vielleicht am einfachsten mit der Bayes-Box.

Eine Funktion, die die Bayes-Box berechnet, kann man sich so importieren:

# devtools::install_github("https://github.com/sebastiansauer/prada")  installieren
library(prada) 

Oder so:

source("https://raw.githubusercontent.com/sebastiansauer/prada/master/R/NAME_bayesbox.R")

Unsere Informationen sind:

p_Erde <- .5
p_Bath42 <- .5
Lik_Erde <- dbinom(x = 7, size = 9, prob = .7)
Lik_Bath42 <- dbinom(x = 7, size = 9, prob = .9)
bb <- bayesbox(hyps = c("Erde", "Bath42"), 
               priors = 1, 
               liks = c(Lik_Erde, Lik_Bath42))
bb
    hyps priors      liks post_unstand post_std
1   Erde      1 0.2668279    0.2668279 0.607788
2 Bath42      1 0.1721869    0.1721869 0.392212

Falsch. Die Daten sprechen eher für die Erde.

Answerlist

  • Falsch
  • Wahr

Categories:

  • quiz
  • probability
  • bayes
  • num