Байесовская оценка log-normal с использованием JAGS

Я пытаюсь найти 95% надежного интервала в 50 образцов. Размеры образцов варьируются от 2 до 600, а значения в каждом образце ограничены между 1 и 5. ex:

sample 1 = (1,3.5,2.8,5,4.6)
sample 2 = (1,5)
sample 3 = (4.1,1.1,5,3.5,2,2.4,...)

Образцы размером 10 или более имеют логнормальное распределение, где я использовал JAGS для байесовской оценки log-нормальных параметров, адаптированных от Джона К. Крушке, с указанием модели:

 modelstring = "
  model {
    for( i in 1 : N ) {
      y[i] ~ dlnorm( muOfLogY , 1/sigmaOfLogY^2 )
    }
  sigmaOfLogY ~ dunif( 0.001*sdOfLogY , 1000*sdOfLogY )
  muOfLogY ~ dunif( 0.001*meanOfLogY , 1000*meanOfLogY )
  muOfY <- exp(muOfLogY+sigmaOfLogY^2/2)
  modeOfY <- exp(muOfLogY-sigmaOfLogY^2)
  sigmaOfY <- sqrt(exp(2*muOfLogY+sigmaOfLogY^2)*(exp(sigmaOfLogY^2)-1))
}
"

Модель отлично работает с размером выборки> 10. Однако при 3 <= образцах <10 я получил экстремальные значения в верхнем пределе (например, 3000), который превысил максимально возможное значение среднего (например, 5). В случае размера выборки = 2, я получил ошибку ниже:

Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) : 
  NA/NaN/Inf in 'y'

Я новичок в JAGS и не могу понять, как решить эти проблемы. Я думаю, что для смайпеков <10 распределение больше не является логнормальным! Есть идеи? Спасибо

bayesian,confidence-interval,jags,

1

Ответов: 1


0

Сначала семантическая заметка. Вы не используете JAGS для поиска средств выборки. Вы используете JAGS для поиска средств популяций, из которых возникли образцы. Если вы хотите найти средство выборки (log), вы можете просто взять среднее значение (логарифмы) выборки.

Теперь, если значения в каждом образце ограничены между 1 и 5 (из-за некоторого внешнего ограничения), тогда образец НИКОГДА не извлекается из лог-нормального распределения, которое по своей сути ставит массу вероятности над значениями больше пяти.

Представим себе, ради того, чтобы сказать, что образцы возникают из логнормальной выборки (и потому не ограничены по своей сути между 1 и 5). Тогда JAGS просто говорит вам, что недостаточно информации, содержащейся в этом примере, чтобы получить хорошую оценку среднего значения населения, из которого она была нарисована. Я бы не стал беспокоиться о понимании ошибки, когда размер выборки равен двум, потому что буквально нет способа получить хороший вывод о значении совокупности из двух образцов. Это верно, даже если вы знаете, что население действительно логарифмически нормально распределено. И так как ваши популяции на самом деле не распределены в логах (они ограничены между 1 и 5), вся процедура вывода недействительна в любом случае.

байесовские, доверительный интервал, зазубрины,