看了您寫的統計學P值是什麼意思回答,有一點不明白

時間 2021-05-09 11:31:16

1樓:匿名使用者

首先搞清楚的是p值與顯著性水平(.05)概念含義,p值也就是零假設成立的概率或者可能性,零假設初始設定為兩組資料間不存在差異,你想下如果這種可能性極小(<.05)了,說明零假設中兩組資料不存在差異的情況不可能存在,也就是拒絕這個假設,反證了備擇假設(兩組資料存在顯著差異)的成立,當然p值越大(>.

05),說明原假定的兩組資料不存在差異的概率很大,不能拒絕零假設,也就是得到您所說的兩種藥物本質上沒有區別的結論。其實就是你要搞懂概念的含義。

2樓:匿名使用者

不知你在問誰,也就是誰是統計書的編者?斗膽回答一下吧:p>0.

05中,p值是顯著性水平,定義為拒絕零假設的概率水平,意味著p<0.05,則會發生小概率事件,即拒絕零假設,就像中500萬大獎那樣,概率很小,在統計中若發生小概率事件,也就是拒絕零假設很難,一旦拒絕就說明樣本代表的總體是有差異的,或者是有關聯的,當然,你提到的p>0.05,則只是說沒有發生小概率事件,不能拒絕零假設,總體沒有差異,或者沒有關聯,你題目的答案應該是:

a藥和b藥療效差不多,沒有本質的區別。

求問統計學裡的p值是什麼含義?請用通俗易懂的語言解釋,謝謝!

3樓:語言學新兵

你需要的可能是一個故事。

從前,你有個朋友,他每月開一輛小貨車去市場裡採購東西,然後再把所有這些東西轉賣出去。月復一月,年復一年。

但是,因為市場**變動,每一個月他賣東西得到的毛爺爺數目並不一樣,差不多有個5000塊錢左右吧。你呢能看到他每個月的收入統計。

時間長了,有一次,無聊的你準備戲耍一下這個無辜的小夥伴,你偷偷在他的小貨車上裝了一小瓶尿。既然他肯定會在集市上賣掉所有東西,那麼這一小瓶尿他一定也會賣出去,只不過這瓶尿的**可能也就是零吧。

這一次他賺了5400塊,這可比以往的平均數5000塊錢還多。那問題就來了:為什麼這個月他賺的比平常多呢?

有兩種情況:其一,你那瓶尿很值錢,他自然會多賺;其二,你那瓶尿根本不值錢,他多賺了只是因為這個月市場上**不錯。

那到底是哪種情況呢?這個問題的實質是,你那瓶尿到底值不值錢。如果這瓶尿根本不值錢,那他賣東西和以前賣東西的情況沒什麼兩樣,只不過是市場**影響而已。

於是,你翻了他以前賣東西的紀錄,算了算所有他的個人月收入超過5400塊的概率,大概是0.1。也就是說在你這瓶尿沒有任何價值的情況下,只靠市場**,他只有0.

1的概率賣到5400塊。

所以你得出的結論是,你的那瓶尿有價值,你這個結論的p值就是0.1。

===================

故事講完了,來分析一下。

為什麼要用p值?換句話說,為什麼要做推斷統計?我想,p值到底是啥並不重要,我知道你做研究時多半隻是負責看看p到底有沒有比0.05小的。而這個問題,才是我最想告訴你的。

推斷統計,之所以要「推斷」,是因為我們沒有辦法正面驗證某種情況。在這個故事中,你以前沒幹過偷偷把一瓶尿放在車上的事兒,他以前也沒賣過你的尿,所以儘管你有的是他的銷售資料,但那些舊賬本沒辦法正面告訴你你的尿到底值不值錢。

這就是「沒辦法正面驗證」,在這樣的情況下,你就沒辦法了麼?非也,我們可以換個角度考慮這個問題,假設「你那瓶尿毫無價值」是成立的,他賣了這瓶尿跟沒賣時候沒什麼兩樣,那這一次和以往自然也沒什麼兩樣。既然這次賣東西和以往一樣,那舊賬本中的記錄就能幫到你了。

你可以算算舊賬本,他在沒賣過你那瓶尿的情況下,賺到5400塊及以上的可能性(概率),這個概率就是「你那瓶尿毫無價值」的概率,這裡也就是0.1.

這樣,「你那瓶尿有價值」的概率,當然就是這個假設的相反情況,也就是0.9,這也是你的假設成立的可能性。

那這個p值到底顯著與否呢?那得看市場**。這裡市場**是隨機的,所以「顯著」與否簡單點就是在說你那瓶尿能不能跑贏市場。

業內經常以兩個標準差作為衡量「顯著」的標準。絕大多數情況下,作為隨機變數的市場**服從正態分佈。而正態分佈中,超過兩個標準差的概率是0.

05,這也就是為什麼大家要拿0.05作為「公認」的顯著性水平尺度了。

統計推斷,核心就是反證法。你那瓶尿沒價值的可能性越小,反而越能證明你那瓶尿有價值。

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離」

這是你的書上寫的定義,但是很明顯,你把結尾最重要的「的概率」三個字漏掉了。正常情況下,這個定義應該是

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離的概率」

不信你可以再看看你的書。

但是,怎麼可以容忍這麼***的定義?我們來用這個故事做個轉換吧:

「在原假設成立的情況下」 -> 在你那瓶尿不值錢情況下

「抽到的統計量與原假設之間的距離」 -> 他舊賬本里的銷售記錄

「至少等於」 -> 大於或等於

"樣本計算值與原假設之間的距離" -> 他這一次的銷售記錄(5400塊)

「的概率」 -> 的概率

連起來讀讀,p值的定義就變成:

「在你那瓶尿不值錢的情況下,他舊賬本里的銷售記錄大於或等於他這一次的銷售記錄(5400塊錢)(這個事件發生)的概率。」

這一次,好懂了點嗎?

最後要說明,說得通俗易懂是要承擔風險的,因為通俗很可能意味著不嚴謹,易懂很可能意味著不周全。以上有很多有失嚴謹之處,希望題主還要多多看書哇。

最後的最後,為什麼我要用「一瓶尿」這樣一個非常粗俗**的故事?因為所謂的p value,不就是用來證明你的pee value的麼?

個人觀點,僅供參考!

4樓:喵喵喵

專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.

05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即

假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果。

當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

擴充套件資料

所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。

當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,。這種條件下有兩種方法:一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。

另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。

即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態。

急請問統計學p值的意義,謝謝

5樓:情痴

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推匯出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態。

6樓:匿名使用者

簡單的講吧,我看他們兩個講的蠻複雜的,其實沒那麼複雜

你知道正太分佈吧,0.05、0.01、0.

001分別對應著這三個數:95%、99%和99.9%,你可能在有些地方還會看到0.

1,它是對應著90%,好了,我先向你解釋下這幾個百分數是什麼意思,這四個百分數都是表示 我的統計結果有多大的把握性,比如95%,它的意思就是說如果有100個去統計這個結果,可能有95個人和我這個統計結果是一樣的,這應該好理解,對吧 呵呵

好,當我們說我的結果的把握性有95%時,換句話說就是95%的可能性會出現和我一樣的結果,只有5%的機會會和我的結果不一樣,對吧

當我們在規定如果p<0.05時就通過檢驗,表示如果你這個結果的把握性》0.95,就可以了,也就是通過檢驗了。這只是用0.05來解釋的,其他數是一樣的

至於為什麼選這些數,我想你可能已經明白了,我們不習慣說我對這件事有93%或97%的把握性吧,呵呵 對不對,

不知道我說清楚了沒有。。。

統計學的問題,統計學問題?

binompdf numtrials,p x 給定離散二項分佈的 numtrials和每次實驗成功 概率p 計算其在x處的 概率.binomcdf為離散二項分佈 例一 兩人遊戲,你想測定對方有至少兩個6的概率。p 至少有兩個6的概率 1 binomcdf 8 0.1 1 0.18670.所以有18....

統計學題目誰會啊,統計學的題目誰會做啊?

懸賞分 5 離問題結束還有 14 天 23 小時 提問者 妝552200 檢舉 某公司2008下半年職工人數和產品銷售收入資料如下表 月份 6 7 8 9 10 11 12 銷售收入 萬元 280 300 310 315 325 340 360 月初職工 人數 人 165 168 180 176 1...

求統計學的大神幫忙,求統計學大神指導!!!謝謝!!!

手機使用者 首先 你並不知道總體的分佈 所以引數方法不好使 要用非引數方法 有個簡單的方法permutation test 就是在總體分佈未知的情況下用mc 蒙特卡洛模擬 求兩組均值差的pvalue的 你自己搜下原理 我用r做了下你的資料 code如下 a c c rep 1,31 rep 0,13...