很開心歡迎你的到來,目前已發布1.0版本,感謝支持。
匯集你所喜歡的社群動態
試著將你喜愛的動態加入關注吧...
相關推薦 : 熱門關注
晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地) :: 痞客邦 ::
頻道 : RSS頻道
類別 : 不設分類
瀏覽人次 : 91
add收藏
一個討論統計的好地方
前往 RSS 詳細瀏覽
你是此專頁頻道維運人員,不希望被收錄動態,請告知我們 取消收錄
論文整理WORD小技巧-表格篇(二) 貳、調整表格
15、想將設定為『自動調整成內容大小』的表格換成『自動調整成視窗大小』。
16、用滑鼠選取整張表格,或直接點圖上紅色框線的十字圖示即可選取。
17、點選右鍵,選擇『自動調整』à『自動調整成視窗大小』。
18、表格格式即可變更。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-表格篇(一) 接下來一系列文章想和大家分享平常進行統計數據整理時,在WORD中所使用的小技巧,首先是針對表格的部分,目前筆者使用的Office版本為2013版,因為不同版本會造成部分選項位置的不同,如果有遇到此問題的話,可能要另外google一下,或是在文章下方留下您所遇到的問題。
壹、插入表格
本系列文章屬於WORD表格的小技巧,那就先從教大家插入表格開始,有些使用者是會將統計報表數據整理到Excel再貼到WORD上,不過筆者的習慣是先在WORD檔中建立好表格再把數據填入,因此表格就需要先重新建立。
1、點選『插入』à『表格』,當表格格式在10×8以下,可以直接拉出表格,但筆者的習慣是會確認直欄數,橫列數有無確定都沒關係,就算橫列數不確定,下方說明如何增加;雖然說直欄數也可以之後增加,但因為受限於版面,之後調整直欄數時勢必會造成格式走樣,所以習慣上都會先把直欄數先確定。
2、畫面為10×8的儲存格。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
設計絕佳Power BI企業績效儀表版(Performance Dashboard)—功能篇 這是一個企業績效儀表版的範例,從整個色調上來看,以深藍色為基底,給人一種穩定、智慧、可信賴的感覺,在企業績效這種高專業內涵的資訊上,特別合適。
 
企業績效儀表版(註)
Source:Enterprise DNA (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
區別效度(Discriminant validity)之AMOS操作 區別效度分析旨在驗證不同兩個構面相關在統計上是否存在差異,在不同構面的題目應該不具有高度相關,如有高度相關,就表示這些題目是衡量同一件事,同常這會發生在構面的定義有過度重疊的時候(張偉豪,2011)。
最常用來驗證區別效度的方法,應該算是平均變異數萃取法(如下表),因為在進行驗證性因素分析(confirmatory factor analysis, CFA)的同時,即可透過所得到因素間的相關係數,以及透過報告收歛效度(convergent validity)時所得到的平均變異萃取量(average variance extracted, AVE)就能完成下列表格,至於判斷的標準,就是該因素的AVE開根號值要高於所有與該因素的相關係數,以下圖因素B為例,AVE開根號為.78,要高於所有與因素B的相關係數.42至.72,則代表有區別效度。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI處理google表單的時間戳記 google表單是很多人拿來製作線上問卷的最佳工具之一,功能齊全又方便。如果你仔細察看下載的回應資料檔,第1欄通常叫作「時間戳記」,記錄每一份問卷提送時間,它的內容包括年月日及時間,是最標準的日期+時間格式。
當你想要統計每天或每週的回應數趨勢,或者想看週一至週日,那一天回收情形較好,「時間戳記」就可以派上用場。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
健保資料庫資料年代太舊了,很難被高分雜誌社接受,真的嗎?~晨晰統計林星帆顧問整理 目前欲作健保資料庫有三種管道,第一種是以國衛院時代的攜出健保資料庫,其資料只到2013年就停止更新了;第二種是衛生福利資料科學中心,俗稱加值中心,資料更新約延遲1.5~2年左右;第三種是全民健康保險保險人資訊整合應用服務中心,資料更新約延遲1年。最近常聽到一種聲音,就是知名雜誌越來越不願意接受國衛院的攜出健保資料庫,但筆者的實際經驗似乎相左。
因此筆者使用國立成功大學健康資料加值應用研究中心的健保資料庫搜尋網站(https://visualizinghealthdata.idv.tw/?route=article/thesis),搜尋方式為「限定impact factor > 5」(以2016 JCR的分數),結果有743篇(更新時間 : 2018-06-27),其中43篇為於2018年發表,筆者由摘要中找尋「追蹤截止日期」的相關資訊。
期刊分佈如表一,其中已經被SCI除名的Oncotarget有13篇,去除掉之後還有30篇。
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
探索性因素分析EFA vs 驗證性因素分析CFA 因素分析是在做量表型研究時,最常用來進行效度分析的統計方法,而因素分析又分為探索性因素分析(Exploratory Factor Analysis, EFA)與驗證性因素分析(Confirmatory Factor Analysis, CFA),因此有兩個常被問到的問題,兩者的差別在哪,以及兩者的使用時機為何,兩者的差異在張偉豪與鄭時宜(2012)一書中有清楚的介紹與彙整,因此本篇也截錄一些重點與大家方享。
探索性因素分析被提出的時間早於驗證性因素分析,主要的目的是在探索一組觀察變項中有多少的潛在因素,其流程是先設定一群觀察變項會受到同一個共同因素的影響,計算其共變程度,再來排除掉共變程度後,再尋找下一個可以解釋剩下共變關係的因素,直到所有變異量被解釋完為止(如下圖左半部),此時所萃取因素的個數剛好就是等於觀察變項的總題數,不過由於多數因素能解釋共變的程度不高,因此就會有許多方式來決定因素個數,譬如說下圖右半部採取特徵值大於一的方式來決定,或是用陡坡圖來決定適合的因素個數。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
地政事務所[滿意度調查網頁]申請站-完全免費  
晨晰統計累積多年在滿意度調查上的工作經驗,今年針對全國各地政事務所員工經常舉辦的民眾洽公滿意度,把最常見的題目,整理出二個版本(A版、B版),並把題目內容放上網路,免費提供大家申請使用。
只要提出申請,立即獲得可用的調查網頁,同時附後台連結權限,隨時下載填答檔案。對辦理調查的同仁來說,可大幅減少了蒐集題目、網頁設計與問卷建檔的時間,大約可節省20小時以上工作時間,相當方便。
這二版題目集合各地政所洽公服務滿意度的精華,所有題目皆已千錘百鍊,多次使用證明有效性,歡迎使用。
申請網址:https://goo.gl/TtQjPb (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI資料視覺化系列6-矩陣和資料表(Tables and matrixes)續篇 在Power BI資料視覺化系列5中,介紹了資料表(Tables)的功能,這裏進一步介紹矩陣(Matrixes)。
矩陣與資料表最大的不同,打個比喻:資料表類似原始資料表,每一直欄為一個屬性(或變項),橫列數即為資料筆數,它其實像是原始資料的呈現視窗。而矩陣則類似交叉表,它是某二變項的交叉,細格中呈現的是個數或平均數。
以下圖為例,這是一個展覽活動的遊客資料。左邊為資料表,展示每每個人前來的次數及交通工具,這時你看到的是每一筆原始資料;右邊則是矩陣,它是頻率與交通工具的交叉表,表中的數字是人數,這時你可以看到坐火車前來的225人中,有123人是第1次來。
 
 
進一步,如果您想看到各項百分比,透過改變上圖value之ID的顯示方式,矩陣(或稱交叉表)中的人數統計也可以改為百分比,包括直欄、橫列、總和的百分比。
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI資料視覺化系列5-矩陣和資料表(Tables and matrixes) 資料視覺化原始目的是把成千上萬筆的資料,彙整、計算後呈現在一張圖中,讓我們可以快速看出大小或趨勢關係,獲得資料結果。但是如果我們也想讓使用者同時深入每一筆資料中,細看個案情形,那我們就需要用到矩陣和資料表功能(Tables and matrixes)。
下面是資料表(Tables)的示意圖,我們可以從資料表中細看每一製造商的每一種產品營收,最下方會顯示總和。它有幾個特點:
1.     您可以按一下資料行的標題,切換為遞增或遞減順序,來手動排序每個資料行。è因此可以快速的找到較低或較高的資料。
2.     如果資料行的寬度不足以顯示所有內容,請按一下並左右拖曳標題將它展開。è讓畫面完整呈現,尤其是在投影簡報或多人討論時,特別有用。
3.    如果筆數太多,資料表可以從右方的捲軸,來展示視窗外資料。
 
 
資料表(Tables)的製作方式也很簡單,只要選擇[視覺效果]下的圖示,再依使用者需要,把變項填入[值]區中,欄位順序會決定這些欄位在資料表中的顯示順序。
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
簡介配對的應用與SAS內建的配對程序PSMATCH -3   延續上一章節,本篇將持續透過官方範例檔與示範程式(如下圖所示),簡介程序實際操作之後產出的報表,以及報表中各項目的涵義。  
  執行完上段程序後,首先產出的報表會描述進行傾向分數配對的變數細節(如下圖所示)。
 
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
只要作這二件事,你的google表單就會自動跑到Power BI 大家好,如果你是數據話的忠實觀眾,本集(數據話第十七集)我們改變一個方式,看看別人怎麼說。
有位Youtober 叫Curbal(訂閱數8596 at 2018/4/3),錄了一段視頻,標題是「How to connect Google Sheet with Power BI」(如合連結google表單與Power BI) https://www.youtube.com/watch?v=2hFCeduIP6k ,時間不長才5分鐘,請先看完。
 
簡單講,如果你經常使用google表單作網路問卷,那麼你一定非常熟悉下面這個畫面,問卷填答資料表。雖然你下載後,可以在excel上製作各種精美統計圖表。但是如果客戶或老闆希望在調查期間,隨時可以查閱資料,而且是以圖表方式呈現,你怎麼辦呢?總不能隨時stand by製作圖表吧?
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
存活偏誤(Survival bias)對觀察型研究設計與存活分析的影響-2   呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias),本章節導讀文獻中提出的常見的5種研究設計方法,前2種會受到存活偏誤(Survival bias)影響,導致研究結果產生傾向於某一方有優勢,後3種為控制存活偏誤(Survival bias)的研究設計方法,以下將逐一介紹。
 
方法1:簡單分組(Simple grouping)
  以AMI出院後90天內用藥情況分為Statin跟Non-statin組,兩組人都以AMI出院日期做為觀察起始時間,追蹤AMI出院之後發生再次住院或死亡的風險。此種設計是以未來的暴露(出院後90天)定義藥物暴露組,在計算未來事件發生率時,由於Statin組在出院後到首次使用Statin之前的這段觀察時間為無事件(event-free)觀察人年,因此只會貢獻發生率的分母(觀察人年),而不會對分子(研究觀察的事件, event)有貢獻,造成計算Statin組的發生率時,發生率的分母被膨脹,因此發生率被低估,導致在與Non-statin組比較發生風險時,形成人為操作之下對Statin組有較小的發生率比(Rate ratio)。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
存活偏誤(Survival bias)對觀察型研究設計與存活分析的影響-1   觀察型研究中,由於介入/治療行為並非由研究者施予及分組,非受試者與受試者在受到其他許多背景、環境等因素操弄之下,而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中,常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組,並觀察追蹤期間的結果時,會因為【分組】這個動作而產生存活偏誤(Survival bias),或是不死的時間偏誤(Immortal time bias)。舉例來說,研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人,看病人出院後90天內的Statin藥物使用狀況,將病人分成Statin組跟Non-statin組,並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計,潛藏著一個干擾觀察結果的偏誤(bias),出院後90天內因為有使用Statin而被分到Statin組的人,從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin),因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時,就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低,這是因為死亡而來不及用藥的人都在Non-statin組,而死亡的人也比較不容易被觀察到AMI的再住院,這個現象就稱為不死的時間偏誤(Immortal time bias)。
  流行病學研究設計中,有幾種處理不死的時間偏誤(Immortal time bias)的方式,以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式,其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果,而方法3~5則是控制偏誤(bias)的方式,下一章節將逐一導讀介紹文獻中的5種研究設計方法,以及這5種研究設計之下對結果產生的影響。
 
圖1、不同研究設計的方法與相對應的分析方式 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI學習心得分享二 接續「Power BI學習心得分享一」,本篇介紹資料表關聯。
在Power BI有所謂的建立資料模型(Modeling),乍看不知何意,其實就是建立資料表之間的關聯性。因為實務上,資料表可能來自不同來源,比如訂單資料來自業務部,人事資料來自人事部,廠商資料來自採購部,各自維護更新,當需要分析時再串連一起。又如同樣是紀錄廠商資料,會計部重點在統編、銀行帳戶、匯款紀錄、發票地址等,而採購部重點在產品型號、價格、數量等,平常各自為政,當需要串連時,就要用到資料表關聯。
在串連資料時,不需要把資料壓平合併成一份大資料表,只要事先定義它們之間的關聯性,就可以同時使用多份資料表。再者,您可以建立自訂計算式,創造出新量值,並在視覺效果中使用,以利建立模型。
舉例在北風資料庫中,將客戶、訂單、訂單詳細資料、員工、產品等五張資料表同時匯入PBI,雖然它會自動識別資料表中的關聯,但不一定正確,而且不一定完整,所以我們仍須手動。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
簡介配對的應用與SAS內建的配對程序PSMATCH -2   延續上一章節,本篇將透過官方範例檔,簡介程序實際操作的狀況,以及程序指令代表的意思。
  首先,下圖列出範例檔案的前10筆觀察值。StudentID為收案編號;Music在此作為研究組別,分為Yes跟No兩組,在此Yes組視為治療組(Treated),No組視為對照組(Control);Gender為類別型共變數;Absence為連續型共變數。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI學習心得分享一 今(2018)年3月上旬參加數位時代所舉辦的「PowerBI圖像式資料分析」,雖然只有短短一天的課程,但對於在資料視覺化領域鑽研一段時間的人來說,仍可以有相當大的幫助。
話說微軟因應大數據分析需求,從Excel 2010開始,逐步增加各種增益集,像Power Pivot、Power View、Power Query、Power Map等四大天王,給予使用者自助式商業智慧功能。到了Excel 2016,這些功能變為內建,使用更為方便(後二者更名為「新查詢」、「3D地圖」)。
不過這些功能都建立在Excel上,為加速推廣應用,微軟在2014年推出Power BI線上服務,並提供免費的Power BI Desktop程式,讓使用者可以不用到Excel情況下,使用商業智慧功能。
為區別二大走向,我將前者稱為Excel Power BI(工具為Excel與增益集),後者則稱為Microsoft Power BI(工具主要為Power BI Desktop)。對初學者而言,從Excel入門會比較快,等熟悉後,再來學習Power BI Desktop會比較容易。二者其實有一半以上的功能是雷同的,但最終目的不太一樣。如果你只要單機操作、運算、展示,那Excel Power BI就可以了;但如果你想把結果放上雲端,多人異地同時查詢,那麼Microsoft Power BI就是你的選擇。本文在舉例上將偏重在Power BI Desktop(以下簡稱PBI Desktop)。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
簡介配對的應用與SAS內建的配對程序PSMATCH~1   近幾年已有越來越多醫學研究的研究設計採用配對法比較試驗組與對照組的差異,在眾多配對方式中,本篇文章簡單分享筆者較為常用的配對方式。
  在觀察型研究中,為了提升試驗組與對照組之間的可比較性(Comparability),將兩組的背景干擾變項(例如:年齡、性別、共病等)作配對,使兩組在試驗介入以外的其他變項達到均衡。配對後的兩組便能在假設無其他因素干擾之下,比較試驗介入本身對觀察結果的影響。當然,此項假設是理想的假設情境,實際上,配對只能考慮研究者有納入配對的變項,因此配對後的兩組只會在有配對的變項上達到平衡,研究者沒有考慮到的因素可能還是分佈不均衡的。
  舉例來說,筆者之前協助分析的案子中,有一項研究是將肝炎病毒感染者分為治療組跟非治療組,配對年齡、性別跟共病,比較存活結果。投稿審查過程中,審查委員認為社會經濟差異會影響病人成為治療組或是非治療組,且社會經濟地位也會影響病人的存活,因此建議需將兩組的社會經濟地位納入配對項目中。而實際上,該研究最初只有配對年齡、性別與共病時,配對後的樣本確實存在社會經濟地位的差異。
  從上述案例可知,為何觀察型研究無論用何種配對分析方式,皆無法完全取代設計良好的隨機分派臨床試驗(randomized clinical trial, RCT)的原因,配對跟統計法只能盡可能的趨近隨機分派的狀態,將偏差(bias)盡力的降低。
  而在筆者實務操作中,比較常使用的配對方式為採用貪婪配對的最鄰近配對法(Greedy nearest neighbor),以往操作方面是引用Lori S. Parsons刊登於SUGI 29的OneToManyMTCH巨集(macro)。SAS / STAT 14.2版開始有PSMATCH程序可進行多種不同的配對方式,並且能輸出配對品質評估的相關報表數據及圖表。下一章將透過官方範例檔,簡介程序實際操作的狀況。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
傾向分數分析介紹(第2篇,共2篇)- 晨晰統計林星帆顧問整理 完成對處置變項的羅吉斯迴歸之後,根據每個個案的基本特性(年齡、性別與共病狀況)會得到預測機率,即此人成為治療組的機率。在接著往下進行傾向分數的分析之前,要先評估治療組與控制組在傾向分數的分布情形。可以使用兩種方法來判斷,第一種是畫圖,第二種是看C-statistics(即C-index或AUROC)。C-statistics代表的是預測變項對處置變項(1=treated, 0=untreated)整體的區別力,0.5為完全無法區別,1代表完美區別。
下圖列出傾向分數可以非常有效區分治療組與控制組的結果,兩組在傾向分數的分布截然不同,而且重疊區域很少(中間灰色底的common support),這種狀況是很難進行後續的傾向分數分析的,不管進行任何一種傾向分數分析,都無法有效降低混淆因子的效果。當出現這種情形時,檢查是否有對處置變項的強烈預測變項,例如「有洗腎的病人一定不會開Metformin」或是存在工具變數。
 
資料來源:Kim等人(2016)的圖2A (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
傾向分數分析介紹(第1篇,共2篇)- 晨晰統計林星帆顧問整理 在現今的醫學研究中,傾向分數分析(propensity score analysis, PSA)儼然扮演非常重要的角色。下圖為筆者在Pubmed以關鍵字「propensity score」搜尋得到的文獻筆數,由結果可知,以傾向分數作為研究方法的文獻呈現非線性的增加,到了2017年,單年度超過3千篇文獻使用傾向分數,可見傾向分數已為醫學研究當中的顯學。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:

瀏覽更多


載入中....