很開心你的到來,IG頻道已開放登錄了。
匯集你所喜歡的社群動態
試著將你喜愛的動態加入關注吧...
相關推薦 : 熱門關注
晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地) :: 痞客邦 :: 瀏覽人次 : 176 add收藏 前往 RSS 詳細瀏覽
晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地) :: 痞客邦 ::
頻道 : RSS頻道
類別 : 不設分類
瀏覽人次 : 176
add收藏
一個討論統計的好地方
前往 RSS 詳細瀏覽
你是此專頁頻道維運人員,不希望被收錄動態,請告知我們 取消收錄
論文整理WORD小技巧-頁碼篇-3 參、插入圖表目錄
33、接下來示範圖目錄與表目錄的製作,分別在第1頁~第4頁建議4個表標題與圖標題。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-頁碼篇-2 貳、插入頁碼
9、接下來要進行頁碼插入的動作,在『插入』à『頁碼』à『頁碼底端』à『傳數字2』,一般情況都是頁碼置中。
10、此時文件已完成頁碼的新增,但按照一般論文格式,篇前的頁碼應該為羅馬數字,而內文的頁碼應該為阿拉伯數字且從第1頁開始編碼。
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-頁碼篇 我們將進入論文整理WORD小技巧這一系列主題的最後一個部分-頁碼篇。頁碼的建置應該算是統計之外,客戶較常詢問的熱門問題之一,主要原因是學位論文中,論文內文所使用的頁碼為阿拉伯數字,但前面篇前的部分卻是使用羅馬數字,無論是針對哪一邊修改,會發現是整份WORD同時被更新,這是因為中間少了一個分節設定,來允許前後的文件可以保有不同的格式。
除了頁碼的教學外,目錄的編輯也是令某些人頭痛的問題,根據小編的經驗,有蠻多人是直接在目錄頁面中鍵入所有的標題文字,接著再自己去檢核每個標題所在的頁面之後,自己編輯目錄的頁碼,但當標題內容有修改,或是內容的增刪導致頁碼變更時,則需要人工再重新檢核頁碼,再更新到目錄頁中,除了會耗費文章編輯者大量的時間外,亦很容易出現錯誤的情形,因此小編在此頁碼篇中,一併將目錄的製作跟大家說明。
壹、分隔設定
1、建議先開啟顯示編輯標記,如此才有辦法看到像段落及分隔設定的標記,進而加以編輯。
2、在文件編輯中,『分頁符號』應該算是一個蠻常用的功能,可以強迫該頁的內容在此處停止,新的內容由下一個新頁面開始產生,此功能是在『版面配置』à『分隔設定』à第一個『分頁符號』,或是移動好游標位置後,直接以熱鍵『Ctrl+P』新增『分頁符號』。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
Power BI在2019的四大新趨勢 自從微軟推出Power BI Desktop之後,視覺化圖表的發展迅速普及,社群討論者也日益增多,而且商品化程度也愈來愈高,根據DataChant網站顯示(Gil Raviv, December 20, 2018),調查全球,有提供Power BI服務的顧問公司有92家,衍生出361項服務,平均價格為6,864美金。服務種類以Data analytics最多,其次為Data Platform、Application Development、Enterprise Resource Planning、Cloud CRM等等。這是一個非常振奮的消息,表示Power BI的應用已邁至成熟階段。
 
 
展望2019年,Power BI的幾項重大的發展,將對未來的推廣產生莫大助益: (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
如何評估預測模型的表現(第3篇,共3篇)~晨晰統計林星帆顧問整理 在前兩篇文章中,我們分別介紹了整體表現(overall performance)以及區別/鑑別(discrimination)的指標以及其使用上的限制。為了回答以下兩個臨床問題,即(1)新模式是否比舊模式更能預測結果變項/事件發生?或新模式的預測是否準確?(2)在新模式的預測之下,是否可以改變治療決策(medical decision)?分別要再採用校正/校準(calibration)以及風險重新分組(reclassification)此兩組指標。
(三)校正/校準(calibration)
Calibration的定義為:「模式預測值與實際觀察值之間的一致性」,換句話說,即經由模式所預測的值(或機率值)是否準確,這在預測模型的研究是非常重要的屬性。Calibration又稱作為適合度(goodness-of-fit),因為它用來衡量該預測模式是否正確估計發生事件的風險。
Calibration的常用指標分成兩類,一個是畫圖的方式,另一個則是統計檢定。首先介紹畫圖的方式,常見以散佈圖(scatter)或直條圖來呈現,下圖是Han(2016)的圖1,一般常見將預測值等分為十組(decile),X軸為預測機率值(譬如1000個人當中,預測機率值最低的100人的平均預測值)而Y軸為實際觀察值(譬如1000個人當中,預測機率值最低的100人的平均觀察值),45度線代表預測值恰好等於觀察值。點落在線的上方表示預測模式低估(較低的預測值或較低的發生率),反之則是高估。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
如何評估預測模型的表現(第2篇,共3篇) ~晨晰統計林星帆顧問整理 在前一篇文章中,我們介紹了整體表現(overall performance)的各項指標以及使用上的限制,在這篇文章中,我們繼續介紹區別/鑑別(discrimination)、校正/校準(calibration)以及風險重新分組(reclassification)此三組指標。
(二)區別/鑑別(discrimination)
區別/鑑別的常見指標的有2個,首先是最常見的Receiver Operating Characteristic(ROC)的曲線下面積(Area under the curve, AUC),而關於ROC的介紹與使用限制,我們已於過去文章介紹過,在此不再贅述。
第2個指標則是Discrimination slope,概念很簡單,就是比較實際發生事件者的平均預測機率(或預測值)與實際沒有發生事件者的平均預測機率(或預測值),一個完美模型的Discrimination slope最大值是1,不過倘若兩個族群的平均預測機率(或預測值)若無明顯重疊,就已經表示目前此模式已經非常具有鑑別力了。
下圖為Steyerberg(2010)的圖2A-2B,盒型圖左邊是良性腫瘤(沒有發生事件),右邊是惡性腫瘤(發生事件)。圖A是指舊模式,亦即不包括腫瘤標記LDH的模式,圖B是新模式,包括了LDH以及其他舊模式的解釋變項。由圖A可知兩個族群的預測機率仍有稍微重疊(實線為平均數,兩組相減為0.3),圖B顯示加上LDH之後,兩組的預測機率變得比較不重疊,Discrimination slope稍微較大,變成0.34。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
如何評估預測模型的表現(第1篇,共3篇) ~晨晰統計林星帆顧問整理 在各種類的醫學研究中,建立以及驗證一個有效的預測模型(prediction model)是很常見的,無論結果變項(outcome)是連續型、二元類別、計數變項或是存活資料,現在皆已有常規的迴歸分析方法,分別是線性迴歸、logistic迴歸、Poisson迴歸以及Cox比例危險模式(Cox proportional hazard model)。
舉例來說,目前已知數個心衰竭病人死亡率的預測模式,例如MAGGIC(https://www.mdcalc.com/maggic-risk-calculator-heart-failure)或Seattle Heart Failure Model(https://qxmd.com/calculate/calculator_203/seattle-heart-failure-model),假定我們在這些預測模型之下,提出一個(或多個)生物標記或是一組危險因子,我們想要證實加上這些生物標記/危險因子之後,我們的新模式會比原本模式更能預測死亡率。
然而如何評估這些預測模型的表現,目前存在著許多指標,可粗略分為傳統指標以及近15年內所發展的新指標。本系列文章旨在介紹這些新舊指標各別的涵義以及向讀者推薦數篇很值得閱讀的相關參考文獻。
首先,我們先將這些測量指標分類四大類,分別是(一)整體表現(overall performance)、(二)區別/鑑別(discrimination)、(三)校正/校準(calibration)以及(四)風險重新分組(reclassification),以下分別說明之。
(一)整體表現(overall performance) (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
設計超級Power BI企業損益表儀表版(Profit and Loss Statement Dashboard)—實作篇 筆者曾於另文中介紹一個企業損益表儀表版的範例,適合財務部門,進行財務績效管理。為了讓讀者可以嘗試自行製作,這裏介紹該儀表版重點表格(下圖紅框處)的製作方法。
 
企業損益表儀表版(註1)
Source:Enterprise DNA (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
晨晰統計2019年課程出爐囉!! 大家好,我們2019年統計課程的內容與時間已經出爐囉,請有需要的朋友可以提早報名,小班制不增班,讓我們一起歡喜學統計!
 
(繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
設計超級Power BI企業損益表儀表版(Profit and Loss Statement Dashboard)—功能篇 這是一個企業損益表儀表版的範例,從整個畫面來看,最大的一塊是中間一個密密麻麻數字,佔了一半面積的表格。對一般人來說,可能看了頭皮發麻,但對財務或會計人員來說,這表格可是一個百寶箱。因為這是一個可大可小,可任意切換時空,變換軌道的超級損益表。
首先,右上角有二組方塊按鈕。第一個,選擇比較指標(Select the comparison metric),有當年預算(vs Budget)與去年收支(vs Last Year)二個選項;第二個,選擇財務年度(Select a financial year),從2014(FY14)到2017(FY17)四個選項。
這二組方塊按鈕是關鍵。透過這二個按鈕的選擇,可以任意切換時間(FY,財務年度),轉換比較對象(當年預算Budget or 去年損益Last Year),有如小叮噹的時光機與任意門,可隨意呼叫出某年的實際收支與預算數字。
 
企業損益表儀表版(註1) (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
預測模型的新指標-IDI與NRI(第2篇,共2篇)~~晨晰統計林星帆顧問整理 在前兩篇文章中,我們介紹了曲線下面積(Area under the curve, AUC)與integrated discrimination improvement(IDI)的定義以及使用上的限制。為了回答此問題:「A這個生物標記或預測模型,所增加的預測能力若使用在臨床上,究竟是否可以改變治療決策?」,Pencina(2008)首次提出net reclassification improvement(NRI)這個指標以及展示它的統計檢定1。
在使用NRI之前,必須有個很重要的前提,亦即關於該事件的預測機率已有明確的風險分組。例如根據Third Adult Treatment Panel(ATP III)將10年冠心病的風險(10-year risk of coronary heart disease)明確分為3組:0%–6%、6%–20%及>20%,針對不同風險分組會有不同的治療決策,例如0-6%只要保持定期追蹤,6%–20%則是改變生活方式與藥物治療,而>20%則可能要接受更積極的監測與治療。
在Pencina(2008)的論文中,使用以下公式來說明NRI的組成。方程式4的pup,events表示分母為實際發生事件者,分子為新模式(相較於舊模式)正確增加發生事件者的預測機率,而且是提升了風險分組,例如從0-6%(舊模式)提升到6%–20%或>20%(新模式)都是屬於此類。方程式5的pdown,events表示分母為實際發生事件者,分子為新模式(相較於舊模式)錯誤減少發生事件者的預測機率,而且是降低了風險分組,例如6%–20%或>20%(舊模式)反而變成0-6%(新模式)都是屬於此類。我們當然希望pup,events越高越好(最大值是100%),而pdown,events越低越好(最小值是0%)。
方程式6的pup,nonevents表示分母為實際沒有發生事件者,分子為新模式(相較於舊模式)錯誤增加沒有發生事件者的預測機率,而且是上升了風險分組,例如0-6%(舊模式)變成6%–20%或>20%(新模式)都是屬於此類。方程式7的pdown,nonevents表示分母為實際沒有發生事件者,分子為新模式(相較於舊模式)正確減少沒有發生事件者的預測機率,而且是降低了風險分組,例如6%–20%或>20%(舊模式)變成0-6%(新模式)都是屬於此類。我們當然希望pdown,nonevents越高越好(最大值是100%),而pup,nonevents越低越好(最小值是0%)。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
預測模型的新指標-IDI與NRI(第1篇,共2篇)~~晨晰統計林星帆顧問整理 在之前文章中,我們提到了在以下幾種情況,過去常以Receiver Operating Characteristic(ROC)的曲線下面積(Area under the curve, AUC)作為主要的統計方法以及其限制1-2。
假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。
A的表現比已知的生物標記B更好(head to head comparison)
A+B的綜合表現比B單獨更好(nested model)
A加上baseline risk score之後,預測有增值效果(incremental value)
A加上baseline risk score比B加上baseline risk score(head to head comparison)
因此Nancy Cook博士於2007年提出風險重新分組(Clinical Risk Reclassification)的概念2,而Michael Pencina於2008年在醫學統計指標性期刊「Statistics in Medicine」正式提出另外兩種重要的指標,分別為net reclassification improvement(NRI)以及integrated discrimination improvement(IDI)3,且正式提出這兩個指標的統計檢定。
首先我們先介紹IDI,在Pencina(2008)論文中,使用以下公式來代表IDI的涵義。pnew,events指的是實際發生事件者在新模式的預測成為事件者機率(predicted ...
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-標題格式篇 在進行論文文字的撰寫時,可以先將固定會用到的格式先製訂出來,以免去要一直使用複製格式的功能,而且未來若需要修改某一個標題的樣式時,相同樣式的標題會同步修改,不用再逐一尋找,另外在進行目錄的編輯上也會變得簡單許多,之後會再與大家分享,以下先教大家如何增加樣式。
1、筆者的習慣,當打開WORD檔時,都會先到『常用』的à『樣式』欄位中,點選右下角的小圖示。
2、呼叫出來樣式的清單,可以知道目前這份WORD檔裡設定哪幾種格式,不過一份新的WORD檔,應該都和此畫面是相同的。
3、先在WORD檔中,打上自己可能用到的標題作為樣本,比較容易確認完成的樣子是否為自己需要的樣式。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
2018實證醫學學會參與心得         8月舉辦於嘉義長庚醫院的實證醫學年會,主題探討大數據、人工智慧對醫學研究與實證醫學的影響。會中由李友專院長淺談人工智慧的發展沿革,以及目前在醫學領域應用較為廣泛的人工智慧型態,例如:圖像判讀或分組、決策樹(decision tree)、人工神經網路(artificial neural network, ANN)、深度學習(deep learning)、機器學習(machine learning, ML)等。李院長的演講作為導言,以輕鬆詼諧的方式,簡單讓與會者像聽歷史故事一般接觸人工智慧的發展史,並從中帶出人工智慧在過去遭遇的挫折與困境 (例如硬體設備的計算效率不佳)。隨著科技時代的進步,電腦硬體與時俱進,形成現今人工智慧發展的優勢環境,足以支援更複雜演算法與更大量的資料點。
        李院長精彩的演說引人入勝,讓筆者會後更為好奇,人工智慧目前在醫學研究方面是如何被應用與執行的?以及人工智慧的基本概念有些什麼?故筆者搜尋了一些介紹人工智慧的網站,以及一些運用或探討人工智慧的醫學論文。
        以下先提供兩個基礎介紹的網站
GCP專門家 (https://blog.gcp.expert/ml-1-ai-ml-deep-learning-intro/)
STOCKFEEL 股感知識庫 (https://www.stockfeel.com.tw/%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7%E7%9A%84%E9%BB%83%E9%87%91%E5%B9%B4%E4%BB%A3%EF%BC%9A%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92/)
上述兩個網站都有概念式的基本介紹,以及應用於生活的豐富舉例,網站中也有系列文章可供進一步閱讀。
目前醫學較常見的應用為圖像判斷,以及利用不同演算法(algorithm)建構模型進行預測。利用機器學習建構模型所作的預測,會受到資料萃取方式與資料本身特性的影響,如同上述網站介紹中所言,它無法回答未知的事情。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
預測模型使用AUC的限制~~晨晰統計林星帆顧問整理 在臨床醫學研究中,常常會提出一個生物標記(Biomarker)可以預測特定事件的假設,例如以neutrophil gelatinase-associated lipocalin(NGAL)預測急性腎損傷(acute kidney injury, AKI),或是以B-type natriuretic peptide(BNP)預測心衰竭病人的再住院率。
通常此時會有比較的基準,假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。
A的表現比已知的生物標記B更好(head to head comparison)
A+B的綜合表現比B單獨更好(nested model)
A加上baseline risk score之後,預測有增值效果(incremental value)
A加上baseline risk score比B加上baseline risk score(head to head comparison)
而在過去的醫學文獻當中,在回答以上四個問題時,常常以Receiver Operating Characteristic(ROC)的曲線下面積(Area under the curve, AUC)作為主要的統計方法。例如A與B的AUC分別是88%跟85%,此時可以使用DeLong test檢定兩個曲線下面積的差異是否達統計顯著,倘若A的面積顯著大於B(P < 0.05),那麼作者則宣稱A的預測表現優於B。
然而讀者需要先瞭解到何謂AUC(又稱為C-index ...
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-表格篇(四) 陸、框線及網底
41、表格一般呈現的APA格式,基本上不太會有直線,最基本的三條橫線,上下兩端的橫線,以及標題列的分隔線。
42、不過通常剛完成的表格,表格中的每一條直橫線都應該存在這,此時利用框線及網底來調整。
43、選取整張表格並反白,或與步驟16相同。
44、在上方工具列選擇『設計』,找到『框線』裡的『框線及網底』。PS.在WORD 2007版時,將儲存格反白後點選右鍵,就可以看到『框線及網底』。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-表格篇(三) 肆、檢視格線
32、如果想在WORD檔中,想對文字進行對齊的工作,其實表格是一種輔助整理的很好的方式,只需要將格線隱藏起來,就看不來是用表格整理的了。以下圖為例,上方的文字是用表格對齊,而下方的文字則是插入空白進行對齊。
 
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
傾向分數配對後的相依統計方法~晨晰統計林星帆顧問整理 在觀察型研究當中,傾向分數分析(propensity score analysis)的使用,特別是傾向分數配對(propensity score matching)已經是非常普遍,這個部分可參見筆者在之前寫的文章(https://reurl.cc/qd8xg 以及  https://reurl.cc/V6Xr5)。關於傾向分數配對的技術與介紹,網路上已經有非常多資源(可參見筆者同事撰寫的一系列文章(https://reurl.cc/E7z3R、https://reurl.cc/WdL5D以及https://reurl.cc/O1qlv),但目前比較少人討論在傾向分數配對後的統計方法。
理論上,在同一個配對組合(matched pair)之下的實驗組與對照組(或暴露組與非暴露組),由於他們有很接近的傾向分數(成為實驗組/暴露組的機率),因此他們在用來計算傾向分數的基本屬性上(例如年齡、性別、共病等)也會比較相近,因此此時的實驗組與對照組不再是「獨立樣本」,而是具有相依性的配對樣本(paired sample)1。
傾向分數領域的大師Peter Austin於2011年發表的模擬研究1,以二元結果變項為例(dichotomous outcomes),模擬的結果指出使用配對統計方法的偏差會比較小,包括治療的選擇性偏差(treatment selection bias)或是混淆效果(confounding)。
以下表格是筆者整理的針對配對樣本(相依樣本),在各種條件之下的適用統計分析方法。
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
設計絕佳Power BI企業績效儀表版(Performance Dashboard)—實作篇 筆者曾於另文中介紹一個企業績效儀表版的範例,適合業務銷售部門,進行績效管理。為了讓讀者可以嘗試自行製作,特別挑出其中兩個圖塊,成長趨勢(Trends)、城市亮點(City Highlights),介紹製作方法。
企業績效儀表版(註1)
Source:Enterprise DNA
  (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:
論文整理WORD小技巧-表格篇(二) 貳、調整表格
15、想將設定為『自動調整成內容大小』的表格換成『自動調整成視窗大小』。
16、用滑鼠選取整張表格,或直接點圖上紅色框線的十字圖示即可選取。
17、點選右鍵,選擇『自動調整』à『自動調整成視窗大小』。
18、表格格式即可變更。 (繼續閱讀...)
另開連結前往 RSS 網站
分享社群:

瀏覽更多


載入中....