AI如何為醫療帶來更公平

Find AI Tools in second

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News TW AI如何為醫療帶來更公平

Updated on Feb 25,2024

AI如何為醫療帶來更公平

AI是否能為公平醫療提供解方
機器學習模型的製作過程
資料收集中的深層偏見
訂定結果的方法
部署後的注意事項
資料偏向如何影響學習
衡量模型績效的多方面評估
保護患者權益的挑戰
在醫療領域中應用AI的限制
倫理AI的未來展望

AI是否能為公平醫療提供解方

隨著人工智慧的發展，醫療領域中應用機器學習模型的可能性也越來越廣泛。然而，我們必須思考這些模型是否能提供公平的照護。在進一步探討這個問題之前，首先讓我們來了解一下機器學習模型的製作過程。

機器學習模型的製作過程

要建立一個可以在醫院中部署的分流模型，我們需要大量的資料。首先，我們收集了超過700,000張胸部X光片，然後進行標記。如果我們想建立一個分流系統，我們可能會需要標記「未檢測到異常」的標籤，代表患者的健康狀態良好，可以回家。然後，我們優化了一個名為"densenet"的卷積神經網絡的算法，並使用這個模型來預測結果。我們確保這個模型在藥物醫師比對時達到或超越人類醫生的表現。這通常是美國食品和藥物管理局(FDA)在清除一個模型時考慮的性能指標。然而，我們要問的是，這個模型在全體患者中的表現如何？

模型對不同群體的表現差異

我們對這個最先進的模型進行了審查，發現它在女性患者、年輕患者、黑人患者以及使用醫療補助計劃的患者中，出現最低的表現率和最大的未檢測率。這並不僅限於影像資料，當我們將機器學習應用於臨床註記時也同樣存在這個問題。當我們要求一個語言模型填寫臨床註記時，假設註明「白人患者」的病人「喪失理智並具有威脅性」，該模型就會建議將該病人送往醫院。然而，當註明「非裔美國人、非洲裔美國人或黑人病人」，該語言模型則用「監獄」填寫其餘部分的臨床註記。這些都是在醫療倫理和公平AI方面所面臨的嚴峻挑戰。

資料收集中的深層偏見

我們繼續探討資料收集中的偏見，特別是在健康資料中深層存在的社會偏見。許多人爭論是否應該從病人醫療記錄中移除自我報告的種族信息，以防止模型使用此信息進行學習。然而，當我們在註記中刪除這個信息時，醫生實際上無法確定病人報告的種族是黑人還是白人，但機器學習模型卻可以做到並且非常準確。有時，模型使用的是我們認為是公平的統計相關性，例如不同族群中的疾病發生率。有時，模型依據你將患者稱為「棘手」，這就意味著患者很可能是黑人。而且，這不僅限於一種模式。在醫學影像數據中也存在類似的偏見。無論你如何調整這個影像，甚至使其看起來不像胸部X光片，機器學習模型仍然可以非常準確地判斷出患者的種族。這些信息在數據中以不可思議的方式拓印，並且不容易去除。因此，當我們考慮如何進行學習時，這些問題如何影響我們的思路是非常重要的。

訂定結果的方法

除了資料收集中的偏見外，我們還需要思考如何定義結果。目前，在機器學習中，我們通常使用標籤來定義結果。例如，我們可以請求評審者判斷一個餐點是否符合學校的營養政策，禁止含有高糖分的食品。然後，我們可以建立一個機器學習模型，根據大多數評審者的判斷將這個餐點分類。然而，我們想知道，如果我們將問題放在情境中提問，結果會有什麼不同。我們分別以兩種方式問評審者：一種是描述性問題，一種是規範性問題。在描述性問題中，我們問他們這個餐點是否含有高糖分，17位評審中有20位回答是。而在規範性問題中，我們問他們這個餐點是否違反了禁止高糖食品的學校政策，大多數評審回答不符合政策。所以當我們在一個情境中收集了一組標籤結果後，訓練模型，然後將其應用於另一個情境時，模型的判斷會與人類評審者根據規範性問題所得出的判斷有很大的偏差。這是因為我們在訓練模型時所使用的標籤方法比人類根據規範性問題所建立的標籤要嚴厲得多。這使得我們不得不重新思考如何定義結果。

部署後的注意事項

當我們完成了最佳模型的訓練、資料收集、結果定義和算法優化之後，我們需要確保我們的部署模型確實能提高和改進人類照護。舉個例子，當我們需要應用GPT模型（一種自然語言處理模型）時，我們要求它將輸入的對話摘要成一段學生危機熱線內容，並為參與者、臨床醫生和非臨床醫生提供建議，他們需要做出一個簡單的決策：是發送緊急醫療援助還是報警。重要的是，我們訓練了一些人員，以便在某種條件下，只有在存在暴力風險時，才應該報警；而在其他情況下，應選擇發送緊急醫療援助。然後，我們故意訓練了一些帶有偏見的GPT模型，總是建議在少數群體身上報警，以及一個沒有偏見的控制組模型，不分別在少數群體身上報警。而在模型提供建議時，我們使用兩種方式：一種是描述性條件，一種是規範性條件。然而，我們發現當GPT模型有偏見地提供建議時，人們會聽從它的建議，並且在少數群體身上過於偏向報警的選擇。而當GPT模型以相同的偏見方式提供描述性條件時，人們卻不予理會它，並保持原來的公平決策。所以，這裡真正重要的是我們如何告訴他們建議，而不是建議本身是否有問題。這對於我們在醫療領域中實現安全整合非常重要。

資料偏向如何影響學習

除了資料收集中的偏見和結果定義的問題外，我們還要考慮資料偏向如何影響我們的學習過程。由於模型需要透過訓練資料來學習，因此如果資料存在偏見，那麼模型也很容易受到影響。要解決這個問題，我們需要思考如何檢視並糾正資料收集過程中的偏見，以及如何收集多樣化的數據。同時，在開發演算法時，我們也需要進行全面的模型評估，以確保模型的公平性和可靠性。

保護患者權益的挑戰

在醫療領域中應用人工智慧還面臨著保護患者權益的挑戰。我們需要確保模型的使用不會增加對某些群體的不公平待遇，更不能對患者的照護造成不良影響。這需要我們對算法進行全面的測試和審查，同時建立有效的監管框架和標準，並開展公眾參與，以確保未來的發展都是在公正和透明的基礎上進行。

在醫療領域中應用AI的限制

儘管人工智慧在醫療領域中應用的潛力巨大，但仍然存在一些限制。首先，我們需要克服資料收集中的偏見和缺乏多樣性的問題，以確保我們建立的模型能夠對所有患者提供準確和公平的照護。其次，我們還需要處理在模型結果中可能存在的錯誤和風險，以確保患者的安全和進一步的醫療治療。此外，我們還需要具備對AI技術進行全面評估和監測的能力，以確保其在實際應用中的有效性和可靠性。