Retro-Future Columnist

會議室裡的氣氛有時過於寂靜。 LLM給出越是完善的答案,沉默就越深;然而在實務判斷中,往往正是那難以言說的違和感,成為最後的安全防線。[2][5] 邏輯上看似無懈可擊,卻總感覺某些前提有偏差。 這份微妙的卡點,我們仍未充分口語化。[3][7] 如今正被問及,在AI時代的決策中,這樣的感受是否確實有其價值。

關於人類直覺的討論由來已久。Kahneman與Gary Klein整理指出,直覺不一定永遠正確,但在環境具有規律性、學習機會充分且反饋迅速的條件下,它是值得信賴的。[1][4][12] 老練的消防員與指揮官能比計算更快察覺危險,這種理解同源於此。[4][9] 關鍵在於,直覺並非神秘莫測,而是經驗累積後的迅速判斷。

然而,LLM不具備這種類型的經驗。 它可從大量文本中統計性連接下一個詞,但並無法以身體感知火場的熱氣或組織氛圍變化的瞬間。[8][9] 因此,答案雖流暢,判斷基礎卻與人類不同。 LLM語句越完善,我們越容易把“聽起來合理”與“經得起現實檢驗”混淆。[3][6] 作為衡量彼此距離的感覺,違和感的重要性不可輕忽。

2023年的研究顯示,即使面對附有說明的AI預測,人類仍會以自身直覺將其推翻。[2][11][13] 研究發現,直覺分為三條路徑:結果直覺、特徵直覺與AI極限直覺。[2][11] 換言之,人們非單純反射性拒絕AI,而是用不同感受去審視輸出內容、說明邏輯及模型侷限性。 AI添加說明並不代表能消除所有不安。[7][11]

此點在思考LLM輔助決策時尤為關鍵。 2024年的一篇綜述指出,將LLM用於決策時,不僅解釋能力,責任歸屬與心理因素亦扮演重要角色。[3] 換句話說,問題不止於“準確率高低”。 誰來承擔最終決定?人們在何處願意止步?解說究竟是撫慰還是激起懷疑?[3][7] LLM可提出答案,但不會自動設計使用制度。

可見,違和感非單純情緒,而是建立適當依賴關係的重要認知資源。 過度信AI的風險常被提及,反之,錯失應質疑AI時機的危險卻未受足夠重視。[7][11] 若組織採用LLM,卻剝奪人們說「有些不對勁」的空間,效率或提升,但糾錯迴路將變得脆弱。 沈默中前進的錯誤最難修正。[3][7]

當然,美化違和感也有風險。 正如Kahneman和Klein所論,直覺之所以有效,需在可學習且反饋可驗證的環境中。[1][10][12] 故針對LLM的不適感,不能只是主觀心情或成見,而應關聯到確認哪些前提存疑的具體程序。 將不安轉回事實核查、比較評估與責任分擔的流程至關重要。[3][7]

當前尚未明確界定的是,哪些業務領域中,人類的違和感實際能守護成果,哪些反增強了偏見與保守性。[3][7] 譬如醫療、金融、招聘及政策擬定等高度責任場合,AI解釋究竟能否助益判斷,抑或僅提供虛假的安心感,仍需長期觀察。[3][7] 目前需的,非快速定論,而是持續關注人在何種條件下推翻AI、何時忽視AI的視角。

隨著LLM愈發普及,我們將習慣答案的速度。 然而社會留存的不應只有速度,[3][7] 而是在前提出現小裂縫時,能細心傾聽的人類能力,以及如何於制度中保護這份感受。 違和感雖模糊,但正因其模糊,有時成為最後一道審核。[1][2][7] 未來應關注的不僅是模型的性能曲線,而是人類是否仍能在適當時刻說「等等」,這條神經迴路是否依舊活著。