亞里斯多德。圖片來源:維基百科 |
「常識」這個詞常常出現在我們的對話中,通常我們把這個詞定義為「大家都應該要知道的事」。所以,當有人說出了你認定的常識相抵觸的看法時,你就會說:「你怎麼那麼沒常識!」
但是,到底什麼樣的知識才是常識呢?
事實上,儘管「常識」這個概念在日常對話、政治辯論和人工智慧評估中頻繁被提及,但對於何謂常識的本質特性以及其在人群間的共同程度,卻鮮少有實證性的描述。
最近的一項研究,研究團隊首先定義了個別言論和人的常識性,即人們對某一言論的一致同意程度以及他們對彼此同意程度的認識。接著,研究團隊將常識的共通性定義為一個雙邊信念圖中的派系檢測問題,其中pq常識被定義為人群中一定比例p的人共享某一比例q的言論。
研究團隊招募了2046名亞馬遜Mechanical Turk的工作者,每位評估者對來自研究團隊整理的主張中隨機選取的50個進行評估。參與者回答他們是否同意某個主張,以及他們認為大多數人是否會同意該主張。他們還需在強制選擇問題中說明他們對這些回應的理由,最後被問及他們是否認為該主張是常識。總共4407個主張被平均23.44位不同的個體評估,總共生成了102300個評估 。
研究發現常識性最符合那些關於日常物理現實的明確陳述式事實。所謂的「日常物理現實的明確陳述式事實」包括客觀現實的經驗性陳述,例如「三角形的三個角之和等於180度」、「整體大於部分」、「每個效果都有其原因」以及「太陽將在明天升起」。這些陳述被認為是大多數人都會同意的事實,因此具有高度的常識性 。
有意思的是,有些問題可能我們會以為是常識,但是在這次的測試中卻發現不見得,如「數字不會說謊,我們應該總是相信數學」、「電池不能永遠提供能量」、「所有人類生而平等」、「避免和生病的人密切接觸」。
此外,社會感知度等心理測量屬性會影響個人的常識,但令人驚訝的是,年齡、性別等人口統計因素卻不會。
研究團隊使用了兩種心理測試,其中包括讀心眼測試(Reading the Mind in the Eyes, RME),這個測試旨在透過測試個體對他人情緒狀態的理解能力來衡量社會感知度或「智力」。另一種心理測試是認知反思測試(Cognitive Reflection Test, CRT)。這項測試被認為是用來衡量個體超越直覺反應,運用更高層次推理的能力。
研究團隊發現,與人口統計變量不同,這些心理測量屬性在某種程度上能夠預測個人的常識性。具體來說,RME測試表現出較強的預測力,這意味著個體的社會感知度與他們對於何為常識的認知有關聯。
最後研究團隊總結,集體常識是罕見的:最多只有一小部分人對超過少數言論達成一致同意。
這些結果強調了對於常識的普遍性信念的局限性,並引發了關於其變異性的問題,這對於人類智慧和人工智慧都是相關的。研究通過介紹這個新框架並展示其應用,希望能解決對於常識的量化這一困境,並為社會科學和人工智慧領域提供有用的見解。
參考文獻:
Whiting ME, Watts DJ. A framework for quantifying individual and collective common sense. Proc Natl Acad Sci U S A. 2024 Jan 23;121(4):e2309535121. doi: 10.1073/pnas.2309535121. Epub 2024 Jan 16. PMID: 38227650.
沒有留言:
張貼留言