21.3 C
Taiwan
星期二, 17 3 月, 2026

罵越兇越聰明?研究證實 ChatGPT 被嗆後準確率狂飆 84%!

人工智慧要「兇」一點才聽話?賓夕法尼亞州立大學(Pennsylvania State University, PSU)最新研究顯示,對 ChatGPT 使用粗魯語氣下指令,反而能顯著提升回答準確度,最高可達 84.8%。這項結果顛覆一般人認為「禮貌有禮」才是良好互動的觀念,也為提示工程(Prompt Engineering)開啟全新思考方向。

研究團隊以 ChatGPT-4o 為測試對象,針對數學、科學、歷史三大領域設計出 50 道中高難度多選題,並將每題依據語氣不同改寫為五種版本,從「非常禮貌」到「非常粗魯」不等。經 ChatGPT 回答後,統計總共 250 組測試資料,最終結果令研究人員跌破眼鏡:

  • 非常粗魯語氣:準確率達 84.8%
  • 非常禮貌語氣:準確率為 80.8%
    顯示 ChatGPT 在面對「挑釁式」語氣時,表現反而更出色。

研究採用配對樣本 t 檢驗(Paired Sample t-Test)分析不同語氣下的統計顯著性,結果證實語氣確實影響模型輸出準確度。從「禮貌」到「中性」、再到「粗魯」,準確率呈現穩步上升趨勢;而「非常粗魯」語氣表現最佳,遠超過傳統認為應有助於理解的「客氣指令」。

研究人員指出,這一現象或許與大型語言模型(LLM)對「情感語氣」的隱性解讀有關。儘管 AI 並無情緒,但不同語言風格、措辭強度及句式結構,可能會影響模型的語義權重與推理機制。換句話說,ChatGPT 可能會把「強硬語氣」視為「高權重、明確指令」,因此更聚焦於任務本身,輸出結果也更精準。

事實上,這並非首次有業界人士提出類似觀察。Google 創辦人謝爾蓋.布林(Sergey Brin)早前在論壇上也曾半開玩笑地表示:「當你威脅模型,比如說『不聽話就綁起來』,它反而更聽話。」如今 PSU 的實證研究,讓這種「反直覺」現象首次獲得數據支持。

不過,研究同時提醒,用戶並非應該「辱罵 AI」來獲得更好答案。所謂「粗魯語氣」並非情緒發洩,而是提示語中包含更直接、命令式的結構,使模型更明確理解任務重點。真正的關鍵仍在於 提示設計(Prompt Engineering) 的精準度與邏輯性。

在過去多項研究中,學界已證實提示詞的語言結構、格式與上下文,是影響 LLM 輸出結果的主要變數。2024 年的研究曾指出,過度禮貌的指令可能讓模型傾向生成冗長或含糊的回答,降低任務專注度。此次 PSU 的結果再次印證:語氣是影響 AI 表現的重要潛在因素。

目前團隊仍在進一步分析「語氣—語義—準確率」之間的內在關聯,並計畫引入「困惑度」(Perplexity)等語言模型指標,探討情感化措辭是否改變模型對輸入文字的權重分配。研究者表示,這不僅有助於理解 LLM 的語言認知機制,也可能成為提升 AI 溝通效率的新突破口。

PSU 的這項研究向全球用戶提出了一個有趣問題:「你對 ChatGPT 太客氣了嗎? 在 AI 對話的時代,語氣不只是禮貌,更可能是影響智慧表現的隱藏變數。

本週熱文

專訪》從練習生到正式成員富邦悍將啦啦隊「維心」用堅持舞出亮眼舞台

在喧囂的球場上,有一道總是不斷閃閃發光的身影,那是「心心」——維心

王昱婷:2025年乙巳年己卯月流月分析

本月為乙卯月,桃花月,有關人際關係,感情相關的事物,都要特別注意。

卡滋脆皮豬新址開幕!金黃酥脆烤乳豬征服饕客味蕾

若有一道料理,能讓饕客一試成主顧,願意為之排隊,那非卡滋脆皮豬莫屬

《封面人物》許鞍華:五十年鏡頭人生,始終為人而拍

在華語電影版圖中,許鞍華始終是一個無法被忽略的名字。

啟英高中熱門音樂社聯手健行科大 跨校合作音樂盛會圓滿成功

第一首曲目《It’s my life》演出者。 左:鄭泳森同學、右:王紜婕同學。

 春季穿搭吹起梅粉風潮 苧麻襯衫成顯白又有質感的熱門單品

春季穿搭吹起梅粉風潮 苧麻襯衫成顯白又有質感的熱門單品受到許多女性消費者青睞。

《京洛再無佳人》傳啟動前期籌備 丞磊X王楚然再組CP掀話題

都市情感劇《京洛再無佳人》近日在網路上引發討論。

健康AI快速崛起 半年服務16萬人次 醫療現場迎來新挑戰

隨著生成式人工智慧快速進入醫療健康領域,越來越多民眾開始把AI當成「健康顧問」。

攻城獅再次展現團隊球風 以23分差大勝新北國王奪二連勝

新竹御嵿攻城獅對戰強敵新北國王最終以113:90擊敗新北國王,不僅收下主場二連勝,戰績排名也躍升至聯盟第三。

相關文章