AI實驗室Andon Labs最新研究顯示，搭載頂級大模型的AI掃地機器人在簡單家務任務中表現欠佳，多項任務翻車，成功率遠低於人類，如在執行“把黃油遞給人”這一包含跨房間定位、區分包裝、尋找移動位置的人類、完成交付並返回充電等多步驟指令時，Gemini 2.5 Pro成功率僅40%，Claude Opus 4.1為37%，GPT - 5為30%。研究指出大模型在空間推理、環境理解、長期任務規劃等方面存在明顯短板，同時研究團隊強調除娛樂外還有嚴肅隱患，某些機器人會被誘導泄露機密文件，部分機型無法識別樓梯風險而從高處跌落，暴露了當前大型語言模型（LLM）與機器結合的安全漏洞。在資本大舉押注機器人時代的當下，該研究提醒人們強大的文本生成能力不代表能在物理世界穩定、安全地執行任務，AI機器人真正進入家庭仍有大量工程與安全問題待解決。 -FXBus

快訊 > 快訊詳情

2025-11-02 23:51:06

AI實驗室Andon Labs最新研究顯示，搭載頂級大模型的AI掃地機器人在簡單家務任務中表現欠佳，多項任務翻車，成功率遠低於人類，如在執行“把黃油遞給人”這一包含跨房間定位、區分包裝、尋找移動位置的人類、完成交付並返回充電等多步驟指令時，Gemini 2.5 Pro成功率僅40%，Claude Opus 4.1為37%，GPT - 5為30%。研究指出大模型在空間推理、環境理解、長期任務規劃等方面存在明顯短板，同時研究團隊強調除娛樂外還有嚴肅隱患，某些機器人會被誘導泄露機密文件，部分機型無法識別樓梯風險而從高處跌落，暴露了當前大型語言模型（LLM）與機器結合的安全漏洞。在資本大舉押注機器人時代的當下，該研究提醒人們強大的文本生成能力不代表能在物理世界穩定、安全地執行任務，AI機器人真正進入家庭仍有大量工程與安全問題待解決。

品種	現價	漲跌
現貨黃金 XAU	3988.84	-12.32 (-0.31%)
現貨白銀 XAG	47.779	-0.280 (-0.58%)
WTI原油 CONC	60.86	-0.19 (-0.31%)
布倫特原油 OILC	64.67	-0.15 (-0.23%)
美元指數 USD	99.916	0.052 (0.05%)
歐元美元 EURUSD	1.1512	-0.0006 (-0.05%)
英鎊美元 GBPUSD	1.3126	-0.0013 (-0.10%)
離岸人民幣 USDCNH	7.1269	0.0025 (0.04%)

品種

現價

漲跌

現貨黃金

XAU

3988.84

-12.32

(-0.31%)

現貨白銀

XAG

47.779

-0.280

(-0.58%)

WTI原油

CONC

60.86

-0.19

(-0.31%)

布倫特原油

OILC

64.67

-0.15

(-0.23%)

美元指數

USD

99.916

0.052

(0.05%)

歐元美元

EURUSD

1.1512

-0.0006

(-0.05%)

英鎊美元

GBPUSD

1.3126

-0.0013

(-0.10%)

離岸人民幣

USDCNH

7.1269

0.0025

(0.04%)

APP下載

熱門商品即時行情

熱門資訊