快訊 > 快訊詳情
2025-11-02 23:51:06
AI實驗室Andon Labs最新研究顯示,搭載頂級大模型的AI掃地機器人在簡單家務任務中表現欠佳,多項任務翻車,成功率遠低於人類,如在執行“把黃油遞給人”這一包含跨房間定位、區分包裝、尋找移動位置的人類、完成交付並返回充電等多步驟指令時,Gemini 2.5 Pro成功率僅40%,Claude Opus 4.1為37%,GPT - 5為30%。研究指出大模型在空間推理、環境理解、長期任務規劃等方面存在明顯短板,同時研究團隊強調除娛樂外還有嚴肅隱患,某些機器人會被誘導泄露機密文件,部分機型無法識別樓梯風險而從高處跌落,暴露了當前大型語言模型(LLM)與機器結合的安全漏洞。在資本大舉押注機器人時代的當下,該研究提醒人們強大的文本生成能力不代表能在物理世界穩定、安全地執行任務,AI機器人真正進入家庭仍有大量工程與安全問題待解決。