07月17日最新时讯 AI答不出9.11和9.8谁大大模型小学数学集体翻车

2024-07-17 20:58:06

导读近期发生了一件有趣的事情，关于一个看似简单的数学比较问题，却让不少高级人工智能模型遭遇了“滑铁卢”。这个问题是判断9.11与9.8哪个数...

近期发生了一件有趣的事情，关于一个看似简单的数学比较问题，却让不少高级人工智能模型遭遇了“滑铁卢”。这个问题是判断9.11与9.8哪个数字更大。在7月17日的一次测试中，共有13个当前主流的人工智能模型接受了这个挑战。测试结果显示，阿里通义千问、百度文心一言、Minimax、腾讯元宝、科大讯飞星火以及智谱清言和百川智能的百小应答对了这道题目。然而，ChatGPT-4o、字节豆包、月之暗面kimi、零一万物万知、阶跃星辰跃问及商汤商量则给出了错误答案。