强如GPT-4o也在这个基础问题上犯蠢

寂静回声 · 发表于 2024-9-26 13:35:23

本帖最后由寂静回声于 2024-9-26 15:59 编辑

还是那个异步电机的磁极对数与同步转速的关系的计算公式

最下边显示此时的模型是4o

4o在强词夺理方面比国产通义大模型强，通义大模型在这块根本不解释。

关于公式的常数为什么是120，昨天问通义大模型也是这么解释的，怀疑它们使用了同一个训练数据集。

再问国产kimi，还是这个公式。

反正问来问去，4极电机的同步转速又变成了3000rpm

而解释公式中的常数为什么是120，kimi的回答居然与GPT-4o、通义大模型完全一样。

再问国外的Iask AI搜索，回答完全正确。

腾讯元宝大模型好歹给国产大模型挣回脸面，因为元宝AI也是像AI搜索，先搜索网页，后整理结果。
总结起来，目前答对的AI有国产的豆包、元宝、文心一言3.5，及国内国外的AI搜索们。
答错的如通义大模型、智谱大模型、星火大模型、kimi大模型，还有GPT-4o，它们的共同特点是前者成天说自己已经超越了后者，后者也宣称自己是全球第一。而且回答问题的用词竟然很相似，很难不让人怀疑是套壳了还是共用了一套训练数据集。
而o1没法测试，因为在GPT-plus中手动选择，而GPT-plus是每月200美元的付费版。虽然Claude 3.5 Sonnet各项评估号称指数力压Claude 3 Opus 和 GPT-4o，但Claude官网注册比较复杂还容易封号，所以海外的有钱人有兴趣的可以测试一下。
=============================
37大侠建议用英文提问，看看这帮大模型是否还那么中二？

通义大模型

智谱大模型

kimi大模型

星火大模型

minimax的海螺大模型

GPT-4o

不死心又问GPT-4o为什么常数是120啊，人家还叭叭解释一通呢。
照这趋势，以后科学常识真是黑白颠倒啊。

373527271 · 发表于 2024-9-26 13:40:42

天花板大侠，建议你用英文测试一下。
因为他们训练肯定是用中文资料的，简中网内容简直事泥沙聚下，
所以训练出来的AI水平也不行，正常。
我常用的是直接英文提问，回答结果基本上都很满意。
或者您用简中问，要求它用英文答，试试看，效果肯定比简中回答要好。

		自动登录	找回密码
密码			立即注册

强如GPT-4o也在这个基础问题上犯蠢

本帖子中包含更多资源

点评

浏览过的版块