强如GPT-4o也在这个基础问题上犯蠢
本帖最后由 寂静回声 于 2024-9-26 15:59 编辑还是那个异步电机的磁极对数与同步转速的关系的计算公式
最下边显示此时的模型是4o
4o在强词夺理方面比国产通义大模型强,通义大模型在这块根本不解释。
关于公式的常数为什么是120,昨天问通义大模型也是这么解释的,怀疑它们使用了同一个训练数据集。
再问国产kimi,还是这个公式。
反正问来问去,4极电机的同步转速又变成了3000rpm
而解释公式中的常数为什么是120,kimi的回答居然与GPT-4o、通义大模型完全一样。
再问国外的Iask AI搜索,回答完全正确。
腾讯元宝大模型好歹给国产大模型挣回脸面,因为元宝AI也是像AI搜索,先搜索网页,后整理结果。
总结起来,目前答对的AI有国产的豆包、元宝、文心一言3.5,及国内国外的AI搜索们。
答错的如通义大模型、智谱大模型、星火大模型、kimi大模型,还有GPT-4o,它们的共同特点是前者成天说自己已经超越了后者,后者也宣称自己是全球第一。而且回答问题的用词竟然很相似,很难不让人怀疑是套壳了还是共用了一套训练数据集。
而o1没法测试,因为在GPT-plus中手动选择,而GPT-plus是每月200美元的付费版。虽然Claude 3.5 Sonnet各项评估号称指数力压Claude 3 Opus 和 GPT-4o,但Claude官网注册比较复杂还容易封号,所以海外的有钱人有兴趣的可以测试一下。
=============================
37大侠建议用英文提问,看看这帮大模型是否还那么中二?
通义大模型
智谱大模型
kimi大模型
星火大模型
minimax的海螺大模型
GPT-4o
不死心又问GPT-4o为什么常数是120啊,人家还叭叭解释一通呢。
照这趋势,以后科学常识真是黑白颠倒啊。
天花板大侠,建议你用英文测试一下。
因为他们训练肯定是用中文资料的,简中网内容简直事泥沙聚下,
所以训练出来的AI水平也不行,正常。
我常用的是直接英文提问,回答结果基本上都很满意。
或者您用简中问,要求它用英文答,试试看,效果肯定比简中回答要好。
页:
[1]