寂静回声 发表于 4 天前

豆包P图 秒变恐怖片

https://s3.bmp.ovh/2026/06/04/mgn3qNKr.jpg

https://s3.bmp.ovh/2026/06/04/ez6I9ma0.jpg
https://s3.bmp.ovh/2026/06/04/2tL3L7QS.jpg
https://s3.bmp.ovh/2026/06/04/nPQfIsLP.jpg
有人拿了根冬虫夏草问豆包,结果豆包说这是油条

https://s3.bmp.ovh/2026/06/04/f9WrAi5m.jpg
https://s3.bmp.ovh/2026/06/04/tGlgfAZb.jpg
https://s3.bmp.ovh/2026/06/04/X6thG0S4.jpg
https://s3.bmp.ovh/2026/06/04/ID4onUzm.jpg
https://s3.bmp.ovh/2026/06/04/lqlrvpXg.jpg
https://s3.bmp.ovh/2026/06/04/CVjSuj5a.jpg
这就是豆包文生图模型的根源,文本基础理解力差。
因为文生图模型本质是由三个组件即,文本编码、图像编码、图像解码组成。
其中文本编码就是文本大模型的阉割版,相当于比豆包快速模式还差的版本,那还能干活啊。
页: [1]
查看完整版本: 豆包P图 秒变恐怖片