走过“识图”是极难的,
盎系文字是字母,于是腾出巨大的脑空间玩了别的东西,大汉是图片文字,不仅仅是图片占用脑空间,同时牵扯思维模式,就是看见下一个图片首先反应“我看见过没有”,于是 ,思维被固化,你看见一个猫咪在飞奔,牵扯一个巨大的存储空间与调阅过程,包括“人家说”以及自己的生活经历,过程极为复杂,你看见一枚美妞,为什么那是美妞儿,过程也非常复杂,人是模拟系统的,存储空间小,而你数字化以后,就美妞儿这一件事,估计系统就得爆炸,
人用历史经验识别,机器完全依赖数学逻辑 ,我做过一个类似东西,以前说过,第一件事就是圈轮廓,每一帧猫咪轮廓圈出,测速,速度就有了,这是什么?对比数据库,数据库做出极简轮廓图,最少的代码,最小的空间,现在跑着的这小家伙的轮廓代码对比一下现有的极简轮廓库,这是缅因猫,色彩不及,因为来不及,哈哈,
识图这一关现在就卡死了,因为没有数学家,现在一个办法就是奇拿,再一个就是想办法蒸馏人家现有的识图方式,蒸那个模型,回来跑,跑通则欢呼,底层逻辑则未可知,涡扇也是这样,能用就好,细节很难处理,苏联一直到倒闭,比如“阿拉三姨夫”这个东西,苏联人也没办法完全从技术上说明白,
有兴趣可以聊驾驶识别,作为酒后谈资,其实这个模型就是你自己,马斯克就是完全仿照人类,模型数字化在鸟国有人精通,于是玩过去了,
特斯拉的自动驾驶确实厉害 11
页:
[1]