上次是在 2018 年,写了一篇文章叫做《瞎说人工智能》,见 这里,回顾了一下人工智能的历史,然后谈了下看法。那时正是 alphago 战胜李世石之后两年,但是本身来讲,我到现在依然认为 alphago 的胜利是摩尔定律的胜利,本身的理论并没有特别的进步,因为算力持续增长,导致之前无法在可接受时间计算出来的东西到了可以计算的时候。那时我预言,真正困难的部分路还很长,本身结合几次火热的人工智能历史来看,应该有一些道理。但是没想到现在才过去不到 10 年,人工智能的发展已经到了一个完全无法预料和繁花似锦的地步了。现在看来,预言就是用来打脸的。如果预言都对了,那该多么无趣。

事情的起因

人工智能之前一直分为数据派和推理派,数据派主要利用大量的数据训练,以隐 Markov 模型作为主要底层模型,寻找数据中的相关性,然后通过相关性和概率大小来做一些决策和预测任务。常见的翻译,语音,自然语言,人脸识别等都是这个思路,这也是之前人工智能应用过程中最有用的应用。虽然这些应用的准确性一般在 90% 以上,但是部署后也能大大提升一些效率,例如现在停车场的车牌识别,机场等地方的人脸识别等。其中还有一派是神经网络,通过多层网络做数据拟合从而做分类等任务,深度学习其实也是神经网络,只是网络层数更多,参数更多。图像识别有个竞赛,长久以来,前几名都被基于深度学习的框架所包揽。经常见到提出一个更深的网络,获得了更好的结果的新闻。但我一直以为,这个所谓进步,可能也无法大规模应用。直到 ChatGPT 横空出世。

应该是在 2022 年底,看到漫天出现 ChatGPT 这样的新闻,好奇就去试了下。实话说,非常惊艳,我记得在此之前,其他的人工智能工具,不说能如此流畅的对话,输出经常会不知所云七零八落。而 ChatGPT 还真像一个人,说话流畅,理解到位,跟此前所谓人工智能工具完全不是一回事。那时心态其实也还挺淡定,这类工具有其天然的边界,因为训练的语料关系,其智商相当于人类写作者均值。而且那时候,也就只有文字能正常生成,图像,视频,代码等都不太好。而更好的应用方向,应该是垂直领域的 GPT 类产品。

迅猛的发展

从 GPT 出现起,这种大模型就火起来了。一方面媒体拼命鼓吹,奇点就要来了,AGI 就要实现了。看起来仿佛又回到了历史,人工智能大火的时候。媒体先下场,然后是投资,然后是多年没进展,然后就又冷了。本来我以为,又会是这样的一个循环。

不过从那时起,几乎各大企业都开始了这个领域,还整出了一个榜单,各种解读,使用等文章层出不穷。榜单也开始一轮轮更替。谷歌,Meta,国内的字节,阿里,腾讯等纷纷推出各自的模型。而模型开源也是一项轰轰烈烈的运动,很快就出现了 ollama 等工具,huggingface 等平台,下载,部署,尝试大模型成本降到最低。 而相应的,模型效果越来愈好,功能越来越多,而同等效果的模型,尺寸也越来越小。

很快也出现了专门面向各个领域的大模型,例如专注于编程的 Claude,长期霸占编程的榜单,然后就是图片生成,视频生成等等等等。然后做 OCR, 做 tts, 等等的专门大模型也层出不穷。这项运动,就如同学武打通了任督二脉,各种招式,内力都一通百通,蓬勃发展。最近更是到了,一天不关注,就可能冒出一个新模型,新使用方式,能极大的在某个领域获得亮眼的效果,跟都跟不上。

有时有些惶恐,世界变化这么快,会不会跟不上?有时又有些庆幸,感谢这个时代,我们能见识这么多的进步与活力。

如何去适应

拥抱 AI,适应 AI 应该是接下来很长时间的主题。且不说图灵测试,Winograd 测试等都被大模型很快的解决。虽然在一些刁钻的领域,一些问题大模型还无法解决。但是在常见的很多领域,大模型 AI 已经成了先进生产力了。现在看到的图片,看到的文章,可能都有非常多 AI 的痕迹,而且有些甚至还无从分辨。所以只能大力去适应了。

其实世界这么多年的发展一直是效率的发展,而在一些任务上,只要 AI 能提升效率,就是值得去做的。确定,简单的工作,例如明确的编程任务,一些大模型能比人完成更好,那就放心交给他去做,人们做好审核就好。一些繁复的流程,有工具来简化,连接各种 AI,那就小心的测试,搭建后,放心的交给 AI 去做就是。而那些幻觉大的领域,就最多拿 AI 来做个参考,也不会有大问题。

另一方面,也无需焦虑,虽然大模型相关工具层出不穷,也不要一直一直的去追求,而是真要把工具按照自己节奏用起来,如果完成同样的一件事情,今天能比昨天提升一些效率,其实就够了。没必要说新出了一个什么工具,又没学会,就会如何如何。其实世界是有巨大的惯性的,能真心投入实践一些新的东西,就可能已经超过大多数人了。

英国科幻作家道格拉斯亚当斯说过一个经典的“三个任何”:

1)任何在我出生时已经有的科技都是稀松平常的世界本来秩序的一部分。 2)任何在我15-35岁之间诞生的科技都是将会改变世界的革命性产物。 3)任何在我35岁之后诞生的科技都是违反自然规律要遭天谴的

而另一个英国科幻作家,阿瑟克拉克也有个三定律:

定律一:如果一个年高德劭的杰出科学家说,某件事情是可能的,那他几乎就是正确的;但如果他说,某件事情是不可能的,那他很可能是错误的; 定律二:要发现某件事情是否可能的界限,唯一的途径是跨越这个界限,从可能跑到不可能中去; 定律三:在任何一项足够先进的技术和魔法之间,我们无法做出区分。

我们正生活在一个这样的世界,科技也在扮演着魔法的角色,如果今天的我穿越到了2018年,告诉我自己说,现在我们可以直接用文字就生成一段精美的符合主题的视频,我无论如何也会认为这个是妄想。但是那又如何呢?科技的发展不会随着某个人的认识就停滞,一些著名科幻作家想象的世界正在逐步实现,那就放开想象,充分享受吧。永远充满好奇心,永远保持勇气。