打印页面

首页 > 深度 第二次认知革命的火花

第二次认知革命的火花

本文来自微信公众号: 经观书评 ,作者:吴靖


AI进入日常生活与工作,既是巨大的挑战,也是前所未有的契机。只有真正理解并拥抱这一趋势,以积极的姿态与AI共舞,重新审视教育的理念和目标,人类才能超越固有的认知边界,更深刻地重新定义和激发自身独特的认知优势,彰显生命与文明的意义。或许,这才是AI真正馈赠给人类的礼物。

按照以色列历史学家尤瓦尔·赫拉利在《人类简史》中的著名观点,人类文明在漫长的演化历程中先后经历了三次影响深远的革命,分别是认知革命(约7万年前)、农业革命(约1.2万年前)和科学革命(约500年前,即十六世纪末十七世纪初)。追根溯源,火的发现以及随之而来的大脑扩容,导致了工具的发明和使用,乃至语言的创造——人类得以相互交流,甚至编织故事,去想象那些不存在的事物。这就是为何智人能战胜尼安德特人等其他人类的重要原因,因为只有智人经历了惊天地、泣鬼神的认知革命,这为后来的两次重大革命奠定了关键的认知基础。


如今,我们发现赫拉利的宏大叙事仍然不够宏大,或许我们可以从更为宽广而长远的视角去审视一切,那便是发生在地球上的三次智能跃迁,它们定义了我们是谁。第一次跃迁发生在大约38亿年前,在黑暗的深海中,无机体在某个电光石火间奇迹般地拼凑出有机体,链式化学反应第一次点燃了生命的火焰。


在随后的亿万年间,从单细胞到多细胞,从海洋到陆地,这些微小的生命体不断适应、复制和演化;直到320万年前,在东非大裂谷的一片由森林退化而成的草原上,一个特殊的灵长类拿着工具遥望远方,眼神中第一次闪过智慧的光芒,她的后代逐渐超越生存的本能,学会了计划、思考和创造。后来,他们自称为“人类”,自诩为“万物的尺度”。


公元2022年11月30日,硅谷一家名为OpenAI的人工智能研究公司上线了一个基于人工神经网络的对话程序ChatGPT,第一个真正意义上的通用人工智能(AGI)火花降临于世。人类以自身智能为模板,创造出了超越自身的事物。过去的3年间,越来越多的有识之士意识到这一事件的重大历史意义——AGI不依赖碳基生命的脆弱框架,它的存续不再受限于衰老、疾病和死亡,它的智能可以无限扩展。


以上三次智能跃迁,乃是刘嘉教授在《通用人工智能》一书的开篇向我们展示的全新认知图景。人的一生中,极少有机会亲身经历一场历千万世而难遇的重大范式转变——这意味着认知、教育和生存方式的重构。而此刻,我们正站在这样一个特殊的历史节点上。


《通用人工智能》


刘嘉∣著


中信出版集团


2025年6月


是的,我们全人类正处在第二次认知革命的黎明,而AGI正是点燃暗夜的火花。电视剧《漫长的季节》中反复出现的那四句诗行,用来形容当下的人们面对AGI时的懵懂状态,再合适不过了。


AGI的第三条道路


如果将人类的两次认知革命连贯起来看,我们会惊恐地发现人可能只是智能进化链条中的一环。或许,我们终将被自己创造的事物所超越。在探索AGI的伟大征程中,曾经摆在人类面前的有三条道路,分别是模拟行为(强化学习)、模拟神经(计算神经科学)和模拟认知(自然语言处理)。从二十世纪八十年代以来,前两条路都遭遇了难以逾越的壁垒,前者只能捕捉外在表现,但并不理解“目的地”的意义;而后者虽能精确地模拟神经元的放电,却无法解释情感与意识如何从这些电活动中涌现。


最终,人们开辟了第三条道路,即从介于神经元放电和外在行为之间的思想或思维入手,聚焦到塑造和表达思想的媒介——语言,正如哲学家维特根斯坦在《逻辑哲学论》(1921)中提出的著名论断:“语言的边界就是世界的边界。”2015年,一篇具有里程碑意义的综述性文章《深度学习》(这篇文章的三位作者杨立昆、约书亚·本吉奥、杰弗里·辛顿获得2018年图灵奖)明确指出,深度学习的下一个前沿课题是自然语言理解。


2024年3月14日,OpenAI发布了具有划时代意义的大语言模型GPT-4,其具备强大的理解和生成能力,能进行复杂的推理,并在各项任务中表现优异,被业内人士誉为“AGI的火花”。


在刘嘉教授看来,人工智能是人类以自身智能为模板创建的。因此,从考古学和人类学的角度去破解人类智能演化的奥秘,也许能帮助我们理解人工智能发展的道路,尤其是最终走上自然语言处理和语言大模型构建这条路。


大约700万年—500万年前,人类与猩猩的祖先分道扬镳,开始独立进化。在漫长的进化之路上,古人类留下的痕迹乏善可陈——他们制造的工具单一,社交局限于小规模的亲缘群体,且缺乏长期规划和象征性思维。然而,在距今10万年—7万年前,人类犹如被仙人抚顶,其认知和行为模式突然加速进化,人类从单纯适应环境的生存者,华丽转身成为主动创造和改变世界的发明者。这一伟大转折,被人类学家称为“第一次认知革命”。


这场认知革命的背后,乃是人类思维模式的根本性变化。人类的地位从依赖于环境中的即时刺激和长期习得的经验所养成的直接经验型思维,开始转向假设推理型思维,即在能够实际制造工具前,先在大脑中构思并模拟可能的结果。正是这一转变,让人类跳出了食物链,而成为这个世界的主宰。


在此,刘嘉教授指出,在这之前的300万年并非垃圾时间,而是一点点壮大了成就智能的物质基础——大脑。在此期间,人类大脑的体积增加了近3倍,远远超过了其他器官的演化速度。这一关键性演化的直接结果就是大脑算力的极大提升,这也解释了为何现代人类大脑仅占体重的2%,却消耗着超过20%的身体能量。


是的,我们不能指望只有302个神经元的线虫学会人类的语言,同样也不能指望脑容量只有600毫升的能人(智人的脑容量为1400-1600毫升)能制造出脱离地球引力的飞船。作为复杂系统的大脑,当神经元数量和交互作用达到一定程度后,就会出现意识、思维和能力的突然涌现。


2022年6月,OpenAI发表了一篇划时代的论文《大预言模型的涌现能力》,其中挑战了人工智能领域能力增长的线性假设,指出某些复杂能力不会随着模型规模的平滑增长而逐步显现,而是在达到某个临界点后发生“非线性跃迁”,导致能力的突然涌现。有趣的是,这些能力不只是智商层面,也包括情商。在一项特定场景中个体的情绪体验测试中,GPT-4在识别人类复杂情绪时表现优异,成绩超过了90%的人的情商。


不难想象,很多人至今难以相信,智能的第一性原理竟然是“大即是好”(曾几何时,“小的是美好的”理念一度风靡全球),而非精妙的算法或灵巧的设计。简言之,更大规模的模型总是能更好地逼近最优解。当神经网络的参数从10亿扩展到1000亿时,就像一本小说字典变成一座图书馆,不仅能记住更多的信息,还能学会更复杂的模式和推理方式,这正是涌现背后的机制。


对此,刘嘉教授写道:“辛顿在推特上发文说:‘从GPT-3出色的性能可以推断,生命、宇宙和万物的答案不过是4.398万亿参数而已’。是不是4.398万亿参数不重要,重要的是辛顿所表达的理念:‘智能不够,参数来凑’。”


大模型进化与时代转型


或许有人要问,尼安德特人的大脑容量平均为1500毫升,个别甚至接近1700毫升,比现代智人的大脑容量总体上略大。为什么反而是智人全面战胜了尼安德特人?事实上,认知水平并不单一取决于大脑容量,还由脑组织结构和连接方式的精细程度决定。


考古研究表明,尼安德特人的前额叶区域相对平坦,比现代智人的前额叶略小或结构不够精细,而这正是著名认知心理学家丹尼尔·卡尼曼所谓的“慢思维”的神经中枢之一。面对复杂问题和开放环境,尼安德特人更倾向于本能反应,即“快思维”,这导致他们在复杂语言与抽象沟通、战略思维、象征思维、技术创新等关键领域全面落后于智人,这被普遍认为是尼安德特人灭绝的重要原因之一。


马克·吐温曾说:“历史不会重复,但总会押韵”。如今,大模型领域正在经历着一场极为相似的进化。2025年2月27日,OpenAI发布了GPT-4的升级版——GPT-4.5,尽管未公布其参数量,但外界普遍猜测超过前者的1.8万亿个。它在理解用户意图方面表现出色,特别适合需要创造力和共情的任务,被称为“文科生”的巅峰,甚至被认为“已经接近AGI”。


不过,巅峰同时意味着终点。OpenAI宣称GPT-4.5是最后一个非推理型对话大模型。事实上,大模型一直经历着双轨进化路线:对话型和推理型,前者以蜚声世界的GPT为代表,后者则是2023年OpenAI开辟的一条全新进化路线——基于思维链的推理大模型,如o1、o3系列。两者绝非对立,而是高度相辅相成。当对话型大模型发展到前所未有的高度时,推理型大模型必将横空出世,并取而代之。


是的,GPT模型正在从一个“智能的模仿者”,逐步演化为一个具有推理和思考潜力的“新物种”。对话型大模型最后的王者GPT4.5,纵然博览群书,记忆力惊人,却始终无法摆脱模式识别的桎梏。就这样,一个旧时代在它的巅峰之际悄然画下句点,GPT-o3则以推理和思考为灵魂开启新的智慧纪元。因此,进化从不在于强大,而在于对世界更深刻的认知与理解。在此意义上,2024年推理型大模型的诞生,犹如30万年前拥有更为精妙的前额叶的智人的出现,将被铭记为新智慧时代的伟大开端。


在此,刘嘉教授提醒我们,GPT的T指的是Transformer,其最核心、最精妙之处就是“注意力机制”。它会对一段文本中的每个词语与其他所有词语之间的关系进行评估,计算出它们之间的关联强弱程度,实现高效而精准的信息处理。因此,学习的本质乃是注意力分配的艺术,真正与注意力门当户对的是高质量的数据集和人。


不过,正如刘教授所指出的那样,GPT在训练初期投喂的是维基百科、经典书籍、科研论文、优秀代码和高质量的互联网内容,奠定了其的认知基座;而人类却在持续沉迷于短视频等各种低质量内容,许多人长期沉浸在垃圾信息中将极大地增加“脑腐”风险。不难想见,在未来的AI时代中,高认知和低认知群体在各个方面的差距会进一步拉大。


在这个人类认知方式和知识战略深刻转型的时代,我们需要深刻认识AI带来的种种巨变。就知识的四种分类而言,“已知的已知”和“已知的未知”都已经或即将被AI占据,前者如AlphaGo(完胜人类围棋第一人),后者如药物设计与发现、气候变化和环境问题的精细建模、脑连接组与神经元活动的规律解码等等,但人类仍有“未知的已知”和“未知的未知”两个领域可以坚守和探索。


尽管AI可以复制、模仿甚至优化已有的知识和方法,但真正开辟新范式、新视野、新概念,却始终依赖于人类独特的感性体验、直觉判断与深刻的同理心。或许AI终究难以共情毕加索《格尔尼卡》中的深深恐惧,或舒伯特C大调弦乐五重奏中那种“遍历人世的纷繁情感”,难以理解康德在写下《实践理性批判》结论部分时内心庄严的敬畏之情,难以模仿牛顿由苹果落地而悟出万有引力的跨界联想,或凯库勒在梦境中解开苯环结构之谜的神奇顿悟。


因此,AI进入日常生活与工作,既是巨大的挑战,也是前所未有的契机。只有真正理解并拥抱这一趋势,以积极的姿态与AI共舞,重新审视教育的理念和目标,人类才能超越固有的认知边界,更深刻地重新定义和激发自身独特的认知优势,彰显生命与文明的意义。或许,这才是AI真正馈赠给人类的礼物。


博雅教育:回归与重构


窃以为,刘嘉教授对教育理念重构的思考,是本书中最有价值的部分。“基础教育中整齐划一的模式限制了学生的个性化发展和创造力培养,高等教育的专才培养让学生专而不广,难以融会多个学科的知识来开辟全新的领域。


所以,这样的教育模式与AGI时代所要求的培养‘颠覆性非共识创新’的人才目标背道而驰。”在刘教授看来,自十九世纪初以来这种专才培养模式就显露出种种弊端,而医治这种偏狭教育的良方乃是通识教育(general education),如果追根溯源的话,也就是2000多年前源自古希腊的“博雅教育”(liberal education)。如果直译的话,就是“自由人的教育”。


这一概念可以追溯到西方历史上第一位百科全书式的人物——亚里士多德,他在《政治学》中首次提出了“自由人知识”。在此,“自由”与“实用”相对立,乃是庄子所谓的“无用之用”,代表了非功利的、致力于人的精神与心灵自由发展的教育哲学与理想。对自由人的教育被称为“自由教育”,其所教育的内容是“一般和绝对知识”,即“通识”。


后来,亚氏的著名弟子柏拉图在《理想国》中,将通识界定为“七艺”,包含文法、修辞、辩证法、算术、几何、天文和音乐7个学科。跨学科的知识曰“博”,高尚的心灵曰“雅”。所谓“博雅教育”,就是让学生可以无拘无束,不设限制地思索让他们好奇的任何问题,从而使内心充盈,获得真正意义上的自由。


刘教授认为,面向AGI时代的教育变革,既要继承古希腊博雅教育注重广博知识和理性思辨的传统,也要融入现代科学技术和跨学科思维,强调教育思想性和实用性的平衡,并融入全球化和文化多样性的视角。


在此基础上,他提出了AGI时代应重点训练的五大能力,即研究、统计、逻辑、心理、修辞。其中,逻辑和修辞源自古希腊的博雅教育传统,前者是理性思维的核心,马斯克凭借第一性原理的逻辑规则,将制造火箭的成本压缩了90%;后者是演讲和辩论的核心技能,如比特币的成功,表面上是中心化的区块链技术创新引发的全球性金融革命,但其底层逻辑,乃是源自现代修辞术所实现的更为广泛的共识。另外三者,则是近代科学技术进步、人类文明发展的智慧结晶。


研究最重要的是提出问题的能力,正如OpenAI联合创始人、CEO萨姆·奥尔特曼所言:“就人的智力而言,未来不会像现在这样重要,AI可以弥补人的智力。在未来,提出正确的问题比找到答案的能力更重要。”而提出正确问题的能力,源于海量阅读和批判性思维的训练。同样地,培养统计能力也不只是针对大数据专业的学生,每个人每天在面对着海量的信息和数据,重要的是找出其中的关联和意义,否则就只是被数据的海洋所淹没。


在此,刘教授举了一个精彩的例子。著名的美国流媒体平台网飞公司(Netflix)根据手上掌握的3300万用户的观看习惯,通过对大数据进行统计分析,发现有相当数量喜欢看政治剧的人群,同时喜欢凯文·史派西和大卫·芬奇的电影,于是便有了二人合作的《纸牌屋》。首播期间,网飞在美国新增了约200万的订阅用户。


心理是最难磨炼的一种能力,有时阻止你登上自我实现巅峰的最大敌人不是别人,而是自己。当然,这需要全社会营造一种将非共识创新和自我实现作为伟大愿景的新文化生态。


其实,中国人从来不缺创造力,只是过去的“水稻文化”将创新视为不经济的策略罢了。而在AGI时代,人工智能倒逼各国加速创新步伐,中国也必将在这条创新赛道上全面发力。这就要求从“工具人”到“自由人”的人才培养范式的全面革新。教育的根本任务乃是培养终身学习的习惯和能力,对于每一个个体而言,一场通往全新智能时代的伟大征程已悄然开启,“遥远的事物将被震碎”,而面前的图景将逐渐清晰。

文章来源:http://www.jingmeijuzi.com/2025/1211/27.shtml